MGIE
M
MGIE
簡介 :
MGIE(多模態大語言模型引導的編輯)是一項由蘋果開源的技術,利用多模態大型語言模型(MLLMs)生成圖像編輯指令,通過端到端訓練,捕捉視覺想象力並執行圖像處理操作,使圖像編輯更加智能、直觀。
需求人群 :
用戶可以通過自然語言直觀地描述圖像編輯需求,如改變顏色、調整大小等,無需複雜的描述或區域掩碼,使圖像編輯更加自由和輕鬆。
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 98.8K
使用場景
通過指令 '提亮圖像' 實現圖像編輯
使用 '加冷色調' 指令調整圖像顏色
嘗試 '添加模糊效果' 自然語言編輯
產品特色
通過自然語言指令編輯圖像
改變顏色、調整大小、添加特效等
端到端訓練捕捉視覺想象力
簡化圖像編輯流程
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase