GLIGEN
G
GLIGEN
簡介 :
GLIGEN是一個開放式的基於文本提示的圖像生成模型,它可以基於文本描述和邊界框等限定條件生成圖像。該模型通過凍結預訓練好的文本到圖像Diffusion模型的參數,並在其中插入新的數據來實現。這種模塊化設計可以高效地進行訓練,並具有很強的推理靈活性。GLIGEN可以支持開放世界的有條件圖像生成,對新出現的概念和佈局也具有很強的泛化能力。
需求人群 :
["條件圖像生成","圖像編輯","圖像修復"]
總訪問量: 422
佔比最多地區: IN(74.48%)
本站瀏覽量 : 89.1K
使用場景
輸入文本描述“一隻大貓坐在椅子右邊”,以及貓的邊界框,生成貓的圖像
輸入汽車圖像作為樣式遷移條件,生成具有相似風格汽車的新圖像
利用圖像的語義分割圖作為條件,生成遵循語義圖的新圖像
產品特色
基於文本描述和邊界框生成圖像
支持計劃採樣,平衡生成質量和條件約束
支持基於圖像的樣式遷移生成
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase