GLIGEN : 開放式基於提示的圖像生成

GLIGEN

簡介 :

GLIGEN是一個開放式的基於文本提示的圖像生成模型,它可以基於文本描述和邊界框等限定條件生成圖像。該模型通過凍結預訓練好的文本到圖像Diffusion模型的參數,並在其中插入新的數據來實現。這種模塊化設計可以高效地進行訓練,並具有很強的推理靈活性。GLIGEN可以支持開放世界的有條件圖像生成,對新出現的概念和佈局也具有很強的泛化能力。

需求人群 :

["條件圖像生成","圖像編輯","圖像修復"]

總訪問量： 422

佔比最多地區： IN(74.48%)

本站瀏覽量： 89.1K

使用場景

輸入文本描述“一隻大貓坐在椅子右邊”,以及貓的邊界框,生成貓的圖像

輸入汽車圖像作為樣式遷移條件,生成具有相似風格汽車的新圖像

利用圖像的語義分割圖作為條件,生成遵循語義圖的新圖像

產品特色

基於文本描述和邊界框生成圖像

支持計劃採樣,平衡生成質量和條件約束