PIXART LCM : 快速可控的圖像生成與潛在一致性模型

PIXART LCM

AI圖像生成 AI模型 #圖像生成 #潛在一致性模型 #ControlNet #高質量圖像 #開源模型普通產品開源

簡介 :

PIXART LCM是一個文本到圖像合成框架，將潛在一致性模型（LCM）和ControlNet集成到先進的PIXART-α模型中。PIXART LCM以其能夠通過高效的訓練過程生成1024px分辨率的高質量圖像而聞名。在PIXART-δ中集成LCM顯著加快了推理速度，使得僅需2-4步即可生成高質量圖像。特別值得注意的是，PIXART-δ實現了在0.5秒內生成1024x1024像素圖像的突破，比PIXART-α改進了7倍。此外，PIXART-δ經過精心設計，可在單日內在32GB V100GPU上進行高效訓練。具有8位推理能力的PIXART-δ可以在8GB GPU內存約束下合成1024px圖像，極大地增強了其可用性和可訪問性。此外，引入類似於ControlNet的模塊可以對文本到圖像擴散模型進行精細控制。我們引入了一種新穎的ControlNet-Transformer架構，專門為Transformers量身定製，實現了顯式可控性和高質量圖像生成。作為一種最先進的開源圖像生成模型，PIXART-δ為穩定擴散模型家族提供了一個有前途的選擇，為文本到圖像合成做出了重大貢獻。

需求人群 :

用於文本到圖像合成，特別適用於需要快速生成高質量圖像的場景。

總訪問量： 29.7M

佔比最多地區： US(17.94%)

本站瀏覽量： 48.3K

使用場景

用於生成藝術圖像的在線圖像合成平臺

用於電子商務網站的自動生成產品圖片

用於科學研究中生成實驗數據可視化圖像

產品特色

集成潛在一致性模型（LCM）和ControlNet

高質量圖像生成