Consistory : 訓練無監督一致性文本到圖像生成

Consistory

AI圖像生成 AI模型 #圖像生成 #一致性 #深度學習 Standard Picks Open Source

Overview :

ConsiStory是一個無需訓練就能實現在預訓練的文本到圖像模型中生成一致性主體的方法。它不需要微調或個性化,因此比先前最優方法快20倍。我們通過引入以主體為驅動的共享注意力模塊和基於對應關係的特徵注入來增強模型,以促進圖像之間的主體一致性。另外,我們開發了在保持主體一致性的同時鼓勵佈局多樣性的策略。ConsiStory可以自然地擴展到多主體場景,甚至可以實現對常見對象的無需訓練的個性化。

Target Users :

可用於生成一系列關於某一主題的圖像,如商品圖片、角色形象等。

Total Visits： 0

Website Views ： 75.3K

Use Cases

生成一系列同一角色的圖像

生成一系列同一商品不同角度的圖片

生成一致的藝術作品系列

Features

生成一致的主體

Layout多樣性

多主體生成

無需訓練個性化

Traffic Sources

Direct Visits	0.00%	External Links	0.00%	Email	0.00%
Organic Search	0.00%	Social Media	0.00%	Display Ads	0.00%

Latest Traffic Situation

Monthly Visits	0
Average Visit Duration	0.00
Pages Per Visit	0.00
Bounce Rate	0

Total Traffic Trend Chart

Similar Open Source Products

Fastvlm

FastVLM 是一種高效的視覺編碼模型，專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器，減少了高分辨率圖像的編碼時間和輸出的 token 數量，使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力，適用於各種應用場景，尤其在需要快速響應的移動設備上表現優異。