

Consistory
Overview :
ConsiStory是一個無需訓練就能實現在預訓練的文本到圖像模型中生成一致性主體的方法。它不需要微調或個性化,因此比先前最優方法快20倍。我們通過引入以主體為驅動的共享注意力模塊和基於對應關係的特徵注入來增強模型,以促進圖像之間的主體一致性。另外,我們開發了在保持主體一致性的同時鼓勵佈局多樣性的策略。ConsiStory可以自然地擴展到多主體場景,甚至可以實現對常見對象的無需訓練的個性化。
Target Users :
可用於生成一系列關於某一主題的圖像,如商品圖片、角色形象等。
Use Cases
生成一系列同一角色的圖像
生成一系列同一商品不同角度的圖片
生成一致的藝術作品系列
Features
生成一致的主體
Layout多樣性
多主體生成
無需訓練個性化
Featured AI Tools

Deepmind Gemini
Gemini是谷歌DeepMind推出的新一代人工智能系統。它能夠進行多模態推理,支持文本、圖像、視頻、音頻和代碼之間的無縫交互。Gemini在語言理解、推理、數學、編程等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、代碼生成等領域。
AI模型
11.4M
Chinese Picks

剪映dreamina
剪映Dreamina是抖音旗下的AIGC工具,用戶可以根據文本內容生成由AI生成的創意圖,支持修整圖片大小比例和模板類型。未來會用於抖音的圖文或短視頻的內容創作,豐富抖音在AI創造方面的內容庫。
AI圖像生成
9.1M