LlamaGen
L
Llamagen
簡介 :
LlamaGen是一個新的圖像生成模型家族,它將大型語言模型的原始下一個token預測範式應用於視覺生成領域。該模型通過適當的擴展,無需對視覺信號的歸納偏差即可實現最先進的圖像生成性能。LlamaGen重新審視了圖像分詞器的設計空間、圖像生成模型的可擴展性屬性以及它們的訓練數據質量。
需求人群 :
LlamaGen的目標受眾是圖像生成領域的研究人員和開發者,特別是那些對利用自迴歸模型進行高質量圖像合成感興趣的人。它適合需要生成高質量圖像的AI藝術家、遊戲開發者、電影製作者以及任何需要圖像生成技術的行業。
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 72.6K
使用場景
使用LlamaGen生成特定風格的藝術作品。
在遊戲開發中,使用LlamaGen快速生成遊戲內環境和角色的圖像。
電影製作中,利用LlamaGen創建逼真的背景和場景。
產品特色
提供兩種圖像分詞器,下采樣比率分別為16和8。
發佈七個類條件生成模型,參數從100M到3B不等。
提供兩個文本條件生成模型,參數為700M。
支持在線演示,運行預訓練模型。
支持LLM服務框架,可實現300% - 400%的速度提升。
類條件圖像生成在ImageNet上的應用。
文本條件圖像生成,使用LAION COCO數據集和內部數據。
使用教程
訪問LlamaGen的GitHub頁面並克隆或下載代碼。
閱讀並遵循GETTING_STARTED.md文件中的安裝指南。
下載預訓練模型並將其放置在指定的文件夾中。
運行提供的腳本以生成圖像,查看生成結果。
根據需要調整參數和設置以優化生成的圖像。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase