Llamagen : 自迴歸模型在可擴展圖像生成領域的新突破

Llamagen

簡介 :

LlamaGen是一個新的圖像生成模型家族，它將大型語言模型的原始下一個token預測範式應用於視覺生成領域。該模型通過適當的擴展，無需對視覺信號的歸納偏差即可實現最先進的圖像生成性能。LlamaGen重新審視了圖像分詞器的設計空間、圖像生成模型的可擴展性屬性以及它們的訓練數據質量。

需求人群 :

LlamaGen的目標受眾是圖像生成領域的研究人員和開發者，特別是那些對利用自迴歸模型進行高質量圖像合成感興趣的人。它適合需要生成高質量圖像的AI藝術家、遊戲開發者、電影製作者以及任何需要圖像生成技術的行業。

總訪問量： 474.6M

佔比最多地區： US(19.34%)

本站瀏覽量： 72.6K

使用場景

使用LlamaGen生成特定風格的藝術作品。

在遊戲開發中，使用LlamaGen快速生成遊戲內環境和角色的圖像。

電影製作中，利用LlamaGen創建逼真的背景和場景。

產品特色

提供兩種圖像分詞器，下采樣比率分別為16和8。

發佈七個類條件生成模型，參數從100M到3B不等。

提供兩個文本條件生成模型，參數為700M。

支持在線演示，運行預訓練模型。

支持LLM服務框架，可實現300% - 400%的速度提升。

類條件圖像生成在ImageNet上的應用。

文本條件圖像生成，使用LAION COCO數據集和內部數據。

使用教程

訪問LlamaGen的GitHub頁面並克隆或下載代碼。

閱讀並遵循GETTING_STARTED.md文件中的安裝指南。

下載預訓練模型並將其放置在指定的文件夾中。

運行提供的腳本以生成圖像，查看生成結果。

根據需要調整參數和設置以優化生成的圖像。

精選AI產品推薦

智啟未來，您的人工智能解決方案智庫

直接訪問	51.61%	外鏈引薦	33.46%	郵件	0.04%
自然搜索	12.58%	社交媒體	2.19%	展示廣告	0.11%