CogView
C
Cogview
簡介 :
CogView是一個用於通用領域文本到圖像生成的預訓練Transformer模型。該模型包含410億參數,能夠生成高質量、多樣化的圖像。模型的訓練思路採用抽象到具體的方式,先 pretrain 獲得通用知識,然後 finetune 在特定域生成圖像,能顯著提升生成質量。值得一提的是,論文還提出了兩種幫助大模型穩定訓練的技巧:PB-relax 和 Sandwich-LN。
需求人群 :
["文本描述到圖像生成","圖像超分辨率","語義理解"]
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 64.6K
使用場景
一個胖乎乎的貓坐在桌子上
一朵粉色的玫瑰花在陽光下盛開
藍色的天空中有一群白雲飄過
產品特色
輸入普通語言描述,生成匹配的圖像
支持中英文輸入
支持超分辨率提升生成圖像質量
支持後期篩選生成樣本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase