

Cogview
Overview :
CogView是一個用於通用領域文本到圖像生成的預訓練Transformer模型。該模型包含410億參數,能夠生成高質量、多樣化的圖像。模型的訓練思路採用抽象到具體的方式,先 pretrain 獲得通用知識,然後 finetune 在特定域生成圖像,能顯著提升生成質量。值得一提的是,論文還提出了兩種幫助大模型穩定訓練的技巧:PB-relax 和 Sandwich-LN。
Target Users :
["文本描述到圖像生成","圖像超分辨率","語義理解"]
Use Cases
一個胖乎乎的貓坐在桌子上
一朵粉色的玫瑰花在陽光下盛開
藍色的天空中有一群白雲飄過
Features
輸入普通語言描述,生成匹配的圖像
支持中英文輸入
支持超分辨率提升生成圖像質量
支持後期篩選生成樣本
Featured AI Tools

Deepmind Gemini
Gemini是谷歌DeepMind推出的新一代人工智能系統。它能夠進行多模態推理,支持文本、圖像、視頻、音頻和代碼之間的無縫交互。Gemini在語言理解、推理、數學、編程等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、代碼生成等領域。
AI模型
11.4M
Chinese Picks

剪映dreamina
剪映Dreamina是抖音旗下的AIGC工具,用戶可以根據文本內容生成由AI生成的創意圖,支持修整圖片大小比例和模板類型。未來會用於抖音的圖文或短視頻的內容創作,豐富抖音在AI創造方面的內容庫。
AI圖像生成
9.1M