CogView
C
Cogview
简介 :
CogView是一个用于通用领域文本到图像生成的预训练Transformer模型。该模型包含410亿参数,能够生成高质量、多样化的图像。模型的训练思路采用抽象到具体的方式,先 pretrain 获得通用知识,然后 finetune 在特定域生成图像,能显著提升生成质量。值得一提的是,论文还提出了两种帮助大模型稳定训练的技巧:PB-relax 和 Sandwich-LN。
需求人群 :
["文本描述到图像生成","图像超分辨率","语义理解"]
总访问量: 474.6M
占比最多地区: US(19.34%)
本站浏览量 : 65.7K
使用场景
一个胖乎乎的猫坐在桌子上
一朵粉色的玫瑰花在阳光下盛开
蓝色的天空中有一群白云飘过
产品特色
输入普通语言描述,生成匹配的图像
支持中英文输入
支持超分辨率提升生成图像质量
支持后期筛选生成样本
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase