Cogview : 基于Transformer的通用领域文本到图像生成

Cogview

AI图像生成 AI模型 #Transformer #文本到图像 #生成模型普通产品开源

简介 :

CogView是一个用于通用领域文本到图像生成的预训练Transformer模型。该模型包含410亿参数,能够生成高质量、多样化的图像。模型的训练思路采用抽象到具体的方式,先 pretrain 获得通用知识,然后 finetune 在特定域生成图像,能显著提升生成质量。值得一提的是,论文还提出了两种帮助大模型稳定训练的技巧:PB-relax 和 Sandwich-LN。

需求人群 :

["文本描述到图像生成","图像超分辨率","语义理解"]

总访问量： 474.6M

占比最多地区： US(19.34%)

本站浏览量： 65.7K

使用场景

一个胖乎乎的猫坐在桌子上

一朵粉色的玫瑰花在阳光下盛开

蓝色的天空中有一群白云飘过

产品特色

输入普通语言描述,生成匹配的图像

支持中英文输入

支持超分辨率提升生成图像质量

支持后期筛选生成样本

流量来源

直接访问	51.61%	外链引荐	33.46%	邮件	0.04%
自然搜索	12.58%	社交媒体	2.19%	展示广告	0.11%

同类开源产品

Deepseek R1 0528

DeepSeek R1-0528 是知名开源大模型平台 DeepSeek 发布的最新版本，具有高性能的自然语言处理和编程能力。它的发布引起了广泛关注，因其在编程任务中表现出色，能够准确回答复杂问题。该模型支持多种应用场景，是开发者和 AI 研究者的重要工具。预计后续将发布更详细的模型信息和使用指南，增强其功能和应用广度。

月访问量	4.92m
平均访问时长	393.01
每次访问页数	6.11
跳出率	36.20%

月访问量	4.92m
美国	19.34%
中国	13.25%
印度	9.32%
俄罗斯	4.28%
德国	3.63%