CogView
C
Cogview
紹介 :
CogViewは、汎用ドメインのテキストから画像を生成するための事前学習済みTransformerモデルです。410億個のパラメータを含み、高品質で多様な画像を生成できます。モデルの学習アプローチは抽象的なものから具体的なものへと段階的に進めるもので、まず事前学習によって汎用的な知識を獲得し、その後、特定のドメインでファインチューニングを行い画像を生成することで、生成品質を大幅に向上させています。特筆すべき点として、論文では大規模モデルの安定した学習を支援する2つの手法、PB-relaxとSandwich-LNが提案されています。
ターゲットユーザー :
["テキストによる画像生成","画像超解像度処理","意味理解"]
総訪問数: 502.6M
最も高い割合の地域: US(19.34%)
ウェブサイト閲覧数 : 62.7K
使用シナリオ
丸々とした猫がテーブルに座っている
ピンク色のバラが太陽の下で咲いている
青い空に白い雲が浮かんでいる
製品特徴
自然言語による記述を入力として、それに対応する画像を生成する
日本語と英語の入力をサポートする
超解像度処理による生成画像の品質向上をサポートする
生成されたサンプルの後処理による選別をサポートする
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase