Cogview : Transformerベースの汎用ドメインテキストツーイメージ生成モデル

すべてのカテゴリ

Cogview

CogView

Cogview

AI画像生成 AIモデル #Transformer #テキストツーイメージ #生成モデル通常製品オープンソース

紹介 :

CogViewは、汎用ドメインのテキストから画像を生成するための事前学習済みTransformerモデルです。410億個のパラメータを含み、高品質で多様な画像を生成できます。モデルの学習アプローチは抽象的なものから具体的なものへと段階的に進めるもので、まず事前学習によって汎用的な知識を獲得し、その後、特定のドメインでファインチューニングを行い画像を生成することで、生成品質を大幅に向上させています。特筆すべき点として、論文では大規模モデルの安定した学習を支援する2つの手法、PB-relaxとSandwich-LNが提案されています。

ターゲットユーザー :

["テキストによる画像生成","画像超解像度処理","意味理解"]

総訪問数： 502.6M

最も高い割合の地域： US(19.34%)

ウェブサイト閲覧数： 62.7K

使用シナリオ

丸々とした猫がテーブルに座っている

ピンク色のバラが太陽の下で咲いている

青い空に白い雲が浮かんでいる

製品特徴

自然言語による記述を入力として、それに対応する画像を生成する

日本語と英語の入力をサポートする

超解像度処理による生成画像の品質向上をサポートする

生成されたサンプルの後処理による選別をサポートする

おすすめAI製品

DeepMind Gemini

Deepmind Gemini

Geminiは、Google DeepMindが開発した次世代人工知能システムです。テキスト、画像、ビデオ、音声、コード間のシームレスな相互作用をサポートし、マルチモーダル推論を実行できます。言語理解、推論、数学、プログラミングなど、複数の分野において従来のシステムを凌駕し、現在までに開発された最も強力なAIシステムの一つとなっています。エッジコンピューティングからクラウドコンピューティングまで、様々なニーズに対応できる3つの異なる規模のバージョンがあります。Geminiは、クリエイティブデザイン、ライティングアシスタント、質問応答、コード生成など、幅広い分野で活用できます。

中国語精選

剪映Dreamina

剪映DreaminaはTikTok（抖音）が提供するAIGCツールです。テキストを入力すると、AIが自動的にクリエイティブな画像を生成します。画像サイズやアスペクト比、テンプレートの種類も調整可能です。将来的には、TikTokの画像投稿やショート動画のコンテンツ制作にも活用され、TikTokのAIによるコンテンツ制作の充実を図ります。

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase