

GLIGEN
紹介 :
GLIGENは、テキストプロンプトに基づいたオープンソースの画像生成モデルです。テキスト記述やバウンディングボックスなどの制約条件に基づいて画像を生成できます。このモデルは、事前学習済みのテキストから画像への拡散モデルのパラメータを固定し、そこに新しいデータを追加することで実現されています。このモジュール式設計により、効率的なトレーニングと高い推論柔軟性が得られます。GLIGENは、オープンワールドにおける条件付き画像生成をサポートし、新しく出現する概念やレイアウトに対しても高い汎化能力を備えています。
ターゲットユーザー :
["条件付き画像生成","画像編集","画像修復"]
使用シナリオ
「椅子右側に座っている大きな猫」というテキスト記述と猫のバウンディングボックスを入力し、猫の画像を生成する
自動車の画像をスタイル転移条件として入力し、同様のスタイルを持つ新しい自動車画像を生成する
画像のセマンティックセグメンテーションマップを条件として利用し、セマンティックマップに従った新しい画像を生成する
製品特徴
テキスト記述とバウンディングボックスに基づいた画像生成
計画サンプリングのサポート(生成品質と条件制約のバランスをとる)
画像ベースのスタイル転移による生成のサポート
おすすめAI製品

Deepmind Gemini
Geminiは、Google DeepMindが開発した次世代人工知能システムです。テキスト、画像、ビデオ、音声、コード間のシームレスな相互作用をサポートし、マルチモーダル推論を実行できます。言語理解、推論、数学、プログラミングなど、複数の分野において従来のシステムを凌駕し、現在までに開発された最も強力なAIシステムの一つとなっています。エッジコンピューティングからクラウドコンピューティングまで、様々なニーズに対応できる3つの異なる規模のバージョンがあります。Geminiは、クリエイティブデザイン、ライティングアシスタント、質問応答、コード生成など、幅広い分野で活用できます。
AIモデル
11.4M
中国語精選

剪映dreamina
剪映DreaminaはTikTok(抖音)が提供するAIGCツールです。テキストを入力すると、AIが自動的にクリエイティブな画像を生成します。画像サイズやアスペクト比、テンプレートの種類も調整可能です。将来的には、TikTokの画像投稿やショート動画のコンテンツ制作にも活用され、TikTokのAIによるコンテンツ制作の充実を図ります。
AI画像生成
9.0M