

Stable Audio Open デモ
紹介 :
Stable Audio Open は、テキストプロンプトから最長47秒のステレオオーディオを生成できる技術です。主な3つのコンポーネントから構成されています。波形を管理可能なシーケンス長に圧縮するオートエンコーダー、テキスト条件付けのためのT5ベースのテキスト埋め込み、そしてオートエンコーダーの潜在空間で動作する変換ベースの拡散(DiT)モデルです。本技術はオーディオ生成において優れた性能を発揮し、ドラム、エレクトロニックミュージック、自然音など、テキストプロンプトに基づいて様々な種類のオーディオを生成できます。
ターゲットユーザー :
音楽プロデューサー、オーディオデザイナー、クリエイターは、Stable Audio Openを使用して様々なスタイルの音楽やサウンドエフェクトを生成し、創作ニーズを満たすことができます。
使用シナリオ
80年代スタイルのドラムビートの生成
特定の雰囲気を持つエレクトロニックミュージックの作成
雨音や汽笛などの自然音のシミュレーション
製品特徴
最長47秒のステレオオーディオ生成
44.1kHzのサンプリングレートに対応
オートエンコーダーによる波形圧縮
T5ベースのテキスト埋め込み技術
変換ベースの拡散モデル(DiT)
コミュニティで作成されたオーディオサンプルの提供
オーディオメモリ分析によるオリジナル性の確保
使用チュートリアル
1. Stable Audio Openウェブサイトにアクセスする
2. テキストプロンプトを選択する(例:「80年代のドラムビート」)
3. システムがテキストプロンプトに基づいて対応するオーディオを生成する
4. 生成されたオーディオをプレビューする
5. 必要に応じてテキストプロンプトを調整し、異なるオーディオを生成する
6. コミュニティで作成されたオーディオサンプルを参照してインスピレーションを得る
7. オーディオメモリ分析で生成されたオーディオのオリジナル性を確認する
おすすめAI製品
中国語精選

天工skymusic
昆侖万維の「天工3.0」超大規模言語モデルを基盤として開発されたAI音楽生成大規模言語モデル「天工SkyMusic」。高品質なAI音楽生成、音声合成、歌詞セクション制御、多様な音楽スタイルと音楽的表現機能などをサポートします。現在、無料招待テストを実施しており、ユーザーの音楽創作と感情表現を支援します。
AI音楽生成
998.6K

TME Studio
TME Studioは、音楽愛好家のための創作ツールです。楽曲分離、MIR計算、作詞支援、スマート楽譜作成などの機能を搭載しています。ユーザーは任意の楽曲をアップロードし、ボーカルと楽器の音声を分離して、音楽内容の理解と分析を行い、様々な音楽情報を抽出できます。また、作詞ツールも提供しており、適切な韻を踏んだ言葉を見つけることで、創作のインスピレーションを刺激します。さらに、音楽をアップロードするだけで、スマートギター楽譜を作成し、自分が弾きたい曲を簡単に演奏することもできます。音楽創作アシスタントが、音楽愛好家の音楽創作をより簡単に支援します。
AI音楽生成
689.2K