

Whisperfusion
紹介 :
WhisperFusionは、WhisperLiveとWhisperSpeechの機能をベースとした製品です。リアルタイムの音声テキスト化プロセスにMistral大規模言語モデル(LLM)を統合することで、AIとのシームレスな会話を実現します。WhisperとLLMはどちらもTensorRTエンジンで最適化され、パフォーマンスとリアルタイム処理能力を最大限に高めています。WhisperSpeechはtorch.compileを使用して最適化されています。超低遅延のAIリアルタイム会話体験を提供することを目指しています。
ターゲットユーザー :
事前に構築されたTensorRT-LLM Dockerコンテナを使用することで、WhisperFusionとのインタラクションを迅速に開始できます。また、さまざまなCUDAアーキテクチャに対応したDockerイメージを構築することも可能です。
使用シナリオ
1. ウェブサイトでWhisperFusionのAIとリアルタイム会話を行う
2. WhisperFusionのミニプログラムで音声テキスト化インタラクションを行う
3. WhisperFusionプラグインを使用してデスクトップクライアントでリアルタイム音声認識を行う
製品特徴
リアルタイム音声テキスト化:OpenAI WhisperLiveを利用してリアルタイムの音声テキスト化を行います。
大規模言語モデル統合:Mistral大規模言語モデルを統合し、転写テキストの理解とコンテキストを強化します。
TensorRT最適化:LLMとWhisperはどちらもTensorRTエンジンで最適化され、高性能と低遅延処理を保証します。
torch.compile:WhisperSpeechはtorch.compileを使用して推論を高速化します。PyTorchコードを最適化されたカーネルに即時コンパイルすることで、PyTorchコードの実行速度を向上させます。
おすすめAI製品

Poe AIと会話
Poe AIと会話は、Sage、GPT-4、Claude+を含むPoeのすべてのAIに対し、音声制御と朗読機能を提供するプラグインです。音声を使ってPoeのAIと会話し、様々な言語で回答を聞くことができます。また、AIの回答をクリアで自然な音声で朗読し、これも複数の言語に対応しています。簡単にインストールでき、キーボード入力は不要です。AIとのコミュニケーションをよりスムーズにします。
AI音声アシスタント
398.5K

Omnireader AI搭載無料テキスト読み上げ
OmniReaderは、ウェブサイト、EPUB、PDFなどのコンテンツを簡単に音声で読み上げることができるAI音声読み上げツールです。自然なAI音声を使用し、多言語に対応しており、PDFやEPUBを音声ファイルに変換する機能も備えています。さらに、ClaudeやChatGPTなどのAIと音声で対話することも可能です。
AI音声アシスタント
354.9K