

Whisperfusion
簡介 :
WhisperFusion是一款基於WhisperLive和WhisperSpeech功能的產品,通過在即時語音轉文字流程中集成Mistral大型語言模型(LLM)來實現與AI的無縫對話。Whisper和LLM均經過TensorRT引擎優化,以最大程度提升性能和即時處理能力。WhisperSpeech則使用torch.compile來優化。產品定位於提供超低延遲的AI即時對話體驗。
需求人群 :
用戶可以通過使用預構建的TensorRT-LLM Docker容器快速開始與WhisperFusion進行交互。同時,也可以構建適用於不同cuda架構的docker鏡像。
使用場景
1. 在網站上與WhisperFusion的AI進行即時對話
2. 通過WhisperFusion的小程序進行語音轉文字交互
3. 使用WhisperFusion插件在桌面客戶端上進行即時語音識別
產品特色
即時語音轉文字:利用OpenAI WhisperLive實現即時語音轉文字。
大型語言模型集成:整合Mistral大型語言模型,增強對轉錄文本的理解和語境。
TensorRT優化:LLM和Whisper均優化為TensorRT引擎,確保高性能和低延遲處理。
torch.compile:WhisperSpeech使用torch.compile來加速推斷,通過將PyTorch代碼即時編譯為優化內核,使PyTorch代碼運行更快。
精選AI產品推薦

Talk To Poe AI
Talk to Poe AI是一個插件,為Poe的所有AI,包括Sage、GPT-4和Claude+,提供了語音控制和朗讀功能。您可以使用語音與Poe的AI進行對話,並以多種語言聽取其回覆。該插件還可以將AI的回覆以清晰自然的語音讀出,支持多種語言。安裝簡便,無需鍵盤輸入,讓您更輕鬆地與AI交流。
AI語音助手
421.2K

Omnireader AI Powered Free Text To Speech
OmniReader是一款AI語音朗讀工具,可以輕鬆地將網頁、EPUB、PDF等內容朗讀出來。它使用逼真的AI聲音,提供多語言支持,並具備將PDF和EPUB轉換為音頻的功能。OmniReader還可以與AI互動,通過語音與Claude或chatGPT對話。
AI語音助手
382.3K