# 語音

Orate
Orate
Orate 是一個強大的 AI 語音工具包,能夠將文本轉換為逼真的語音,也可以將語音轉換為文本,支持多種主流 AI 服務提供商。其主要優點是提供了一個統一的 API 接口,方便開發者快速集成和使用。該工具包適用於需要語音交互功能的應用開發,例如智能語音助手、語音播報系統等。其價格和具體定位尚未明確,但從其功能和社區反饋來看,具有較高的實用性和開發價值。
API服務
83.4K
優質新品
MiniCPM-o
Minicpm O
MiniCPM-o 2.6 是OpenBMB團隊開發的最新多模態大型語言模型(MLLM),具有8B參數,能夠在手機等端側設備上實現高質量的視覺、語音和多模態直播功能。該模型基於SigLip-400M、Whisper-medium-300M、ChatTTS-200M和Qwen2.5-7B構建,採用端到端的方式訓練,性能與GPT-4o-202405相當。其主要優點包括領先的視覺能力、先進的語音能力、強大的多模態直播能力、強大的OCR能力以及優越的效率。該模型免費開源,適用於學術研究和商業用途。
AI模型
69.3K
Outspeed
Outspeed
Outspeed是一個為構建快速、即時語音和視頻AI應用提供網絡和推理基礎設施的平臺。它由Google和MIT的工程師開發,旨在為即時AI應用提供直觀且強大的工具,無論是構建下一個大型應用還是擴展現有解決方案,Outspeed都能幫助用戶更快、更有信心地進行創新。
開發與工具
80.9K
優質新品
Daily Bots
Daily Bots
Daily Bots是一個開源雲平臺,專注於提供超低延遲的語音和視頻人工智能服務。它支持開發者構建和託管即時的全球基礎設施上的代理,並利用快速增長的開源即時框架。該平臺擁有全球即時雲,提供5億終端用戶的13毫秒首跳延遲,符合SOC 2、HIPAA和GDPR標準。此外,Daily Bots提供了電話和工作流程的一站式企業連接解決方案,以及完整的PSTN和SIP堆棧。
開發與工具
64.3K
優質新品
Pipecat
Pipecat
Pipecat是一個開源框架,用於構建語音和多模態對話代理,如個人教練、會議助手、兒童故事玩具、客戶支持機器人、接待流程和機智的社交伴侶。它支持本地運行,並可遷移到雲端,集成了多種AI服務和傳輸方式,具有高度的可定製性和擴展性。
聊天機器人
108.2K
easywithai.com
Easywithai.com
Easy With AI是一個擁有互聯網上最大的AI工具和資源收藏的平臺。您可以在50多個不同的類別中查找和搜索AI工具。Easy With AI為各種用戶提供了便利和豐富的AI工具資源,包括AI寫作助手、社交媒體工具、電子郵件工具、AI內容檢測工具、客戶服務工具、網站建設工具、電子商務工具、圖像工具、音頻工具、視頻工具、音樂生成器、視頻生成器、播客工具、演示製作工具、設計工具、直播工具、聊天機器人、語音工具、移動應用、轉錄工具、會議助手、建築工具、生產力工具、教育工具、AI Chrome擴展和更多。您可以根據您的需求和興趣,在Easy With AI上找到適合您的AI工具。
AI信息平臺
114.8K
Ad Auris
Ad Auris
Ad Auris是一款能夠將文章轉換為語音並播放的應用。用戶可以隨時隨地聽取自己感興趣的文章內容,同時支持保存到平臺如Spotify。該應用定位於提升用戶的閱讀效率和便利性,使用戶能夠在忙碌的生活中享受閱讀的樂趣。
文本轉聲音
62.9K
SpeechGPT
Speechgpt
SpeechGPT是一種多模態語言模型,具有內在的跨模態對話能力。它能夠感知並生成多模態內容,遵循多模態人類指令。SpeechGPT-Gen是一種擴展了信息鏈的語音生成模型。SpeechAgents是一種具有多模態多代理系統的人類溝通模擬。SpeechTokenizer是一種統一的語音標記器,適用於語音語言模型。這些模型和數據集的發佈日期和相關信息均可在官方網站上找到。
AI語音合成
107.4K
Merlin API Platform
Merlin API Platform
Merlin提供統一的API和SDK,用於將LLM/LLVM快速集成到生產應用中。性能高、可靠、易於使用。它可以在5分鐘內將Google的Gemini SDK集成進去。提供20多個AI模型,無需管理多個API密鑰,沒有速率限制,也不必擔心記憶窗口或記號計算。所有模型都遵循OpenAI API結構,誤差率比OpenAI低10倍,零宕機時間。
AI開發助手
69.8K
Talk to GPT
Talk To GPT
Talk to GPT是一個Chrome插件,使用語音與ChatGPT進行交流。它通過分析你的語音,將你說的話轉錄成文字,併發送給ChatGPT。ChatGPT能夠以100多種語言回答你的問題。插件還支持自動校正和語言水平選擇。定價請查看官方網站。
AI語音助手
105.4K
narrator
Narrator
narrator是一款Python應用,通過使用OpenAI和ElevenLabs的API,能夠讓David Attenborough來為您的生活進行解說。用戶需要設置相關的API密鑰和語音ID,並運行webcam捕捉和narrator兩個Python腳本即可。
AI語音合成
50.2K
Personal Voice
Personal Voice
Personal Voice 是一款定製個人化語音體驗的工具。它允許用戶通過提供一個 1 分鐘的語音樣本來複制自己的聲音,並生成支持 100 種語言的語音輸出。用戶可以在語音助手、遊戲、媒體娛樂等場景中使用個人化語音,實現更加沉浸式和情感化的體驗。
AI語音合成
194.6K
AI VoiceOver
AI VoiceOver
登錄後可以使用AI語音解說你的視頻,限制100MB。可以選擇不同的語音。 價格:免費 定位:視頻語音解說工具
視頻編輯
423.7K
ZeroBot
Zerobot
ZeroBot是互聯網上最好的語音聊天機器人。想象一下與一個像真人一樣與你交談的計算機朋友進行對話。與ZeroBot一起,不僅僅是打字 - 還可以說話!準備好以全新的方式聊天吧。 主要功能點: - 在任何時間、任何地點創建和與AI代理人交談 - 提供導師、諮詢師、夥伴和醫生等不同角色 ZeroBot在媒體上的影響
聊天機器人
435.3K
Airchat
Airchat
Airchat 是一款能夠提供有意義對話的應用。它結合了語音和 Twitter 的特點,讓你隨時隨地加入、參與、享受或旁聽精彩的聚會對話。不再感到孤單,與新朋友和老朋友連接在一起,與志同道合的人一起暢談。它是現代社交咖啡館,可以變得如此寬廣或如此狹小。
AI聊天機器人
69.8K
SALMONN
SALMONN
SALMONN是由清華大學電子工程系和字節跳動開發的大型語言模型(LLM),支持語音、音頻事件和音樂輸入。與僅支持語音或音頻事件輸入的模型不同,SALMONN可以感知和理解各種音頻輸入,從而獲得多語言語音識別和翻譯以及音頻-語音共推理等新興能力。這可以被視為給予LLM“聽覺”和認知聽覺能力,使SALMONN成為通向具有聽覺能力的人工通用智能的一步。
AI語音識別
89.4K
Radio Starlight
Radio Starlight
Radio Starlight 是一款個性化語音電臺應用。它可以根據你的喜好自動生成電臺節目,包括新聞播報和音樂推薦,就像有個私人DJ和新聞播報員。你可以設定電臺主播的語音風格,還可以使用 DALL-E 2 為節目製作封面和主播頭像。無論你在家還是外出,都可以隨時隨地收聽屬於你的個性電臺節目。
個人助理
51.1K
Speaking AI
Speaking AI
Speaking AI是一款使用先進的大語言模型技術實現的文本到語音轉換工具,能夠以自然的情感進行對話並實現零樣本語音克隆。它可以捕捉你獨特的音調、音高和調節,讓你以前所未有的方式複製和利用自己的聲音。Speaking AI通過先進的技術實現了聲音克隆的突破,讓語音克隆聽起來更加自然。使用Speaking AI,你可以通過錄制自己的聲音,在短短10秒鐘內進行克隆。我們致力於將最先進的AI技術用於推動人類進步,特別是在促進語音克隆技術的發展和應用方面。
語音克隆
14.0M
LMNT
LMNT
語音創作是一款能夠創造感情豐富、人類般的語音和定製化聲音的產品。它能夠激發創造力,讓用戶通過語音表達自己的情感和想法。我們提供多種定製化的聲音選擇,讓用戶能夠創造出獨特的聲音作品。語音創作具有簡單易用的界面和豐富的功能,定價靈活合理,適合各種用戶需求。
語音克隆
48.6K
Suno AI
Suno AI
Suno AI是一款通過人工智能創作音樂和語音的產品。它利用先進的算法和數據模型,能夠生成高質量的音樂和語音作品。Suno AI具有以下功能和優勢:1. 創作多種風格的音樂,包括流行、古典、電子等;2. 生成自然流暢的語音,可用於語音合成、配音等場景;3. 提供豐富的音樂和語音效果,可根據用戶需求進行定製;4. 界面簡潔友好,操作簡單易上手;5. 支持多種輸出格式,方便用戶在不同平臺上使用。Suno AI的定價根據用戶的使用情況而定,詳情請訪問官方網站。
AI音樂生成
3.6M
AI Torke
AI Torke
AITorke是一款虛擬助手,內容創作者和影響者可以使用它來創建博客、視頻和社交媒體上的獨特內容,更快地吸引更多的關注者並利用現有關係獲得收益。AITorke使用最先進的人工智能技術,包括100個預構建模板、AI語音、AI圖像、AI代碼等功能,可幫助用戶節省時間和精力。
寫作助手
55.8K
GPTChat
Gptchat
GPTChatBot是一款連接ChatGPT的Android應用,可通過語音和Whatsapp分享與之交流。它是你的個人AI聊天機器人助手,能幫助你完成日常任務,回答問題並提供娛樂。使用GPTChatBot,你可以即時獲得問題的智能回答,與家人和朋友保持聯繫,獲得日常任務的幫助,甚至玩遊戲。該應用具有簡單易用和無縫體驗的特點。
AI聊天機器人
64.3K
Langchats
Langchats
Langchats是一個AI語言夥伴,通過自然對話幫助您學習語言。通過Langchats,您可以隨時隨地與AI對話,提高語言流利度。Langchats支持30多種語言,包括阿拉伯語、英語、法語、日語等。Langchats提供翻譯、語音回應、糾正、建議等功能,幫助您迅速提升語言能力。Langchats可以節省費用和時間,讓您更快地掌握一門語言。
聊天機器人
65.7K
國外精選
FineShare FineVoice
Fineshare FineVoice
FineShare FineVoice是一款AI數字語音解決方案,具備強大且易於使用的實時語音變聲器、高質量錄音機、快速準確的自動轉錄和逼真的AI語音生成器。它基於AI語音處理算法,可以輕鬆地優化和定製您的聲音。
AI語音助手
67.9K
精選AI產品推薦
中文精選
騰訊混元圖像 2.0
騰訊混元圖像 2.0
騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型,顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構,使得圖像生成速度可達到毫秒級,避免了傳統生成的等待時間。同時,模型通過強化學習算法與人類美學知識的結合,提升了圖像的真實感和細節表現,適合設計師、創作者等專業用戶使用。
圖片生成
82.2K
國外精選
Lovart
Lovart
Lovart 是一款革命性的 AI 設計代理,能夠將創意提示轉化為藝術作品,支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程,節省時間並提升創意靈感。Lovart 當前處於測試階段,用戶可加入等候名單,隨時體驗設計的樂趣。
AI設計工具
64.9K
FastVLM
Fastvlm
FastVLM 是一種高效的視覺編碼模型,專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器,減少了高分辨率圖像的編碼時間和輸出的 token 數量,使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力,適用於各種應用場景,尤其在需要快速響應的移動設備上表現優異。
AI模型
51.6K
KeySync
Keysync
KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題,同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果,適用於自動配音等實際應用場景。
視頻編輯
49.4K
Manus
Manus
Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品,能夠直接交付完整的任務成果,而不僅僅是提供建議或答案。它採用 Multiple Agent 架構,運行在獨立虛擬機中,能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現,展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’,幫助用戶高效完成各種複雜任務。
個人助理
1.5M
Trae國內版
Trae國內版
Trae是一款專為中文開發場景設計的AI原生IDE,將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能,顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白,滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具,旨在為專業開發者提供強大的技術支持,目前尚未明確公開價格,但預計會採用付費模式以匹配其高端定位。
開發與工具
139.1K
國外精選
Pika
Pika
Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。
視頻生成
18.7M
中文精選
LiblibAI
Liblibai
LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。
AI模型
8.0M
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase