# 語音轉文本

parakeet-tdt-0.6b-v2
Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一個 600 百萬參數的自動語音識別(ASR)模型,旨在實現高質量的英語轉錄,具有準確的時間戳預測和自動標點符號、大小寫支持。該模型基於 FastConformer 架構,能夠高效地處理長達 24 分鐘的音頻片段,適合開發者、研究人員和各行業應用。
語音識別
51.1K
Orate
Orate
Orate 是一個強大的 AI 語音工具包,能夠將文本轉換為逼真的語音,也可以將語音轉換為文本,支持多種主流 AI 服務提供商。其主要優點是提供了一個統一的 API 接口,方便開發者快速集成和使用。該工具包適用於需要語音交互功能的應用開發,例如智能語音助手、語音播報系統等。其價格和具體定位尚未明確,但從其功能和社區反饋來看,具有較高的實用性和開發價值。
API服務
83.4K
國外精選
ElevenLabs Conversational AI
Elevenlabs Conversational AI
ElevenLabs Conversational AI是一款能夠快速部署在網頁、移動設備或電話上的語音代理產品。它以低延遲、全配置性和無縫擴展性為特點,支持自然對話中的輪流發言和打斷處理,適用於嘈雜環境中的不可預測對話。產品結合了語音轉文本、大型語言模型(LLM)和文本轉語音技術,支持多語言和自定義聲音,適用於客戶支持、調度、外呼銷售等多種場景。
聊天機器人
59.9K
優質新品
Audio Chat
Audio Chat
Audio Chat是一個專注於音頻文件處理的網站,它允許用戶上傳講座、會議或面試等音頻文件,並進行對話分析。該產品通過先進的音頻處理技術,幫助用戶快速獲取對話內容的要點,提高學習和工作效率。
語音識別
65.4K
優質新品
Speech to Note
Speech To Note
Speech to Note是一個AI驅動的語音識別工具,能夠即時將口語轉換為文本。它使用先進的語音轉文本技術,將您的語音轉換成可以編輯或分享的簡潔摘要。該產品由GPT-4技術支持,旨在提升生產力並釋放創造力。
語音轉文本
48.6K
Wavve AI
Wavve AI
Wavve AI利用先進的人工智能技術,包括OpenAI的Whisper等音頻模型,高效準確地轉錄、總結和處理您的錄音。它可以將語音筆記轉換為易讀的文本摘要,適用於製作會議記錄、備忘錄、電子郵件、文章等。Wavve AI還可以生成社交媒體帖子、會議紀要等內容,讓您無需費力編輯完美的文章。它支持多種語言,具有無縫集成、導出到各種格式、長篇編輯等功能。
語音轉文本
54.4K
ListenRobo
Listenrobo
ListenRobo是一個語音轉文本的工具,能夠將英語音頻轉換為文本,提供免費下載不帶水印的txt、srt和vtt格式字幕。它快速準確,支持92種語言,可以生成英語翻譯,還提供文本摘要和智能翻譯功能。
語音轉文本
80.6K
ToolBaz
Toolbaz
ToolBaz是一款免費的AI寫作工具,可以幫助用戶生成各種AI內容,包括故事、郵件、歌詞、圖片、語音等。它提供多種AI工具,能夠快速生成與人類寫作相似的內容,滿足用戶各種寫作需求。
寫作助手
74.2K
Chat GPT voice
Chat GPT Voice
通過多語言TTS文本轉語音和STT語音轉文本功能,使GPT聊天具備語音交互能力。
AI語音助手
76.2K
GoVoice
Govoice
GoVoice是一款利用先進人工智能技術進行語音轉文本和文本生成的工具,適用於個人創作者、小型企業和人手有限的團隊。用戶可以通過語音錄製內容,選擇生成的文本類型,然後在幾分鐘內獲得生成的文本,從而節省時間、提高效率。GoVoice還支持文本的再利用,讓用戶可以更好地利用現有內容,提高公司的SEO並確保寶貴信息不被浪費。通過GoVoice,用戶可以更快速、更輕鬆地創作內容,專注於核心業務,並且可以免費開始使用。
語音轉文本
65.4K
TikTok AI Script Generator & Voice to Text
Tiktok AI Script Generator & Voice To Text
TikTok AI腳本生成器是由ChatGPT開發的AI工具,革新了視頻創作流程。您可以根據當前視頻快速生成新的視頻腳本。省去了數小時的頭腦風暴和腳本編寫時間。AI腳本生成器可以根據您的視頻主題、時長和語氣創建符合您需求的原創腳本。這個腳本生成器的獨特之處在於它對TikTok的獨特要求有所瞭解,確保最大程度的參與和吸引力。AI生成的腳本從引人注目的開場白到引人入勝的行動號召,都會使您的視頻脫穎而出。
AI視頻生成
102.7K
Audio Writer
Audio Writer
Audio Writer將您的語音即時轉換為清晰、連貫的文字。不僅如此,我們還可以幫助您將思維轉化為各種格式的內容。支持多種語言轉錄,提供錯誤自動修正,可根據不同風格進行重寫,並可以導出不同格式的內容。作為您的最佳助手,適用於筆記記錄、內容創作、演講稿等場景。
語音轉文本
55.2K
Krater
Krater
Krater.ai 是一款全能的人工智能超級應用,集成了各種人工智能工具。無論是創作者還是寫手,還是任何追求效率和優化工作流程的人,都能從 Krater.ai 中獲益。輕鬆在點擊按鈕時生成所需的內容,無複雜性、純粹的人工智能力量。不再支付多個應用程序的費用,切換到一體化解決方案並節省大量費用。在我們的所有應用程序中生成 100% 無抄襲的內容,並通過一致的界面無縫切換應用程序,無縫流暢地進行工作。
AI設計工具
57.1K
Gladia
Gladia
Gladia I Speech-to-Text API 是一款基於先進的Whisper ASR技術的語音轉文本API,能夠將語音內容轉錄成文本,並提供翻譯和音頻智能分析的增值功能。它可用於虛擬會議、工作協作、內容製作和呼叫中心等多個場景。該API具有出色的轉錄準確性和可靠性,同時提供多語種翻譯和音頻智能分析功能,幫助用戶更高效地處理語音內容。定價靈活透明,支持開發者根據需求選擇適合的套餐。Gladia I Speech-to-Text API致力於為開發者提供強大的語音處理能力,助力他們構建創新的語音應用。
API服務
62.1K
Transcriptmate.com
Transcriptmate.com
Transcriptmate是一個在線音頻轉文本的服務。它可以將長達3小時的錄音文件轉換成文本文件,並在2小時內通過電子郵件發送給您。轉換結果可以以csv、srt、txt等多種格式保存。Transcriptmate支持多種語言,無需訂閱或承諾,安全支付。推薦的價格為6美元/文件。
語音轉文本
54.6K
Auphonic
Auphonic
Auphonic 是一款全能的音頻後期製作網絡工具,可實現專業品質的音頻處理。它具有智能平衡器、降噪、消除混響、自動剪輯、多軌處理、音量標準化、語音轉文本等功能。無需專業知識,輕鬆達到專業水準。Auphonic 適用於廣播、播客、電影、音頻視頻等領域。
音頻生成
244.0K
BFF AI
BFF AI
BFF AI是您可信賴的人工智能助手,提供全面、準確、周到的回答。無論您需要回答問題、轉錄語音還是激發創造力,BFF AI都能助您一臂之力。立即嘗試!
聊天機器人
51.1K
GetLogit
Getlogit
GetLogit是一個人工智能平臺,為用戶提供智能寫作助手、AI圖像生成器、12個聊天機器人專家、語音轉文本、AI語音合成、AI代碼生成器等功能。用戶可以使用智能寫作助手快速生成優秀文本,利用AI圖像生成器創建精美圖片和圖形,與12個專家聊天機器人進行交流,將語音轉錄為文本,利用AI語音合成將文字轉為語音錄音,以及快速生成高質量的編程代碼等。
AI信息平臺
64.9K
Speech Studio
Speech Studio
Azure AI Speech Studio是一個語音服務平臺,提供語音轉文本、文本轉語音等功能。它可以幫助應用實現語音聆聽、理解和交流的能力。Speech Studio提供了多種語音功能,包括語音轉文本、即時語音轉文本、批處理語音轉文本、自定義語音識別、語音翻譯、文本轉語音等。用戶可以根據自己的需求選擇合適的功能,並通過示例代碼快速上手。Speech Studio還提供了學習資源,包括文檔、快速入門指南、Microsoft 問答和Microsoft Learn等。
開發與工具
120.9K
國外精選
Deepgram
Deepgram
Deepgram是一款強大的語音轉文本API,提供準確、高速、成本低廉的語音識別服務。它還提供特定領域的語言模型,可滿足企業級需求。開發者可以放心使用Deepgram構建應用,提高開發速度。
語音轉文本
182.4K
MaximusAI
Maximusai
MaximusAI是一款集成AI驅動內容生成的終極平臺。解鎖人工智能的力量,輕鬆創建引人入勝的內容。通過MaximusAI,將您的內容創作提升到一個新的水平。立即使用AI創新賦予您的品牌力量。
寫作助手
43.1K
TypeAce
Typeace
TypeAce 是一款集成了 OpenAI 的先進 GPT 模型的智能助手鍵盤應用。它可以幫助用戶在各種應用中提高效率,輕鬆完成各種任務,包括撰寫郵件、翻譯文本等。用戶可以自定義常用提示,使用剪貼板文本作為上下文,以及快速查看歷史記錄。TypeAce 將改變您使用手機的方式,讓您的數字任務更加輕鬆愉快。
AI寫作助手
44.7K
I IMAGINE
I IMAGINE
IIMAGINE是一個集成了多種AI工具的平臺。它提供AI文本生成、AI圖像生成、AI代碼生成、AI聊天機器人、文本轉語音、語音轉文本等功能。您可以用它來寫文章、總結、發送電子郵件、創作、製作視頻腳本等。它還可以幫助您在市場營銷、寫作、人際關係、求職、健康等方面獲得創意和解決問題的思路。定價請查看官網。
AI信息平臺
61.3K
Live Transcribe: Voice to text
Live Transcribe: Voice To Text
即時轉寫是一款能夠即時將語音轉為文本的應用程序,通過 iPhone 即可輕鬆進行語音記錄。
AI語音轉文本
59.1K
VemoAI
Vemoai
Vemo AI是一款將語音轉換為文本的工具。用戶可以通過錄音,快速將語音內容轉化為清晰的文本,並可根據需要進行編輯和格式調整。適用於頭腦風暴、內容創作、日記記錄、採訪、會議記錄、教育筆記等多種場景。
語音轉文本
46.1K
Texthub AI
Texthub AI
Texthub AI是一個革命性的解決方案,利用人工智能生成代碼、文本和圖片。告別繁重的手工工作,讓我們的人工智能為您提供幫助。立即嘗試Texthub AI,體驗人工智能的力量!
AI設計工具
112.3K
AIEasyUse
Aieasyuse
AIEasyUse - OpenAI 內容與圖像生成器讓使用人工智能進行日常任務變得簡單易用。我們提供易於使用的工具,可用於創建內容、生成圖像、與聊天機器人進行交流、獲取代碼創建輔助以及將語音轉換為文本。無論您是需要撰寫內容、生成圖像、與聊天機器人交流還是進行代碼創建,我們都能滿足您的需求。
AI設計工具
45.5K
AudioPen
Audiopen
AudioPen將非結構化的語音筆記轉換為易讀且可分享的文本。如果你喜歡大聲思考,你會喜歡AudioPen。它就像有個個人助理記錄和總結你的想法。
語音轉文本
126.1K
Hearbitz
Hearbitz
hearbitz是一款AI驅動的新聞摘要應用,通過人工智能技術對新聞、文章和博客進行摘要和過濾,提供多語言的新聞摘要和文本轉語音功能。用戶可以通過hearbitz獲取最新的新聞摘要,並可以根據個人喜好進行個性化定製。hearbitz提供流暢的聽覺體驗,讓用戶在短時間內瞭解全球最新動態。產品定價詳細信息請參考官方網站。
新聞助手
54.4K
AI generating - Ultimate AI Generator
AI Generating Ultimate AI Generator
AI Generating是一個綜合平臺,可以立即生成高質量的內容,無需費力。它提供AI文本、圖像、代碼、聊天等多種生成功能。擁有先進的儀表板,提供有價值的洞察、分析和活動追蹤。支持多語言,並提供大量預定義模板和支持。適用於數字機構、產品設計師、企業家、文案撰寫人員、數字營銷人員和開發人員等多個領域。
AI信息平臺
49.4K
精選AI產品推薦
中文精選
騰訊混元圖像 2.0
騰訊混元圖像 2.0
騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型,顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構,使得圖像生成速度可達到毫秒級,避免了傳統生成的等待時間。同時,模型通過強化學習算法與人類美學知識的結合,提升了圖像的真實感和細節表現,適合設計師、創作者等專業用戶使用。
圖片生成
80.6K
國外精選
Lovart
Lovart
Lovart 是一款革命性的 AI 設計代理,能夠將創意提示轉化為藝術作品,支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程,節省時間並提升創意靈感。Lovart 當前處於測試階段,用戶可加入等候名單,隨時體驗設計的樂趣。
AI設計工具
63.8K
FastVLM
Fastvlm
FastVLM 是一種高效的視覺編碼模型,專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器,減少了高分辨率圖像的編碼時間和輸出的 token 數量,使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力,適用於各種應用場景,尤其在需要快速響應的移動設備上表現優異。
AI模型
51.1K
KeySync
Keysync
KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題,同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果,適用於自動配音等實際應用場景。
視頻編輯
48.3K
Manus
Manus
Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品,能夠直接交付完整的任務成果,而不僅僅是提供建議或答案。它採用 Multiple Agent 架構,運行在獨立虛擬機中,能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現,展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’,幫助用戶高效完成各種複雜任務。
個人助理
1.5M
Trae國內版
Trae國內版
Trae是一款專為中文開發場景設計的AI原生IDE,將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能,顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白,滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具,旨在為專業開發者提供強大的技術支持,目前尚未明確公開價格,但預計會採用付費模式以匹配其高端定位。
開發與工具
137.7K
國外精選
Pika
Pika
Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。
視頻生成
18.7M
中文精選
LiblibAI
Liblibai
LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。
AI模型
8.0M
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase