
Funasr
FunASR是一款語音離線文件轉寫服務軟件包,集成了語音端點檢測、語音識別、標點等模型,能夠將長音頻與視頻轉換成帶標點的文字,並支持多路請求同時轉寫。它支持ITN與用戶自定義熱詞,服務端集成有ffmpeg,支持多種音視頻格式輸入,並提供多種編程語言客戶端,適用於需要高效、準確語音轉寫服務的企業和開發者。
AI語音轉文本
67.1K

Asrtools
AsrTools是一款基於人工智能技術的語音轉文字工具,它通過調用大廠的ASR服務接口,實現了無需GPU和複雜配置的高效語音識別功能。該工具支持批量處理和多線程併發,能夠快速將音頻文件轉換成SRT或TXT格式的字幕文件。AsrTools的用戶界面基於PyQt5和qfluentwidgets,提供高顏值且易於操作的交互體驗。它的主要優點包括調用大廠接口的穩定性、無需複雜配置的便捷性、以及多格式輸出的靈活性。AsrTools適合需要快速將語音內容轉換成文字的用戶,特別是在視頻製作、音頻編輯和字幕生成等領域。目前,AsrTools提供免費使用大廠ASR服務的模式,對於個人和小團隊來說,可以顯著降低成本並提高工作效率。
AI語音轉文本
110.1K

園丁提詞器
園丁提詞器是一款專為直播、演講、教學等場景設計的桌面提詞器應用。它通過智能語音識別技術,即時感知用戶語速,智能調節文本滾動速度,確保提詞與表達同步。產品融合尖端AI技術,提供文案優化、全渠道提取文案、無水印視頻下載、違禁詞檢測、文案配音等功能,顯著提升文本創作效率。園丁提詞器支持多窗口同步播放,滿足多樣展示需求,所有窗口均可置頂,避免遮擋,實現真正的隱形提詞。產品背景信息顯示,園丁提詞器歷經萬場直播考驗,穩定耐用,團隊持續創新,穩定迭代,提供卓越服務。
AI語音轉文本
62.4K

Kaption AI
Kaption AI是一款Chrome瀏覽器插件,它利用人工智能技術將WhatsApp上的音頻消息轉換成文字,並提供消息摘要和回覆建議。這款插件重視用戶隱私和安全性,採用先進的AI技術實現準確的轉錄和總結。它特別適合那些經常使用WhatsApp且難以聽取長音頻消息的用戶,幫助他們節省時間,只關注重要的信息。
AI語音轉文本
46.4K
國外精選

Rev AI
Rev AI提供高精度的語音轉錄服務,支持58種以上語言,能夠將視頻和語音應用中的語音轉換為文本。它通過使用世界上最多樣化的聲音集合進行訓練,為視頻和語音應用設定了準確性標準。Rev AI還提供即時流媒體轉錄、人類轉錄、語言識別、情感分析、主題提取、總結和翻譯等服務。Rev AI的技術優勢在於低詞錯誤率、對性別和種族口音的最小偏見、支持更多語言以及提供最易讀的轉錄文本。此外,它還符合世界頂級的安全標準,包括SOC II、HIPAA、GDPR和PCI合規性。
AI語音轉文本
62.7K

Youtube Whisper
Youtube-Whisper是一個基於Gradio的應用程序,它通過提取YouTube視頻的音頻並使用OpenAI的Whisper模型來轉錄成文本。這個工具對於需要將視頻內容轉化為文本以進行分析、存檔或翻譯的用戶來說非常有用。它利用了最新的人工智能技術,提高了視頻內容的可訪問性和可用性。
AI語音轉文本
59.1K
優質新品

Babelfish.ai
babelfish.ai 是一個基於瀏覽器的即時語音轉文字和翻譯應用。它利用 Huggingface Transformer.js 和 Supabase Realtime 技術,實現了本地化的即時語音識別和多語言翻譯功能。該應用支持將語音即時轉換為文本,並能將文本翻譯成200種語言,極大地提高了跨語言溝通的效率和便捷性。
AI語音轉文本
50.0K

West
WeST是一個開源的語音識別轉錄模型,以300行代碼的簡潔形式,基於大型語言模型(LLM)實現語音到文本的轉換。它由一個大型語言模型、一個語音編碼器和一個投影器組成,其中僅投影器部分可訓練。WeST的開發靈感來源於SLAM-ASR和LLaMA 3.1,旨在通過簡化的代碼實現高效的語音識別功能。
AI語音轉文本
48.6K

Atrain
aTrain是由格拉茨大學商業分析與數據科學中心的研究人員開發,並由格拉茨知識中心的研究人員測試的一款離線語音轉錄工具。它利用最新的機器學習模型,無需上傳任何數據即可自動轉錄語音錄音。aTrain在《行為與實驗金融學雜誌》上發表的論文中被介紹,如果用於研究,請引用該論文。它支持Windows 10和11系統,用戶可以通過Microsoft應用商店或BANDAS中心網站下載安裝。對於Linux系統,提供了Wiki上的安裝指南。aTrain的主要優點包括無需上傳數據的隱私保護、高質量的轉錄質量、以及在本地計算機上的快速處理速度。
AI語音轉文本
59.6K
中文精選

視頻提取文字工具
AIbase視頻提取文字工具是一個利用人工智能和機器學習技術,為用戶提供快速、準確的視頻文字轉錄服務。它優化了文字排版,使得轉錄內容易於理解且忠實於原視頻。作為一項基礎服務,該工具完全免費,無需安裝、下載或付費訂閱,極大地方便了創意人員的視頻內容處理工作。
AI語音轉文本
215.8K
中文精選

音頻提取文字工具
AIbase音頻提取文字工具利用人工智能技術,通過機器學習模型快速生成高質量的音頻文本描述,優化文本排版,提升可讀性,同時完全免費使用,無需安裝、下載或付款,為創意人員提供便捷的基礎服務。
AI語音轉文本
74.8K

Voice Pen
Voice Pen是一款利用人工智能技術將語音轉換為文字的應用程序,它支持超過50種語言,使用OpenAI的Whisper技術提供完美的轉錄和標點。用戶可以使用Voice Pen記錄語音,生成筆記、摘要、電子郵件、消息、博客帖子等。此外,它還具備AI重寫功能,幫助用戶清晰地組織文本、總結、製作列表、創建博客/帖子/推文、Instagram標題和電子郵件。Voice Pen注重用戶隱私,不收集任何錄音或文本數據。
AI語音轉文本
61.3K

Transkriptor Transcribe Audio To Text
Transkriptor是一款將音頻轉換為文本的瀏覽器插件。它使用先進的人工智能技術,可以自動記錄和轉錄會議、訪談和講座等不同類型的語音內容。Transkriptor具有簡單直觀的界面,支持多種文件格式,提供安全的轉錄服務,並具備生成字幕、支持多語言轉錄和遠程協作編輯等功能。
AI語音轉文本
103.8K

Summify Summarize Speech
Summify - Summarize speech是一款移動應用程序,可以讓您輕鬆記錄和總結任何演講,從大學講座或學校課堂到人工智能商務會議!它利用 OpenAI 的 Whisper AI 模型和 ChatGPT 的強大功能,以儘可能高的準確性轉錄文本並進行總結,捕捉每一個重要細節。Summify可以幫助您提高生產力,集中注意力,在家修改演講內容,並保護您的隱私。
AI語音轉文本
58.5K

Whisper Memo Dictation
使用先進的人工智能技術,將語音備忘錄轉錄為文字。該應用能夠輕鬆處理大型音頻錄音並生成準確的轉錄。支持離線轉錄,所有數據在設備上進行處理。免費功能包括:輕鬆錄製和轉錄音頻文件、無需互聯網進行轉錄、所有數據在設備上處理、即時獲取轉錄結果、自動檢測語言、支持 5 個轉錄結果,界面簡單易用,支持後臺錄製和分享轉錄結果至郵件和其他應用。Pro 功能包括無限次轉錄結果生成。立即下載!
AI語音轉文本
48.9K

Voicerec
VoiceRec 是一款集語音錄製、轉文字識別與共享於一體的人工智能語音應用。支持語音轉文字、精準識別、支持多國語言、支持導出多種格式。
AI語音轉文本
59.6K

Transcribe
Transcribe ~ Speech to Text是一個語音轉文字的iOS應用程序。它利用OpenAI的Whisper技術和Apple的神經引擎,實現語音文件的高精度識別,可將音頻和視頻文件直接轉錄成可閱讀的文本。支持離線識別和雲端識別兩種模式。適用於各類語音轉文字的需求,使用簡單方便。
AI語音轉文本
84.2K

Whisper Notes
Whisper Notes 是一款準確的語音轉文字工具,使用 OpenAI 的 Whisper 模型。無需網絡連接,用戶數據不會上傳,支持 80 多種語言。可以用於記筆記、快速發送消息等。
AI語音轉文本
216.9K

Textscan AI
TextScan AI是一款免費的移動應用程序,可以從圖像中輕鬆轉換文本並與AI聊天,讓您告別手動輸入,享受更快速、更準確的聊天體驗。它提供了智能的消息功能,讓您與AI聊天更加便捷。TextScan AI是一款智能、高效的聊天工具,讓您的聊天更加智能、高效。
AI語音轉文本
48.6K

Transcribeai
TranscribeAI是一款革命性的Mac應用程序,旨在輕鬆將音頻文件轉錄為文本。採用最先進的人工智能技術,該應用程序提供了無與倫比的準確性和速度,節省了您寶貴的時間和精力。無論您是記者、研究人員、內容創作者還是需要定期轉錄音頻的人,TranscribeAI都是您的完美工具。
AI語音轉文本
78.4K

Vnsplit
VNSplit是一款AI語音筆記摘要工具,可以在幾秒鐘內為您提供強大而詳細的語音筆記摘要。通過AI發送語音筆記摘要,擺脫在iMessage和Whatsapp上聽語音筆記的一切繁瑣。只需訂閱任何計劃並提供您的iMessage或Whatsapp號碼給Stripe,您將收到AI機器人的消息。將來的消息轉發到該號碼即可。
AI語音轉文本
52.2K

Speechless
Speechless 是一款基於 OpenAI 的 Whisper API 的終極應用,提供無縫的音頻轉錄和翻譯功能。通過 Speechless,您可以輕鬆導入音頻並即時獲取準確的轉錄。通過即時翻譯打破語言障礙,輕鬆分享您的轉錄內容,實現無與倫比的連接和溝通。Speechless 支持 WhatsApp、語音備忘錄等應用,讓您輕鬆轉錄或翻譯音頻。
AI語音轉文本
47.7K

Wisprnote
WisprNote 是一款智能語音轉文字工具,支持將語音備忘錄、音頻和視頻文件轉錄為純文本。它擁有極高的準確性和轉錄速度,同時保證了隱私安全。適用於會議記錄、訪談轉錄、學習筆記等場景。
AI語音轉文本
57.1K

Alog
ALog是一個通過智能語音轉文字和AI技術,幫助用戶記錄生活點滴的創新日記應用。具有語音錄入日記、智能轉錄文本、情感分析、生活數據統計等功能,讓用戶隨時隨地記錄生活。適用於希望通過語音形式記錄生活的用戶。
AI語音轉文本
64.3K

Live Transcribe: Voice To Text
即時轉寫是一款能夠即時將語音轉為文本的應用程序,通過 iPhone 即可輕鬆進行語音記錄。
AI語音轉文本
59.1K

Call Recorder & Transcriber
這是一個可在蘋果和安卓手機上錄製電話通話的應用程序。它使用IVR技術以最佳質量錄製通話,還能使用機器學習和人工智能技術將錄音轉錄成可閱讀的文本文檔,包括語音分離、時間碼等。主要功能有:高質量錄製通話;可轉錄通話生成文本文件;可通過郵件分享錄音和文本文件;購買額外時長;沒有廣告,不需要訂閱。
AI語音轉文本
41.7K

Free AI Voice: Best Text To Speech Tool
免費AI語音是一款Chrome瀏覽器插件,利用文本轉語音(TTS)技術將網頁文章轉換成語音,並支持40多種語言。適用於各種網站,包括新聞網站、博客、粉絲作品、出版物、教材、學校和課堂網站,以及在線大學課程材料。免費AI語音可以選擇多種TTS聲音,包括瀏覽器提供的聲音。一些雲端聲音可能需要額外的應用內購買才能激活。免費AI語音適用於那些喜歡聽內容而不是閱讀的人,患有閱讀障礙或其他學習障礙的人,以及正在學習閱讀的兒童。
AI語音轉文本
166.7K

Naturalreader AI Text To Speech
NaturalReader - AI Text to Speech 是一款Chrome插件,能夠將在線文本轉換成自然流暢的音頻。只需點擊播放,就可以讓您的電子郵件、網頁、PDF文件、Google文檔和Kindle圖書朗讀給您聽!通過使用我們的語音閱讀器,用戶可以節省時間,以比閱讀更快的速度聽取文本,並在無法閱讀的時間提高工作效率,例如通勤、遛狗或做飯!免費版本功能豐富,還有兩個付費高級套餐可供選擇,適合各種預算。
AI語音轉文本
87.2K

Naturalreader
NaturalReader是一款全球領先的文本轉語音解決方案。它提供個人、商業和教育用途的文字轉語音功能,可以將文本內容自動轉換為自然流暢的語音。其優勢包括多語種支持、高質量音色、自定義語速和音調、多平臺適用等。定價方案包括個人、教育和商業計劃,滿足不同用戶需求。
AI語音轉文本
50.0K

Speech To Text & Transcribe
Speech to Text & Transcribe是一款實用工具,能夠將口述的話語轉換為書面文字,便於轉錄錄音。藉助開放式人工智能技術的進展,這類應用變得更加準確高效,甚至能夠輕鬆轉錄低語的話語。
語音轉文字的主要優勢之一是能夠將音頻錄音轉換為文字。這對於記者、研究人員以及需要記錄會議、採訪或其他活動的人來說特別有用。該應用使用音頻轉換器讀取音頻文件並將其轉換為文字,然後可以根據需要進行編輯和共享。
除了轉錄語音錄音,語音轉文字應用還可以用於口述,允許您直接在應用程序中說話並即時將其轉錄為文字。這個功能對於那些寫作困難的人或需要快速高效地創建文本文檔的人尤其有用。
總的來說,語音轉文字應用是一種有價值的工具,可以節省時間並提高工作效率,使轉錄語音錄音和創建重要事件的書面記錄變得更加容易。隨著開放式人工智能技術的進步,這些應用變得更加準確可靠,成為那些需要定期處理音頻錄音的人的必備工具。
AI語音轉文本
45.8K
- 1
- 2
精選AI產品推薦
中文精選

騰訊混元圖像 2.0
騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型,顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構,使得圖像生成速度可達到毫秒級,避免了傳統生成的等待時間。同時,模型通過強化學習算法與人類美學知識的結合,提升了圖像的真實感和細節表現,適合設計師、創作者等專業用戶使用。
圖片生成
80.6K
國外精選

Lovart
Lovart 是一款革命性的 AI 設計代理,能夠將創意提示轉化為藝術作品,支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程,節省時間並提升創意靈感。Lovart 當前處於測試階段,用戶可加入等候名單,隨時體驗設計的樂趣。
AI設計工具
63.8K

Fastvlm
FastVLM 是一種高效的視覺編碼模型,專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器,減少了高分辨率圖像的編碼時間和輸出的 token 數量,使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力,適用於各種應用場景,尤其在需要快速響應的移動設備上表現優異。
AI模型
51.1K

Keysync
KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題,同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果,適用於自動配音等實際應用場景。
視頻編輯
48.3K

Manus
Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品,能夠直接交付完整的任務成果,而不僅僅是提供建議或答案。它採用 Multiple Agent 架構,運行在獨立虛擬機中,能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現,展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’,幫助用戶高效完成各種複雜任務。
個人助理
1.5M

Trae國內版
Trae是一款專為中文開發場景設計的AI原生IDE,將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能,顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白,滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具,旨在為專業開發者提供強大的技術支持,目前尚未明確公開價格,但預計會採用付費模式以匹配其高端定位。
開發與工具
137.7K
國外精選

Pika
Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。
視頻生成
18.7M
中文精選

Liblibai
LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。
AI模型
8.0M