# 音頻

ASMR AI
ASMR AI
ASMR AI是首個具有真實雙耳音頻的AI ASMR視頻生成器,通過Google Veo 3提供文本到ASMR和圖像到ASMR內容生成。具有放鬆、助眠和緩解壓力的功能。
視頻生成
38.4K
Veozon AI Video Generator
Veozon AI Video Generator
Veo3 AI視頻生成器是一款強大的工具,使用Google的Veo3 AI模型,從文本生成令人驚歎的4K視頻。具有先進的物理模擬和逼真的視覺效果,為您的創意轉化成電影般的內容。價格:付費。
視頻生成
42.5K
Morse Code Translator
Morse Code Translator
摩爾斯電碼翻譯器是一個用於將文本翻譯為摩爾斯電碼及將摩爾斯電碼翻譯迴文本的在線工具。通過聽音頻和觀看光信號,用戶可以輕鬆進行翻譯操作,並可以下載WAV文件。摩爾斯電碼翻譯器提供了多種摩爾斯電碼系統,適用於不同語言的翻譯需求。
翻譯
38.9K
Maidio
Maidio
Maidio 是一款創新的音頻內容應用,通過 AI 技術將 RSS 新聞自動轉換為生動的對話式播客。它利用先進的自然語言處理技術,將新聞內容以主持人與助手的對話形式呈現,使用戶能夠以更有趣的方式獲取信息。該應用支持多種個性化功能,如創建主題電臺、智能優先級排序等,適合喜歡通過音頻獲取新聞的用戶。它支持多平臺使用,包括 iPhone、iPad、Mac 等,且完全免費。
語音轉文本
72.6K
麥悠電臺
麥悠電臺
麥悠電臺是一款利用AI技術實現新聞播報的APP。它通過智能算法將文字新聞轉換為生動的對話形式,讓用戶在聽新聞時有更自然、更有趣的體驗。該產品的主要優點是個性化和智能化,用戶可以根據自己的興趣創建多個主題電臺,APP會自動對新聞進行重要性分級。此外,它還支持本地和雲端兩種語音合成方式,以及音頻導出功能,方便用戶將生成的節目作為播客發佈。麥悠電臺由Fangtangjun (Chongqing) Technology Co., Ltd.開發,是一款免費的教育類APP,適合對新聞和AI技術感興趣的用戶。
語音轉文本
64.3K
國外精選
Hailuo
Hailuo
Hailuo AI是一個智能AI助手,提供聊天、視頻和音頻等多種交互方式,能夠輕鬆處理長文本上下文,幫助用戶解決問題。它以強大的自然語言處理技術和友好的用戶體驗為特點,旨在為用戶提供高效、智能的解決方案。產品定位為面向廣大用戶的通用AI助手,價格策略未明確說明。
個人助理
67.3K
中文精選
PodRedit
Podredit
PodRedit是一個播客分享平臺,用戶可以在這裡發現和收聽各種熱門播客節目。該平臺彙集了眾多優質的播客內容,覆蓋了兩性雜談、文化、商業等多個領域,為用戶提供了一個便捷的播客收聽和分享渠道。PodRedit登錄後支持批量識別字幕。PodRedit以其豐富的內容和便捷的用戶體驗,滿足了用戶對於高質量音頻內容的需求,成為了播客愛好者的重要聚集地。
其他分類
55.5K
國外精選
PodSnap.AI
Podsnap.ai
PodSnap.AI是一個利用尖端AI技術,為用戶提供播客摘要的服務。用戶可以通過訂閱,將播客的AI生成摘要直接發送到他們的郵箱。這項服務幫助用戶節省時間,快速獲取播客中的關鍵信息,特別適合忙碌的專業人士和學習者。產品由擁有15年以上技術行業經驗的企業家Dr. Rok Strniša創建,他曾在劍橋大學獲得計算機科學博士學位,並在Citrix、Winton和Improbable等知名公司擔任重要職位。
AI信息平臺
69.3K
Journi
Journi
Journi將您的智能手機變成個人導遊,提供由當地人講述的沉浸式音頻導遊。通過交互式地圖,以當地專家的聲音將必看景點帶到生活中。利用AI技術,Journi個性化您的旅程,提供獨特定製的推薦和見解,使每次探索都成為一次專為您定製的冒險。Journi讓您自由地探索城市,體驗城市的脈搏,從古老的地標到隱藏的寶藏。
旅行
50.0K
easywithai.com
Easywithai.com
Easy With AI是一個擁有互聯網上最大的AI工具和資源收藏的平臺。您可以在50多個不同的類別中查找和搜索AI工具。Easy With AI為各種用戶提供了便利和豐富的AI工具資源,包括AI寫作助手、社交媒體工具、電子郵件工具、AI內容檢測工具、客戶服務工具、網站建設工具、電子商務工具、圖像工具、音頻工具、視頻工具、音樂生成器、視頻生成器、播客工具、演示製作工具、設計工具、直播工具、聊天機器人、語音工具、移動應用、轉錄工具、會議助手、建築工具、生產力工具、教育工具、AI Chrome擴展和更多。您可以根據您的需求和興趣,在Easy With AI上找到適合您的AI工具。
AI信息平臺
114.3K
Butter Reader
Butter Reader
ButterReader是一款創新的音頻插件,將博客文本轉化為引人入勝的音頻內容,使學習和信息消費更加順暢。通過定製播放器,您可以輕鬆地將文字內容轉化為精彩的音頻體驗。產品具有設計靈活性、聲音選擇、控制設置等功能,適用於各種使用場景。ButterReader可以讓用戶在移動設備上無縫播放音頻內容,讓用戶在多任務處理中也能欣賞內容。
文本轉聲音
52.4K
Konch
Konch
Konch是一款出色的自動轉錄平臺,支持30多種語言。它使用先進的AI技術,快速準確地將音頻或視頻文件轉錄成文本。用戶可以選擇完全由AI生成的轉錄結果,或選擇人工審核和修正。Konch還支持將YouTube視頻轉換為文本,並提供高級編輯功能、多語言翻譯、靈活的文本格式導出等特點。用戶可以在不同場景下使用Konch,如轉錄音頻或視頻、研究轉錄、數字檔案、播客轉錄等。
語音轉文本
50.2K
FreGrad
Fregrad
FreGrad是一款輕量快速的頻率感知擴散聲碼器,旨在生成逼真的音頻。其框架包括離散小波變換、頻率感知擴張卷積和一系列增強模型生成質量的技巧。在實驗中,FreGrad相比基準模型,訓練速度提升3.7倍,推理速度提升2.2倍,同時模型大小減少0.6倍(僅178萬參數),而不犧牲輸出質量。
AI音頻編輯
51.1K
Unified-IO 2
Unified IO 2
Unified-IO 2是一個統一的多模態生成模型,能夠理解和生成圖像、文本、音頻和動作。它使用單個編碼器-解碼器Transformer模型,將不同模式(圖像、文本、音頻、動作等)的輸入和輸出都表示為一個共享的語義空間進行處理。該模型從頭開始在大規模的多模態預訓練語料上進行訓練,使用了多模態的去噪目標進行優化。為了學會廣泛的技能,該模型還在120個現有數據集上進行微調,這些數據集包含提示和數據增強。Unified-IO 2在GRIT基準測試中達到了最先進的性能,在30多個基準測試中都取得了強勁的結果,包括圖像生成和理解、文本理解、視頻和音頻理解以及機器人操作。
AI模型
69.3K
Jellypod
Jellypod
Jellypod+是一款將您的電子郵件訂閱轉化為個人播客的應用程序。它以音頻為主要形式,為您忙碌的生活方式生成您每日新聞的簡明摘要。Jellypod+的目標是打破傳統媒體的“一刀切”模式,為您量身定製新聞,符合您獨特的興趣愛好。該應用程序還包括內置的電子郵件閱讀器和簡報轉發功能,讓您可以在不離開應用的情況下查看簡報的詳情,並自動將入站簡報轉發到您的個人收件箱。此外,Jellypod+還提供可調節的播放速度、多種不同的播音員選擇、離線模式、定製播客生成計劃、多個每日播客主題組織、無廣告體驗以及注重隱私的郵箱地址保護等功能。
個人助理
48.6K
Huddles
Huddles
Huddles是一種新的、輕量級的音頻或視頻連接方式,它能讓您隨時隨地進行隨意對話或深度協作會議。您可以在Slack中創建和參與Huddles,與團隊成員通過音頻或視頻進行即時交流,共享屏幕和文檔,提高工作效率。Huddles不僅適用於非正式的討論,還可以用於解決問題、腦力激盪、合作編寫文檔等場景。Huddles支持多人參與,可滿足團隊的不同需求。
AI會議助手
48.6K
Read
Read
Read是一個新聞音頻生成平臺。它可以自動蒐集用戶感興趣的內容,生成個性化的每日音頻新聞簡報,幫助用戶高效獲取所需信息。該產品擁有人工智能生成的自然語音功能,支持郵件訂閱,提供個性化推薦,功能強大。適合需要每日瞭解所關心事件和新聞的用戶。
新聞助手
65.1K
GlossAi
Glossai
GlossAi是一款全流程視頻和音頻內容再利用工具,可將長篇內容轉化為適用於各種社交媒體平臺的短視頻片段,提高用戶參與度,降低成本,節省時間。同時,它還能生成多渠道的數字和有機營銷活動。
視頻編輯
47.2K
Emastered
Emastered
eMastered是由葛萊美獎得主工程師打造的在線音頻母帶處理工具。它使用人工智能技術,快速、簡單地提升音頻質量。用戶可以上傳音軌並自動應用專業的EQ、壓縮等處理,獲得高質量的音頻母帶。eMastered提供免費試用和付費訂閱兩種方式,適用於音樂製作人、製作公司等各類用戶。
音樂生成
374.5K
Jamit.app
Jamit.app
Jamit是全球首個Podcast 3.0平臺,提供分佈式託管、全球覆蓋、互動獎勵和獨特NFT體驗等功能。用戶可以在Jamit上發現和聆聽不同領域的故事,創建並發展自己的社區,並享受作為Jamit創作者和所有者的獨立性。
社交媒體服務
45.3K
33 字幕
33 字幕
33 字幕是一款精準的 AI 視頻字幕識別和字幕翻譯軟件。它可以將音頻、視頻轉換成文本或 SRT 字幕文件,並支持字幕翻譯成其他語言。它使用優化後的 Whisper AI 語音轉寫模型,準確度接近人類水平。集成多種 AI 翻譯引擎,支持 ChatGPT、DeepL、微軟、百度等翻譯接口。它還提供高效易用的可視化字幕編輯器,支持字幕摘要和預提取人聲功能。33 字幕支持英語、日語、韓語、法語、泰語等 50 多種語言。
視頻編輯
881.8K
TinyStudio
Tinystudio
TinyStudio是一款免費的Mac應用程序,利用M1/M2芯片的強大性能提供快速高效的字幕生成服務。用戶可以一鍵生成視頻和音頻文件的字幕,無需任何技術專業知識。同時,TinyStudio採用OpenAI的Whisper技術,可在本地處理數據而無需聯網。該應用程序還支持字幕導入和導出,提供基於規則的校正系統以確保準確性和可靠性。TinyStudio具有用戶友好的界面,易於使用,適用於提高Vlogger、營銷人員和社交媒體愛好者的效率。TinyStudio是一款非常有效的視頻編輯工具,適用於Vlogger、營銷人員和社交媒體愛好者。立即下載TinyStudio,體驗免費、快速、強大的字幕工具!
AI字幕生成
138.0K
NVAS3d
Nvas3d
NVAS3d是一個用於估計包含多個未知聲源的場景中任何位置的聲音的項目,通過使用多個麥克風的音頻錄音和場景的3D幾何和材料,實現了新視角聲學合成。
AI音頻增強器
54.1K
SALMONN
SALMONN
SALMONN是由清華大學電子工程系和字節跳動開發的大型語言模型(LLM),支持語音、音頻事件和音樂輸入。與僅支持語音或音頻事件輸入的模型不同,SALMONN可以感知和理解各種音頻輸入,從而獲得多語言語音識別和翻譯以及音頻-語音共推理等新興能力。這可以被視為給予LLM“聽覺”和認知聽覺能力,使SALMONN成為通向具有聽覺能力的人工通用智能的一步。
AI語音識別
88.0K
Bespoke
Bespoke
Bespoke 是一個 AI 生成的定製播客服務,為你提供完美貼合你日常的定製播客。點擊一次生成一個定製播客,讓你隨時隨地獲得你想聽的內容。加入等待名單,體驗更多的定製化功能和更多的播客選擇!
音頻生成
44.4K
Speaking AI
Speaking AI
Speaking AI是一款使用先進的大語言模型技術實現的文本到語音轉換工具,能夠以自然的情感進行對話並實現零樣本語音克隆。它可以捕捉你獨特的音調、音高和調節,讓你以前所未有的方式複製和利用自己的聲音。Speaking AI通過先進的技術實現了聲音克隆的突破,讓語音克隆聽起來更加自然。使用Speaking AI,你可以通過錄制自己的聲音,在短短10秒鐘內進行克隆。我們致力於將最先進的AI技術用於推動人類進步,特別是在促進語音克隆技術的發展和應用方面。
語音克隆
14.0M
TranscribeAI
Transcribeai
TranscribeAI是一款革命性的Mac應用程序,旨在輕鬆將音頻文件轉錄為文本。採用最先進的人工智能技術,該應用程序提供了無與倫比的準確性和速度,節省了您寶貴的時間和精力。無論您是記者、研究人員、內容創作者還是需要定期轉錄音頻的人,TranscribeAI都是您的完美工具。
AI語音轉文本
78.4K
Fluxon
Fluxon
Fluxon是一個超逼真的AI語音生成器,可以將文本轉化為任何語言的超逼真聲音。它可以在不到10分鐘的示例音頻中克隆任何聲音。您可以在同一個音頻文件中使用多個聲音創建對話。還可以通過訓練自定義聲音來合成單一聲音,創建嘴唇同步視頻。Fluxon提供了REST API,可以將AI語音生成集成到您的應用程序中。它可以用於各種用途,如為營銷和演示視頻添加專業和逼真的配音,從文本生成清晰高質量的有聲書,為NPC生成逼真的人聲,為內容創建專業翻譯,為聊天機器人創建更自然的聲音,將任何文本內容自動轉化為播客等。
文本轉聲音
153.2K
Koolio.ai
Koolio.ai
Koolio.ai是一個音頻內容創作平臺,幫助用戶在幾分鐘內將概念變成完整的內容。我們提供簡單易用、直觀的界面,讓用戶專注於創作。無論是音頻轉錄、與他人協作、根據內容自動選擇音效或音樂來增強您的內容,還是輕鬆進行音頻操作和處理,Koolio.ai都可以讓您輕鬆製作高質量的內容。
音頻生成
47.7K
ImageBind
Imagebind
ImageBind是一種新的AI模型,能夠同時綁定六種感官模態的數據,無需顯式監督。通過識別這些模態之間的關係(圖像和視頻、音頻、文本、深度、熱成像和慣性測量單元(IMUs)),這一突破有助於推動AI發展,使機器能夠更好地分析多種不同形式的信息。探索演示以瞭解ImageBind在圖像、音頻和文本模態上的能力。
AI模型
48.9K
精選AI產品推薦
中文精選
騰訊混元圖像 2.0
騰訊混元圖像 2.0
騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型,顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構,使得圖像生成速度可達到毫秒級,避免了傳統生成的等待時間。同時,模型通過強化學習算法與人類美學知識的結合,提升了圖像的真實感和細節表現,適合設計師、創作者等專業用戶使用。
圖片生成
80.6K
國外精選
Lovart
Lovart
Lovart 是一款革命性的 AI 設計代理,能夠將創意提示轉化為藝術作品,支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程,節省時間並提升創意靈感。Lovart 當前處於測試階段,用戶可加入等候名單,隨時體驗設計的樂趣。
AI設計工具
63.8K
FastVLM
Fastvlm
FastVLM 是一種高效的視覺編碼模型,專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器,減少了高分辨率圖像的編碼時間和輸出的 token 數量,使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力,適用於各種應用場景,尤其在需要快速響應的移動設備上表現優異。
AI模型
51.1K
KeySync
Keysync
KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題,同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果,適用於自動配音等實際應用場景。
視頻編輯
48.0K
Manus
Manus
Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品,能夠直接交付完整的任務成果,而不僅僅是提供建議或答案。它採用 Multiple Agent 架構,運行在獨立虛擬機中,能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現,展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’,幫助用戶高效完成各種複雜任務。
個人助理
1.5M
Trae國內版
Trae國內版
Trae是一款專為中文開發場景設計的AI原生IDE,將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能,顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白,滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具,旨在為專業開發者提供強大的技術支持,目前尚未明確公開價格,但預計會採用付費模式以匹配其高端定位。
開發與工具
137.4K
國外精選
Pika
Pika
Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。
視頻生成
18.7M
中文精選
LiblibAI
Liblibai
LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。
AI模型
8.0M
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase