SALMONN
S
SALMONN
簡介 :
SALMONN是由清華大學電子工程系和字節跳動開發的大型語言模型(LLM),支持語音、音頻事件和音樂輸入。與僅支持語音或音頻事件輸入的模型不同,SALMONN可以感知和理解各種音頻輸入,從而獲得多語言語音識別和翻譯以及音頻-語音共推理等新興能力。這可以被視為給予LLM“聽覺”和認知聽覺能力,使SALMONN成為通向具有聽覺能力的人工通用智能的一步。
需求人群 :
SALMONN可以應用於語音識別、語音翻譯、音頻處理等領域。
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 90.0K
使用場景
輸入:gunshots.wav,輸出:...
輸入:duck.wav,輸出:...
輸入:music.wav,輸出:...
產品特色
多語言語音識別
多語言語音翻譯
音頻-語音共推理
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase