SpeechGPT
S
Speechgpt
简介 :
SpeechGPT是一种多模态语言模型,具有内在的跨模态对话能力。它能够感知并生成多模态内容,遵循多模态人类指令。SpeechGPT-Gen是一种扩展了信息链的语音生成模型。SpeechAgents是一种具有多模态多代理系统的人类沟通模拟。SpeechTokenizer是一种统一的语音标记器,适用于语音语言模型。这些模型和数据集的发布日期和相关信息均可在官方网站上找到。
需求人群 :
可用于语音内容生成、多模态人机交互等场景
总访问量: 474.6M
占比最多地区: US(19.34%)
本站浏览量 : 109.3K
使用场景
使用SpeechGPT进行多模态对话生成
利用SpeechGPT-Gen进行信息链语音生成
使用SpeechTokenizer进行语音标记
产品特色
多模态内容感知和生成
信息链语音生成
多模态多代理系统
统一的语音标记
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase