豆包实时语音大模型发布,“双商”表现极佳,有望加速AI算力及应用的发展
豆包实时语音大模型于1月20日正式推出,并在豆包APP全量开放。此前,业内就曾有消息称豆包将上线最新情感语音大模型,测试效果超过GPT-4o。
豆包实时语音大模型的推出标志着国内AI语音技术的进一步提升,并将加速国内AI应用的普及。
豆包实时语音大模型智商与情商表现出色。在外部测试者的评测中,围绕拟人度、有用性、情商、通话稳定性、对话流畅度等维度对豆包进行测试,整体满意度(以5分为满分)评分为4.36,高于GPT-4o的3.18。
从技术架构来看,豆包大模型可能采用了更高效的训练算法和更大规模的中文语料库,这使其在中文语境下的情感表达优于GPT-4o。
与国际领先的GPT模型相比,豆包语音大模型的重点在于实时性与情感表达能力,这对语音交互场景具有重大意义。
在语音技术中,实时性决定了用户体验的流畅度,而情感表达则是推动语音AI从工具向伴侣型智能体演进的关键环节。情感语音大模型的核心在于其能够更精准地捕捉用户情绪并提供更具人性化的交互体验,这对于AI在客服、教育、医疗等场景的落地具有重要推动作用。
从技术层面看,语音大模型需要大量算力支持,特别是在实时性和多模态结合的情境下,对AI算力基础设施提出了更高要求。当前,国内算力市场需求高速增长,AI芯片、数据中心和算力网络基础设施建设持续加速,为这类高性能模型提供坚实的底层支持。在美国一系列的出口限制措施之下,AI算力产业链正在加速国产替代的进程,这将直接推动国内AI算力产业链的发展!
同时,国内AI市场正在从模型研发向场景赋能快速过渡,实时语音技术的成熟有助于推动AI应用的大规模落地,语音大模型的场景适配能力不断增强,包括客服、教育、健康监测(医疗)等领域应用潜力巨大。
展望后市,光大证券分析,豆包实时语音大模型的推出将进一步提升AI算力和AI应用的市场空间。落脚到A股市场,关注AI算力(AI芯片、服务器、交换机、CPO、铜缆、液冷、PCB等)与AI应用(AI陪伴、AI助理、AI玩具、AI眼镜、AI游戏等)细分环节的龙头企业。