豆包大模型能力对齐GPT-4o！AI应用大时代已来，探索字节AI产业链投资价值

2024-12-20 07:29:03 来源：券商研报精选

来源：华泰睿思

核心观点

豆包大模型家族全新升级，新发视觉理解模型成为最大亮点

12月18日火山引擎举办FORCE原动力大会，升级了豆包家族系列大模型，包括：新发布视觉理解模型和3D生成模型，升级豆包通用模型pro（对标GPT-4o）、视频生成模型（动态海报）、音乐模型（生成3分钟作品，复杂音乐创作）、文生图模型（一键P图/海报）。其中，视觉理解模型成为最大亮点，可同时输入文本和图像的相关问题，模型能综合理解并给出准确回答。豆包大模型的日均tokens调用量最新已超4万亿，较5月发布时增长超33倍。我们认为，豆包模型及相应AI应用正快速渗透，AI赋能B/C端时代有望加速到来。

豆包视觉理解模型跨模态能力突出，低价推广有望解锁更多价值场景

豆包视觉理解模型展现出卓越的视觉理解与跨模态能力：1）更强内容识别。能识别物体类别、形状、纹理等，理解物体之间关系和空间布局；2）更强理解推理能力。根据所识别的内容进行复杂的逻辑计算，如拍题解题等；3）更细腻视觉描述。视觉理解模型输入定价为每千tokens 0.003元，比行业平均价格低85%，我们认为，视觉理解模型能拓展豆包大模型的场景边界，拓展教育、旅游、电商、金融、医疗、物流等领域。较低的模型定价有望加速推广应用场景，提高字节系AI应用产品用户粘性。

豆包通用模型pro升级后全面对标GPT-4o，价格仅为后者1/8

升级后的豆包通用模型pro能力大幅提升：综合任务处理能力上提升32%，和GPT-4o持平；指令遵循能力提升9%；代码能力提升58%；专业知识领域提升54%，这一效果略微领先GPT-4o；逻辑推理上提升13%；在数学上大幅提升43%。综合能力已全面对齐GPT-4o，使用价格只有GPT-4o的1/8。我们认为，豆包Pro凭借其更强的模型效果和更低的推理成本，将进一步推动企业AI升级，以及增强C端用户体验和使用量。

企业端产品：火山方舟、扣子、HiAgent帮助构建AI能力中心

1）火山方舟提供全栈MaaS能力，支持模型精调、推理、评测等全方位功能，及丰富插件、扩展API和高代码解决方案，升级上下文缓存和记忆加工加载技术，强化AI搜索和推荐。2）扣子为中国最具活力的智能体开发社区，已有超100万的活跃开发者，创造了超200万智能体应用。1.5版本推出，支持发布成小程序、H5、API等应用形态，增强了多模态能力，可与各种硬件集成。3）HiAgent支持企业私有部署和混合部署模式，沉淀出超100个行业的应用模板，增强知识融合效果，帮助企业打造AI知识助手。

AI应用大时代已来，探索字节AI产业链投资价值

从C端AI应用看，字节自己推出的AI APP应用相对闭环生态；AI智能硬件方面字节已推出AI智能耳机OLA friend，AI玩具显眼包（尚未正式发售），后续AI眼镜、AI机器人等值得期待。从B端AI合作看，我们梳理了产业链相关标的，具体请见研报原文。

风险提示：AI发展不及预期，用户反响不及预期，政策监管风险。本研报中涉及到未上市公司或未覆盖个股内容，均系对其客观公开信息的整理，并不代表本研究团队对该公司、该股票的推荐或覆盖。

豆包大模型能力对齐GPT-4o！AI应用大时代已来，探索字节AI产业链投资价值

分享到微信