刷屏！国产大模型匹敌GPT-4o，重点关注三大主线

2024-12-30 08:26:03 来源：金融界

日前深度求索DeepSeek发布了其DeepSeek-V3模型。该模型是一款强大的混合专家（MoE）语言模型，拥有671B参数，激活37B。DeepSeek-V3在多项基准测试中表现优异，编程能力甚至媲美最领先的3.5 Sonnet，超过GPT-4o。

光大证券分析，短期来看，DeepSeek-V3的低训练预算可能会让市场对算力需求的增长预期有所下调，尤其是对高性能计算（HPC）和GPU等硬件供应商的需求可能受到一定影响。但长期而言，低训练预算并不意味着算力需求的减少，而是算力利用效率的提升。随着大模型技术的普及和应用的扩展，算力需求仍将保持增长，AI芯片、边缘计算等长期成长性无忧。

中信证券认为，DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠，助力AI应用广泛落地；同时训练效率大幅提升，亦将助力推理算力需求高增。持续看好AI产业链的加速落地机遇，建议重点关注AI应用、AI Infra、AI算力三大主线。

责任编辑：栎树

精彩推荐

加载更多

全部评论

机会情报

刷屏！国产大模型匹敌GPT-4o，重点关注三大主线

分享到微信