刷屏!国产大模型匹敌GPT-4o,重点关注三大主线
2024-12-30 08:26:03
来源:
金融界
日前深度求索DeepSeek发布了其DeepSeek-V3模型。该模型是一款强大的混合专家(MoE)语言模型,拥有671B参数,激活37B。DeepSeek-V3在多项基准测试中表现优异,编程能力甚至媲美最领先的3.5 Sonnet,超过GPT-4o。
光大证券分析,短期来看,DeepSeek-V3的低训练预算可能会让市场对算力需求的增长预期有所下调,尤其是对高性能计算(HPC)和GPU等硬件供应商的需求可能受到一定影响。但长期而言,低训练预算并不意味着算力需求的减少,而是算力利用效率的提升。随着大模型技术的普及和应用的扩展,算力需求仍将保持增长,AI芯片、边缘计算等长期成长性无忧。
中信证券认为,DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。持续看好AI产业链的加速落地机遇,建议重点关注AI应用、AI Infra、AI算力三大主线。
全部评论