来源:光大证券微资讯
2月5日,蛇年第一个交易日迎来科技股的全面爆发,软件、传媒、半导体、IT设备等板块集体上涨。特别是AI概念股,DeepSeek概念股、华为算力、智谱AI等题材表现十分强势,批量DeepSeek概念股涨停。
春节假期,DeepSeek-R1模型带来一场AI风暴,不仅展示了低成本实现顶尖AI大模型能力的技术路径,还全面拔高了国产大模型、开源大模型的上限。
正是看到了DeepSeek模型的强大实力和广阔应用空间,国内外主流云服务平台快速上线DeepSeek模型,帮助用户快速、便捷部署R1模型。同时,DeepSeek应用程序每日活跃用户急速增长并跨越2000万大关,并成为多个地区用户热衷的大模型APP。
早在去年12月26日,深度求索便发布DeepSeek-V3并同步开源,该模型能力与GPT-4o以及Claude-3.5-Sonnet等主流大模型不相上下,但在训练成本及训练效率方面展现出了明显的优势。
为了应对DeepSeek的强力竞争,OpenAI快速上线o3-mini推理模型和Deep Research。
1、DeepSeek掀起开源大模型风暴,AI巨头加速行业发展
一直以来,OpenAI、Anthropic等AI巨头不断推动闭源大模型的发展。开源大模型也有长足的进步,但一直被闭源大模型压制。
随着深度求索(DeepSeek)接连上线DeepSeek-V3、DeepSeek-R1大模型,天平开始向开源大模型倾斜。更让整个科技界惊讶的是,DeepSeek可以通过低成本算力预算来实现较高的模型能力。
全球AI巨头在春节期间全面探索DeepSeek的技术路线,这也进一步显示国产AI大模型的综合实力已经追上国际先进水平。
1月20日,DeepSeek-R1重磅发布,模型性能堪比OpenAI-o1大模型,在编程、数学运算等复杂任务方面比肩o1正式版。
更让用户惊讶的是,R1模型License统一使用MIT,这就意味着该模型完全开源、不限制商用。R1模型还允许用户通过蒸馏模型的方式训练其他模型,API服务定价也极为低廉,每百万输入tokens 仅需1 元(缓存命中)/ 4 元(缓存未命中),每百万输出tokens仅需16元,较OpenAI-o1大模型定价大幅降低。
早在2024年12月,深度求索(DeepSeek)正式上线并开源全新系列模型 DeepSeek-V3,性能优于Llama-3.1-405B等开源大模型,已经媲美GPT-4o以及Claude-3.5-Sonnet等主流大模型。
根据深度求索官方发布的信息,DeepSeek-V3采用了混合专家架构(MoE),该架构包含了256个专家,每次推理将动态选择前8个专家来参加计算,这可以提升计算效率。
DeepSeek-V3大模型总参数量高达6850亿,每次推理将激活370亿参数。V3在14.8万亿token上进行了预训练,整体训练效率极高,这显著降低了训练成本。根据DeepSeek透露的数据,DeepSeek-V3大模型训练仅用了约两个月的时间,成本约为558万美元。
DeepSeek为大模型训练打造了一条高速通道,这背后就有很多创新的技术。在框架方面,DeepSeek打造了HAI-LLM框架,可以实现16路流水线、64路专家模块并行,还创新使用多令牌预测(MTP)。通过设立了MTP训练目标,DeepSeek突破了传统大模型训练的束缚。再加上监督微调与强化学习两个阶段深入的打磨,DeepSeek-V3进一步提升了能力。
随着DeepSeek低成本、高效率大模型展现了强大的竞争力,未来AI大模型将进一步赋能更多的行业。
2、DeepSeek吸引众多用户,国内多家公司与DeepSeek展开合作
1月15日,DeepSeek就已经发布DeepSeek APP,凭借着强大的模型能力吸引海量用户下载并使用DeepSeek模型。
在1月26日上线苹果App Store之后,DeepSeek应用程序便迅速成为多国热门应用,甚至占据140个国家苹果App Store下载排行榜首位。
在DeepSeek APP发布20天之际,应用软件日活规模已超2000万,表现远好于ChatGPT APP。
国内主流云服务平台也快速上线DeepSeek V3和R1大模型,方便用户快速部署该模型。根据华为云2月1日的消息,在硅基流动和华为云团队的努力下,基于华为云昇腾云服务的R1/V3推理服务正式上线,可以让模型在规模生产环境中稳定运行。
随后,腾讯云也宣布DeepSeek-R1大模型一键部署至腾讯云HAI(腾讯云高性能应用服务)上,用户可以省去买卡、安装驱动、配置网络等一系列繁琐步骤,仅用3分钟便可以调用R1大模型。
360数字安全对外表示,安全大模型正式接入DeepSeek,通过强化学习等技术训练“DeepSeek版”安全大模型。
2月3日,百度智能云、阿里云也宣布正式上架DeepSeek-R1和 DeepSeek-V3模型,方便用户快速调用。
除了国内科技厂商,国际科技巨头也积极拥抱DeepSeek模型。1月底,英伟达便宣布NIM微服务上线DeepSeek R1 671b版本的预览版。微软也将DeepSeek-R1整合至其企业级AI服务平台,亚马逊云平台也可以使用该模型。AMD与SGLang、DeepSeek团队紧密合作,迅速将DeepSeek-V3集成至Instinct MI300X GPU之中。
根据iFinD金融数据终端,DeepSeek概念股包括:海光信息、三六零、杭钢股份、万兴科技、天娱数科、每日互动、梦网科技、美格智能、安恒信息、安凯微、青云科技等。
(本文首发于2025年2月5日)
![](http://i0cloud.jrjimg.cn/cloud/images/general/default.png)
![](http://i0cloud.jrjimg.cn/cloud/images/general/emoji.png)