“AI教母”团队用不到50美元训练出新模型,蒸馏法加速大模型训练和应用平民化
2025-02-07 08:55:15
来源:
金融界
据媒体报道,“AI教母”李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。
s1诞生标志着高效AI模型训练的新时代。研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini2.0FlashThinkingExperimental提炼出来的。这种方法的核心在于如何有效地传递知识,使得小模型不仅具备大模型的推理能力,而且在资源消耗上表现得极为优越。
李飞飞团队的这一突破,不仅展现了技术的前瞻性,而且为更多科研机构和创业公司提供了借鉴的蓝本。同时,s1所展现出价格优势的背后,其实也反映了未来AI领域的一个重要趋势:大模型的训练和应用将愈发平民化。
此前DeepSeek发布一系列DeepSeek-R1模型,探索了将R1的推理能力蒸馏到更小模型中的潜力,通过知识蒸馏技术,成功将大模型的推理能力传递给小模型,实现了小模型在推理任务上的显著提升,引领了小模型的发展方向。
![](http://i0cloud.jrjimg.cn/cloud/images/general/default.png)
![](http://i0cloud.jrjimg.cn/cloud/images/general/emoji.png)
全部评论
机会情报
- 字节跳动推出全新AI数字人模型,OmniHuman助力内容创作门槛大降
- “AI教母”团队用不到50美元训练出新模型,蒸馏法加速大模型训练和应用平民化
- DeepSeek成焦点!高盛、德银、瑞银齐发声,中企价值重估
- 国产AI芯片生态加速裂变,DeepSeek开源模型驱动自主技术突破
- 比亚迪智能化战略开启高阶智驾新纪元,产业重构催生千亿赛道机遇
- 宇树、特斯拉、Figure AI传来大消息,人形机器人站上风口!行业加速迎来量产阶段
- AI眼镜 “百镜大战” 打响!小米眼镜官方微博上线引发市场热潮,产业链有望迎来快速发展期
- 央行疯狂囤金!全球黄金需求三连破纪录,三大核心因素支撑金价
- 无人作战力量正加速走向战场,关注无人机产业链
- 多个新兴领域需求催化,固态电池加速商业化进程