FSD V12将迎重大架构变化,“端到端自动驾驶”影响几何?

特斯拉多次表示FSD V12将实现全新的“端到端自动驾驶”,模型架构将迎来重大变化。对于新架构的技术细节和潜在影响,市场仍有较多疑惑和分歧。根据特斯拉对外披露的信息及马斯克在X平台(前推特)发布的信息,我们推测特斯拉内部目前有两条“端到端”路线同步在研:1)级联式端到端神经网络;2)World Model。我们认为,FSD V12是前者的可能性较大,有望于明年初落地,以更好地实现L3能力;World Model仍较为新兴,但中长期有望成为自动驾驶乃至具身智能领域的基础模型,可类比GPT之于LLM,或对行业格局产生颠覆性影响。

可能性1(较高):级联式端到端神经网络,大幅提升训练效率和性能上限,有望助力自动驾驶系统更好地实现L3能力,但能否迈向L4仍待观望。

技术本质:系统从输入到输出,全程使用神经网络算法,无需任何人工规则介入。当前,自动驾驶模型多为模块化架构,感知预测、规划、控制等不同任务分属于多个不同的小模型,且下游规控环节普遍仍以规则为主。而“端到端”神经网络在输入图像后,可直接输出转向、刹车、加速等控制指令。为提升训练效果,“端到端”的大神经网络可能由多个小的子神经网络级联而成。但与传统模块化架构用“规则”连接模块不同,级联式神经网络的子模块是以“神经网络”的方式自行训练堆叠,因此可通过数据驱动优化整个端到端模型,避免“局部最优,而非全局最优”的困境。

潜在影响:更好地实现L3能力。端到端/神经网络的核心好处在于模型迭代的关键由“工程师”变为了更易于规模化的“数据和算力”,因而训练效率和性能上限有望得到显著提升。落到实处,我们认为端到端方案所展示出的性能潜力有望大幅提升自动驾驶系统的接管水平,从而实现真正无可争议的L3能力(例如达到每周接管1次)。但端到端模型的“黑盒”问题目前产业界尚未有十分成熟的解决方案,因此我们认为,其最终能否迈向追求极致安全性的L4全无人驾驶仍待观望。

发展进度:有望搭载于FSD V12,明年初正式落地的可能性较大。2023年8月26日,马斯克在X平台(前推特)进行了FSD V12 demo的驾驶直播。我们认为,尽管直播中展现出的能力距离正式推送给消费者仍有距离,但可基本推断当前的V12模型已十分接近端到端,再配合特斯拉在数据和算力上的巨大投入,V12接下来至年底的迭代速度有望大幅加快。

可能性2(较低):World Model,有望打造自动驾驶领域的基础底座,引领视觉的GPT时刻;目前或仍处于GPT-1阶段,但发展速度值得期待,中长期看或对行业格局产生颠覆性影响。

技术本质:无需标注、自监督的预训练模型。World Model可生成自动驾驶相关的连续帧视频场景,其本质是对视频中的丰富语义以及背后的物理规律进行学习,从而对物理世界的演化产生深刻理解。基于World Model所提供的丰富语义信息以及对世界强大的理解力,自动驾驶模型的感知与预测能力有望得到显著提升,规划、控制等下游任务也有望迎刃而解。

潜在影响:为自动驾驶提供了一套未经证明的新路径,若得以走通,将对行业产生较大颠覆。中短期来看,World Model或将主要应用于数据合成和仿真模拟环节,厂商的车队规模对算法训练的重要性或有所下降,数据闭环的框架也将有所改变。长期来看,World Model有潜力成为自动驾驶乃至具身智能领域的基础模型,可类比GPT为所有NLP问题提供了一个通用解。考虑到更标准化的解决方案和更巨大的资金投入(资金需求或是这一代BEV+Transformer方案的数倍),行业内有望出现少数几家强大的World Model基础模型层平台方,以SaaS或API的方式为主机厂/运营方提供自动驾驶能力,行业格局和合作模式或将发生较大变化。

发展进度:仍处早期,但发展速度值得期待。我们认为,特斯拉、Wayve等公司不约而同地在今年推出World Model,很大程度上是受到了GPT的启发。目前,World Model或仍处于GPT-1的阶段,但考虑到目前行业整体对“大模型”潜力的强烈共识、算力的升级以及以特斯拉为代表的玩家此前积累的海量数据,我们认为World Model从0到1的爆发或较ChatGPT更快(OpenAI从GPT-1至GPT-3.5共历经4年)。

国内玩家距离“端到端”仍有较远距离。

无论是级联式端到端神经网络还是World Model,我们总结其核心壁垒皆在于:1)专业的AI人才团队,2)海量的视频数据,以及3)巨大的算力投入。国内主机厂从2023年开始陆续实现这一代“BEV+Transformer”架构的量产上车,尽快实现“脱图”以及尽可能多地“开城”是国内智驾车企当前的重点。

对于下一代的“端到端”技术路线,国内主机厂目前最快也仍处于早期预研阶段,且在人才、数据、算力三方面较特斯拉皆有较大差距,因此从预研到上车乐观看或也需3年左右的时间。

而对于前景更不明朗的World Model(或需等待特斯拉有更多成果展示),面临着较大销售和交付压力的国内主机厂,在新技术的人才和资源投入上或也有所保留。相较之下,我们认为,特斯拉、华为等行业巨头在资金和资源上更占优势;而WAYVE、极佳科技等初创企业的目标和精力更为聚焦,也有望吸引到更多的AI人才,类似于当年的OpenAI。

风险因素:

特斯拉端到端技术路线发展不及预期;特斯拉FSD V12推送进度不及预期;云端训练算力出现较大紧缺;中国玩家追赶进度不及预期等。

责任编辑:李欣
精彩推荐
加载更多
全部评论
金融界App
金融界微博
金融界公众号