「端到端」群雄逐鹿,自动驾驶竞争转向寡头化

尚怡达人 2024-04-28 78848人围观

21世纪经济报道记者 邓浩 上海报道

今年年初,特斯拉开始向部分用户推送FSD V12版本的纯视觉端到端自动驾驶方案,业内对于“端到端”智驾的热情被彻底点燃,不少厂商开始陆续推出相关量产方案。

早在2022年底,商汤及其联合实验室便提出了行业首个感知决策一体化自动驾驶通用模型UniAD,并在次年荣获2023年国际计算机视觉与模式识别会议(CVPR)最佳论文。

4月25日,北京车展正式开幕,商汤绝影在车展上首次向公众展示了面向量产的端到端自动驾驶解决方案UniAD的道路测试表现。

不少业内人士对21世纪经济报道记者表示,「端到端」方案对于训练数据及算力要求要提升一个level,未来自动驾驶玩家头部化趋势或将更加明显。

城市NOA推动端到端加速落地

业内一般把自动驾驶分为感知、规划、决策、控制不同的模块,其中感知端,现在技术已经收敛到BEV+Occupancy的方案,实现了基于神经网络的数据驱动模式,而规划控制还是采用人工手写规则。

城市NOA(高阶辅助驾驶)的加速,某种程度上助推了端到端方案的加快落地。因为随着高阶辅助驾驶进入城区,道路复杂程度指数级增长,corner case层出不穷,手写规则难以满足实际场景需求。为了解决这一问题,以特斯拉为代表的厂商开始探索端到端,即如何以纯数据驱动的方式实现自动驾驶。

某熟悉自动驾驶的算法专家对记者表示,“端到端方案优势在于能够通过联合特征优化提高效率,减少模块间信息传递可能出现的误差累积,并且可以通过反向传播算法进行端到端的优化。”

目前业内对于端到端方案,主要有两条路径。其一是将感知、预测、规划等多个任务整合到一个统一的神经网络架构的全端到端;其二是类似华为车BU采用的分离式端到端,即通过GOD(通用障碍物识)――PDP网络(预决策到规划)――运动控制,以分模块的方式实现类人化驾驶。

商汤绝影的UniAD方案是少有的将感知、决策、规划等模块都整合到一个全栈Transformer端到端模型,实现感知决策一体化的端到端自动驾驶。

为何采用全端到端方案?

4月26日,商汤绝影某产品专家告诉记者,“我们考虑更多的还是从第一性原理出发,通过感知决策一体化的自动驾驶模型,可以实现信息的无损传递,使得UniAD可以真正做到像人一样开车。”

自动驾驶竞争门槛抬升

端到端方案带来的对于训练数据和算力的更高要求,很可能将开启新一轮技术军备赛。

3月,元戎启行CEO周光透露,目前元戎启行已经率先把端到端模型应用于量产车上,该批量产车将于今年量产落地。并且元戎启行已与NVIDIA达成合作,将于2025年采用NVIDIA的DRIVE Thor芯片适配其端到端智能驾驶模型。

前述算法专家认为,“端到端方案通常需要处理大量的传感器数据,包括图像、点云、雷达等,直接输出控制指令,对算力的要求较高。此外,为了训练这些复杂的神经网络模型,需要大量的标注数据。与以往方案相比,端到端方案可能会带来更高效的数据处理和更紧密的感知-规划协同,但同时也对计算平台的并行处理能力和存储速度提出了更高要求。”

记者从商汤绝影获悉,从2018年开始,商汤就开始在上海临港投入建设智算中心AIDC,布局算力基础设施,AIDC加持的商汤大装置目前运营算力规模达到12000P,以国内领先的算力规模,支持UniAD的训练和学习,推进端到端自动驾驶模型的量产落地。

在端到端系统基础上,商汤绝影还推出了新一代自动驾驶大模型DriveAGI,推动自动驾驶从数据驱动向认知驱动的跃迁。依托多模态大模型强大的世界理解、推理能力、决策能力以及交互能力,这种贴近人类思维模式、理解人类意图并有解决驾驶困难场景能力的技术方案,将是向完全无人驾驶迈出的重要一步。

此外,记者此前在华为车BU发布会上获悉,乾��ADS 3.0依托华为云的底座能力,实现能力的快速迭代。算力方面达到3.5E FLOPS(注:FLOPS指每秒执行的浮点运算次数,1E FLOPS即100亿亿次),训练数据量已达日行3000万公里,半年实现3倍增长,模型每5天迭代一次。

不容错过
Powered By Z-BlogPHP