热点资讯
“端到端”是自动驾驶最优解吗
发布日期:2024-08-30 16:00 点击次数:136
最近,“端到端”在车圈火了!特斯拉基于“端到端”的FSDV12(彻底自动驾驶)决议造成的标杆示范效应,重迭入华外传,带动“蔚小理”等车企和华为、地平线等干事商纷纷转向,加码端到端自动驾驶手艺。
所谓“端到端”,其实是来自深度学习中的认识,英文为“End—to—End(E2E)”,指通过一个AI模子,唯有输入原始数据就可以输出最终遵守。诈欺到自动驾驶领域,意味着只需要一个模子,就能把录像头、毫米波雷达、激光雷达等传感器网罗到的感知信息,疗养成车辆标的盘的动弹角度、加快踏板的踩踏深度以及制动的力度等具体操作教导,让汽车竣事自动驾驶。用小鹏汽车首创东说念主何小鹏的说法,证明得“很丝滑”,更像“东说念主类司机驾驶”。
此前,市面上绝大部分自动驾驶系统为传统模块化姿首,即一个东说念主工和智能两分天下的混搭系统:感知依靠神经汇集,狡计遗弃则使用东说念主类手动遐想的算法。这一系统的平允在于单干明确,发现过失便于分模块查验、处分。但问题是,这种模块化的自动驾驶系统在相对不祥的驾驶任务上证明可以,而在复杂的驾驶任务面前,其天花板了然于目。就算是堪称遥遥率先的城市高阶智驾功能,照旧会有机械感,也会在汇入快速路、通过大型路口时宕机。
计划到自动驾驶的中枢挑战是处分取之不尽的边际场景,以有限东说念主力处分无尽长尾问题的资本和时间难以忖度,数据化、模子化成为势必趋势。不外,端到端,雷同是一个需要至意傅经心打磨的高难度手艺活。
一方面,端到端需要海量高质料数据“投喂”锻练。与大言语模子可以在互联网上爬取海量翰墨数据用于锻练不同,端到端智驾需要的视频数据得到资本和难度极高。以特斯拉为例,面前其FSD累计学习的东说念主类驾驶视频片断卓越2000万个,而这一鸿沟的数据仅采集资本就需要50亿元至80亿元。
另一方面,端到端需要雄壮算力的撑合手。自动驾驶波及激光雷达、图像感知以及V2X车路协同等手艺与处分决议。雄壮的算力不仅有益于及时处理海量数据,裁汰数据传输蔓延,还可更好地撑合手面向智谋城市、智谋交通、高等别自动驾驶等全场景。然则,华为车BU、百度极越、蔚来、联想、平定、长城、小鹏等国内企业算力增长面前均濒临较大瓶颈。
问题还在于,算力与数据的制约又会权贵影响算法的发展。诚然国内学术界忽视的端到端自动驾驶模子UniAD斩获2023年CPVR最好论文奖,为国内企业提供了可以参考的标的,但是在开环考证体系、小体量样本数据下确立的UniAD,上车还需要一定时间的工程化阅兵和大鸿沟数据锻练。
此外,端到端会同期放大自动驾驶系统的上限与下限。因为端到端构建的是一个神经汇集黑箱,在得到更高上限的流程中让渡了一部分传统模块决议具备的可解说性。如安在自动驾驶系统中保留可解说性,将那些不应被率先的限定,比如别闯红灯,表征到神经汇蚁集去,保证端到端能安全地落地诈欺、进化,也将是规控工程师们的热切课题。
攀高珠峰有两条阶梯:一条是中国西藏的北坡,另一条是尼泊尔的南坡。无论罗致从南坡照旧从北坡攀高,最终王人将到达并吞个顶峰。这与刻下自动驾驶的发展旅途有相似之处。诚然当今还很难判定端到端即是自动驾驶的最优解或最终解,但这并不妨碍企业翻新探索。毕竟端到端能够比传统模块化姿首更好地处理顶点案例,何况代表了一种减少东说念主工编码依赖的更高效的念念路。基于这个旅途,好像自动驾驶能够通往更高阶段。