特斯拉距离自动驾驶还差几步？

时间：2024-04-23

马点秋

特斯拉轭式方向盘

对于中外同行而言，特斯拉是公认的行业标杆，实现了产品的垂直整合、全栈自研，因而在制造智能电动汽车方面，具有最大的灵活性和高效率。

近日，特斯拉首席执行官马斯克在All in Summit技术峰会上表示，要在今年年底将参加FSD Beta测试的人数，从现在的10万人扩大到100万人。

这一在2020年10月发布的自动驾驶测试版软件，至今已历经数十次更新，可以看作特斯拉在实现L5级自动驾驶这一终极目标上的垫脚石。但该计划目前仅对北美地區用户开放，候选车辆需要搭载特斯拉HW3.0自动驾驶硬件平台，并且对申请人的驾驶习惯评分也有一定要求。

那么，为何马斯克选择在今年，大幅降低FSD Beta的申请门槛？特斯拉所采用的纯视觉自动驾驶路线，又有何特殊价值？

虽然FSD Beta几乎代表着目前家用级乘用车在自动驾驶领域的最高水准，但本质上来说，其仍然属于L2自动驾驶的范畴，出现紧急情况时，仍然需要驾驶员及时接管，并且车企不对开启状态下发生的事故负责。

根据驾驶自动化分级标准，“是否驾驶人在驾驶车辆”，是L2与L3及以上自动驾驶技术的分水岭。L3自动驾驶意味着发生事故以后的责任，要由车企承担。

目前世界上仅有一家乘用车企奔驰，宣布对旗下的Drive Pilot L3自动驾驶系统导致的驾驶事故负责，且其约束条件极为苛刻。而特斯拉旗下车辆在“Autopilot”（自动驾驶）状态下发生的亡人事故已有多起，为何还要在此时宣布将大规模增加测试用户的数量呢？

这还要从当前自动驾驶技术的核心—深度学习—讲起。

深度学习并不是一个新概念。其所依赖的神经网络早在1943年，就由美国心理学家麦卡洛克和数学家皮茨提出，在上世纪末计算机蓬勃发展的时期，受到学界的重视。

最近麻省理工（MIT）计算机科学和人工智能实验室公布的一段视频显示，人工智能领域大神Yann LeCun在1990年代初，便创造了速度极快的AI数字识别系统。而2006年杰弗里·辛顿发表的一篇文章，则让人们意识到，通常用来渲染游戏等3D画面的GPU图形处理器，可被用于大大加速神经网络的学习速度。

特斯拉首席执行官马斯克

使用Mobileye技术的无人驾驶汽车

左图：自动驾驶巨头Waymo发布会。右图：英伟达Xavier自动驾驶芯片

之后的AlphaGo与韩国棋手李世石的世纪大战，更是让深度学习“出圈”—全世界的人们意识到，只要拥有足够多的样本与算力，深度学习可谓无所不能。

而深度学习技术应用到自动驾驶中，就是通过收集的大量路测数据，在经过人工和自动化标注后，放到超级计算机上进行反复训练，得到训练完毕的自动驾驶模型，从而赋予车载人工智能理解道路状况的能力。

然而，基于深度学习的自动驾驶技术，实际上非常依赖于其训练样本。机器首先需要理解车辆所能遇到的所有可能的危险状况，才能相对应做出正确的决策。

针对这一问题，自动驾驶巨头Waymo和绝大多数车企的做法，都是以尽量多的路测里程，尝试覆盖所有可能出现的长尾场景。

而特斯拉作为全球范围内汽车保有量最多的自动驾驶企业，在这一点上具备独一无二的优势：每一个用户实际上都可以成为其数据收集员，将自身的日常行驶数据进行脱敏处理后，上传到特斯拉的“超级大脑”—由25个特斯拉自研深度学习处理器D1组成的“Dojo”道场超级计算机中，进行日夜无休的重复训练。

道场超级计算机1.1 EFLOPS的运算速度，是上述1990年代MIT实验室那台用于数字识别的计算机算力的550亿倍。如此恐怖的计算能力，自然具备同时处理大量训练样本的能力。这大概就是特斯拉放开自动驾驶系统测试名额限制的一大原因。

而有了更多的参与测试者与强大的超级计算机，特斯拉的自动驾驶系统迭代将更快，也就能尽早摘得L5级自动驾驶的桂冠。

有趣的是，成为一个优秀的人类驾驶员，并不需要学习大量的长尾场景，因为和如今的人工智能相比，人脑的“泛用性”更强一些，在很多小概率事件面前可以做出相对合理的选择。

然而，自动驾驶对于模型内已经覆盖到了的危险场景，往往能够处理得相当完美与从容，而且能让汽车在面对道路突发状况时，在极短的时间内完成信息收集、感知预测、决策执行这三个关键步骤，实现超越人类认知能力与反应速度极限的规避动作。这也是马斯克坚信自动驾驶比人类驾驶更加安全的原因。

聊完了软件，我们再来聊聊硬件。

自动驾驶的硬件江湖，目前大致可分为两大阵营：以国产造车新势力为代表的多传感器融合路线，和以特斯拉为代表的纯视觉感知路线。

马斯克从其著名的“第一性原理”出发，坚持认为纯视觉方案是人眼与机器达成和谐统一的唯一路径。北美地区自2021年5月起交付的Model 3和Model Y上的辅助驾驶系统，就只装配了8颗摄像头;而2022年2月起，交付的高端车型Model S和Model X，不再配备雷达。

取消了所有的雷达配置，显示了马斯克将纯视觉方案死磕到底的决心。而这一方案的基石，便是由设计了AMD“Zen”系列架构的硅谷芯片大神Jim Keller，与Jim的继任者，曾负责苹果A5到A9处理器的Pete Bannon共同设计的FSD自动驾驶芯片。

这颗芯片于2018年底宣布研发成功，单颗算力达到了72 TOPS（万亿次每秒，衡量自动驾驶芯片算力的单位），并在2021年初作为HW3.0硬件平台的核心，搭载在特斯拉旗下一众车型上，代替了此前使用的算力仅为1 TOPS的英伟达Parker系列芯片。

相对应的，国产造车新势力近年的自动驾驶配置，仿佛也成为了各大厂商“秀肌肉”的舞台：激光、毫米波、超声波雷达和摄像头数量不断刷新上限，而自动驾驶芯片的算力更可谓进展神速。

英伟达在2017年公布的Xavier自动驾驶芯片，以32 TOPS的算力碾压了当时算力普遍在2 TOPS徘徊的竞争对手。但在2020年量产上市后，以小鹏P7为代表的诸多车型中搭载的Xavier在车主的手里还没捂热，英伟达就宣布其下一代自动驾驶芯片Orin将在2022年初交付车企，算力高达252 TOPS。

Mobileye的三维立体环境模型

特斯拉自动驾驶示意图

在去年的GTC图形技术大会上，英伟达又宣布将在2025年推出算力高达1000 TOPS的Atlan自动驾驶芯片。而以华为200 TOPS的MDC610，和地平线128 TOPS的征程5为代表的国产阵营，以及高通预计明年上市的Ride系列，也都在這片市场中挣扎求生。

车载芯片的算力指标，仿佛代替了发动机的马力，成为了智能车时代各大车企新的发力点。

但在如今自动驾驶芯片“百花齐放”的盛况背后，却是以色列老牌自动驾驶技术解决方案厂商Mobileye长达十余年的技术垄断。

直到2014年，特斯拉宣布研发初代自动驾驶技术时，所采用的仍然是Mobileye所提供的“黑箱式”自动驾驶算法。车企仅能得到Mobileye自动驾驶系统所给出的计算结果，无法得知算法的具体逻辑，也无法针对使用地区的特点，对算法进行更改与调校。

取消了所有的雷达配置，显示了马斯克将纯视觉方案死磕到底的决心。

这样的模式，在传统车企间流行了很长一段时间，但显然不能让技术狂人马斯克满意。

特斯拉研发出第一代自动驾驶芯片后，造车新势力纷纷转向自研或开放式芯片的怀抱;Mobileye也日渐式微，在2017年被芯片巨头英特尔收购;其在2020年推出的Eye Q5芯片，也给予了汽车厂商自定义算法的权限。

Mobileye并非没有技术实力，其在Eye Q5芯片上应用的解决方案Super Vision，实现了用7个远距单目摄像头构建完整的SFM（Structure From Motion，三维立体环境模型）的壮举，将其单目摄像头与传统算法的技术优势地位发挥到了极致。

但其前几年的“不思进取”，让各大厂商纷纷研发出了自己基于多传感器融合的深度学习算法。虽然Mobileye在相比深度学习困难得多的传统算法领域，仍然无人能敌，但其在自动驾驶市场的垄断地位已经一去不归了。

理性来看，融合方案与纯视觉之争，其实是成本与效率之争。融合方案能够得到更加确切的车身周围的环境信息，但激光雷达的高成本，与对来自多重数据源数据的时空标记和汇聚，成为了车企当下面临的难题。

而纯视觉方案采用的摄像头虽然成本较低，但需要在浩如烟海的样本数据中，寻找到有效场景，并对其进行标注，再将其作为模型训练。这对企业的数据收集和深度学习能力，提出了极高要求。

这场比拼，鹿死谁手犹未可知，但它带动着激光雷达、机器人、自然语言理解等领域在近几年飞速发展，至少能让人们相信，我们正走在一条光明的道路上。

免责声明

我们致力于保护作者版权，注重分享，被刊用文章因无法核实真实出处，未能及时与作者取得联系，或有版权异议的，请联系管理员，我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!

特斯拉距离自动驾驶还差几步？

免责声明

相关文章推荐

推荐阅读

推荐期刊

新闻传播杂志

魅力中国杂志

山东医药杂志

知识窗杂志

重庆医学杂志

当代护士下旬刊杂志...

学理论杂志

黄河之声杂志