渐进派破壁：西有特斯拉，东有毫末智行！用数据智能推动自动驾驶历史进城

新闻 2022-09-21 雷刚

435 0

“辅助驾驶更快赢得自动驾驶终局”

雷刚发自副驾寺非常AI | 公众号 QbitAI 不争了。辅助驾驶是通向自动驾驶的必由之路，渐进式路线更快赢得终局。在创办的第1020天，在第六个HAOMO AI DAY现场，这种态度被亮得明确，结论讲得掷地有声。此时此地此身，在实践成果和趋势再清晰不过的情况下，多年的自动驾驶路线之争，已再无争论的必要。特斯拉开创的路线，国外以FSD公测开始上路，国内则被速度更快的面壁者推向了检验时刻，而且是一个更大的数据闭环模型启动时刻。这个在中国直道超车的面壁者就是毫末智行，现在还旗帜鲜明把行业公理真谛打上公屏：遵循数据智能，依靠数据智能，实践数据智能，这是驱动自动驾驶驶入终局的第一性原理。

并且随着自动驾驶相关的软硬件进入量产期，行业的探索来到了规模化进城时刻——新的分水岭，同样再清晰不过。整个自动驾驶，将进入以数据智能驱动的3.0时代。大道至简，方法论清晰，自动驾驶已无壁可面。实践成果是展现真理的唯一标准毫末智行的面壁成果是通过实践成绩展现的。自创办以来，毫末智行刚度过了第1000天，却已经快速坐稳了中国量产自动驾驶第一名。量产自动驾驶，对应的是无人驾驶，指的是把自动驾驶能力应用于量产车落地的实践。

在乘用车领域，毫末智行在短短2年多的时间内，从无到有推出了三代乘用车辅助驾驶产品HPilot，两年6次OTA升级，实现搭载超过十款乘用车型量产落地，同时并行30个项目异步开发。包括魏牌摩卡、魏牌拿铁、魏牌玛奇朵、坦克300、坦克500、哈弗神兽、拿铁DHT-PHEV等在内的上市车型，均已完成上车搭载。此外摩卡DHT-PHEV激光雷达版、欧拉闪电猫、欧拉芭蕾猫、全新一代长城炮等则正在陆续交付。

于是截至2022年9月，毫末用户辅助驾驶行驶里程突破1700万公里，在中国量产自动驾驶阵营坐稳第一名。并且这只是规模化落地的开始，毫末智行方面称，到2022年底，HPilot预计搭载车型近30款，未来搭载车型达到百万量级。

同时自动驾驶历史进城号角，也已经被吹响。就在成都车展上，魏牌宣布搭载毫末智行城市NOH的全新摩卡DHT-PHEV激光雷达版，9月计划量产，年内发售，上市即交付。

城市NOH（Navigation On HPilot），正是毫末HPilot3.0的核心主打功能，计划让乘用车实现城市开放路况下的端到端智能驾驶。而一旦交付，也意味着将毫末城市NOH将成为中国第一个大规模量产的城市导航辅助驾驶，将再次刷新量产自动驾驶乃至整个中国自动驾驶赛道的纪录。

在现场，产学研大牛对毫末速度、模式和成绩，不仅表达了一致的认可，还认为毫末所代表的是自动驾驶产业化落地的前进方向。中国工程院院士、清华大学教授、清华大学智能产业研究院（AIR）院长张亚勤说，毫末成立1000天取得的成就令人瞩目，而且坚持举办的HAOMO AI DAY也是国内非常难得的聚焦AI自动驾驶的技术盛宴，搭建起了一个行业技术交流平台。

阿里巴巴集团副总裁、知名AI框架大牛贾扬清，则认为毫末正在自动驾驶领域推动新的AI技术工程范式，特别是数据智能体系和自动驾驶超算打造，或许会成为全行业内都有影响力的体系。知名AI芯片公司寒武纪创始人陈天石，分享了云端和车端正在展现的计算需求和趋势，认为毫末的速度，站在了趋势一方。

△毫末智行“天团”：董事长张凯（左二）、CEO顾维灏（右二）、COO侯军（左一）、CIO甄龙豹（右一）所以毫末速度的秘诀是什么？董事长张凯这次开门见山给出了结论性答案—— 坚定地走渐进式发展路线。在自动驾驶的3.0时代，辅助驾驶是通向自动驾驶的必由之路。张凯表示，目前中国已成为全球智能汽车主战场，预计到2025年，高阶辅助驾驶搭载率可达70%，智能驾驶的时代风口，避无可避。

之所以确认辅助驾驶是通向自动驾驶的必由之路，是因为数据驱动在其中的核心作用。张凯强调，渐进式路线是数据积累的最佳路径越来越被行业所公认，成为自动驾驶公司的普遍发展方向。

毫末模式、毫末速度，就是对于渐进式路线的坚定实践的结果，也是自动驾驶行业最快1000天的速度之源。接下来的问题是如何加速、且可持续？ Attention大模型加速自动驾驶终局？

靠MANA（雪湖），毫末自研建立的国内首个自动驾驶数据智能体系。其中包含了数据获取、传输、感知、计算、验证等多个子模块，可以实现数据从输入到输出的迭代闭环，这也是毫末可以快速迭代、持续加速的保障。在HAOMO AI DAY上，毫末披露了MANA的最新数据，截至2022年9月，MANA学习时长超过31万小时，虚拟驾龄相当于人类司机4万年。

毫末智行CEO顾维灏，还揭秘了MANA如何持续进化的秘诀。一是来自产品和落地挑战的作用力。二则是不断吸收最前沿创新技术。比如在城市场景的落地中，就存在着4类场景难题、6大技术挑战。

其中场景难题主要包括“城市道路养护频繁”、“大型车辆密集”、“变道空间狭窄”、“城市环境多样”等。与之相对应会产生6大技术挑战：如何在自动驾驶领域应用大模型？如何让数据发挥更大的价值？如何使用重感知技术解决现实空间理解问题？如何使用人类世界的交互接口？如何让仿真更真？如何让自动驾驶系统运动起来更像人？

在4大场景6大挑战之下，毫末智行对MANA的感知智能和认知智能都进行了针对性升级调整。首先，数据标注。通过使用大规模量产车无标注数据的自监督学习方法，可以实现模型效果的有效提升，相比只用少量标注样本训练，训练效果提升3倍以上，可以更高效完成训练，更好适应感知需求。

其次，增量式数据学习方法。针对新增数据，抽取部分训练数据构成混合数据集，而不是新旧数据区别对外的方法，更追求新数据的拟合和新模型对齐旧模型的输出，这样能让整体算力节省80%，响应速度提升6倍，也能避免量产车规模化产生数据后，无法兼顾规模和效率。

第三，重感知轻地图，告别高精度地图依赖。通过用时序的Transformer模型在BEV空间上做了虚拟实时建图，使得感知车道线的输出更加准确和稳定，让城市导航辅助驾驶不必依赖高精度地图——这实际也是更快更低门槛落地城市导航辅助驾驶的必备能力。

第四，车辆信号灯识别。通过车端感知系统升级，对车辆刹车灯、转向灯状态进行专门识别，让驾驶员在处理前车急刹、紧急切入等场景中更安全和舒适。

第五，仿真系统进化。针对城市最复杂场景——路口，在仿真系统中引入高价值的真实交通流场景，与阿里云、德清政府合作，将路口这一城市最复杂场景引入仿真引擎，构建自动驾驶场景库，通过自动驾驶的真实仿真验证，时效性更高、微观交通流更真实，效破解了城市路口通过“老大难”问题。

值得注意的事，这是中国首个基于车路协同云服务的大规模自动驾驶场景库，也是中国第一个使用交通数据生成的自动驾驶场景库，对外发布和应用，也标志着中国自动驾驶来到了新阶段。最后，拟人化认知。面对城市路况，如何让驾驶决策更像人类是公认的体验难题。毫末的方法则是通过对覆盖全国的海量人类驾驶进行深度理解，学习常识和动作拟人化，让系统能够结合实际情况选择最优路线保证安全，体感上也更像老司机。

以上，就是毫末在系统量产上车之后，获得的数据和场景的反馈作用力。而在另一端，毫末延续本色，把AI最前沿创新技术的吸收作为进步的另一重保证。现如今，大模型和Transformer落地应用自动驾驶已是业内所有玩家的共识，但熟悉行业前情的人或许多少还有印象，最早把Transformer作为新手段用于感知的，正是毫末。最新前沿判断方面，顾维灏此次特别强调了Attention机制下的大模型带来的惊喜。

Attention大模型背后的机制，主要是用统一模型的思路解决问题，告别不同AI任务使用专门模型的范式。这种机制其实早在2014年便已经提出，但主要在NLP领域被应用，直到2020年起在计算机视觉领域也取得明显突破，从谷歌的VIT到微软的SwinTransformer，轻松刷爆各大排行榜。基于Attention机制的Transformer结构，更是在各种通用任务中表现惊人，展现出有效的通用AI模型范式的潜力。

而且Attention机制结构简洁，可以无限堆叠基本单元得到巨大参数量模型，随着参数提升效果也在提升。顾维灏认为，基于Attention大模型，辅助驾驶获得的大规模人机共驾数据就有了更高效地转换，随着量产车交付和上路，数据量不仅大而且足够多样，就能更快抵达自动驾驶终局。

这也是毫末认为“辅助驾驶是通往自动驾驶的必由之路”的技术底层自信，现阶段没有比辅助驾驶能更高效地积累到足够规模和多样性的数据。但欲享Attention大模型之利，就得解决其落地之不易。最核心的就是超大参数对于算力的需求：高需求、高成本，高落地难度，让摩尔定律不再有效。

顾维灏透露，毫末的方法是通过低碳超算来降低训练成本，通过改进车端模型和芯片设计来实现车端落地。云端和终端两头并举，两头优化。于是毫末超算中心也正式亮相，成为首个构建超算的自动驾驶公司。毫末方面还透露，毫末超算中心的目标是满足千亿参数大模型，训练数据规模100万clips，整体训练成本降低200倍。

自动驾驶的3.0时代？量产、规模化、数据智能…… 这是毫末智行谈到最多的词、强调最多的词，也是对于自动驾驶发展阶段的最新认知的总结。

在自动驾驶的落地探索征程中，有过路线的划分，比如Waymo为代表的终极派和特斯拉为代表的渐进派；有过传感器的阵营，如激光雷达阵营和纯视觉阵营；甚至以商用模式为基准，还有To C、To B和To G的划分。但如果从第一性原理出发，有没有大一统的标准和审视？毫末智行认为：有，而且只有一个标准：数据。

按照数据的规模，也能把自动驾驶探索大道至简划归为三个时代： 1.0时代，硬件驱动为主，规模历程在100万公里左右，主要感知方式是激光雷达，认知则依赖人工规则。 2.0时代，软件驱动开始发挥作用，规模可以累积到1亿公里，感知开始融合，但依然是不同传感器单独输出的结果，认知方面依然人工规则占主导，开始用小规模小数据实现更好的预测和规划。 3.0时代，数据驱动为核心，硬件和软件在这里实现了大一统，感知也实现了多模态传感器联合输出的大一统，认知上可以实现依靠大模型大数据拥有可解释的场景化驾驶常识，能够驱动1亿公里以上的数据迭代。实际上，按照毫末提出的三个时代划分，不仅很多过去的自动驾驶现象能得到解释，比如1.0时代堆砌了激光雷达的Robotaxi为何还会有低级事故，又比如2.0时代量产车上的高速环路导航辅助驾驶产品的体验差异……以及特斯拉AutoPilot和FSD的体验确实在日拱一卒、不断得到优化。所以更重要的是，毫末提出的这种数据维度的划分，真正能让自动驾驶流派和演进万佛朝宗，业内和业外，都可以有更加客观的坐标和参考。

以前，衡量自动驾驶的技术发展水平，有过VC认可的维度，有过自报MPI的维度，有过体感体验的维度，也有过路测牌照的维度…… 但无一例外都是偏向主观的维度。只有量产基础下的数据维度，才接近AI跃迁的原理，才是更加客观的维度。而且这也是自动驾驶第一阶段竞速的结果，也是量产落地被作为自动驾驶中场哨的原因。有意思的是，随着数据智能的自动驾驶3.0提出，自动驾驶领域已然无壁可面。无论哪一路线，无论哪个阵营，最核心的竞争力都已经被放在了明面上—— 有多大规模的数据？有多高效率的数据获取、训练和利用的能力？这关乎迭代速度，也关于能耗、成本和赢得终局的加速度。数据智能的能力，就是衡量自动驾驶公司核心壁垒的指标。数据智能的能力，就是自动驾驶新阶段的分水岭。其实这种分水岭效应，之前已经在更受关注的路线之争中展现。

特斯拉的价值，在产能问题被上海解决后得到了完全认可，股价和市值一飞冲天，马斯克个人登顶地球首富，AutoPilot和FSD技术能力越来越强……而且随着量产车上路越多，获取数据的规模越大场景越丰富，这种能力迭代和进化就还会持续。作为对应，这波自动驾驶浪潮的开创者Waymo，估值却被一而再下调，落地和推进速度一而再delay，获取数据的规模和多元性——没能展现出更大的增长趋势。

不过，上述已经展现的这种分水岭效应，之前更多被作为特斯拉和Waymo的“私人恩怨”看待，遮盖了背后反应出的本质问题。现在，摸着特斯拉过河的毫末智行，在敢于天下后的实践成果基础上，把渐进式、辅助驾驶更快赢得自动驾驶终局的道理喊得响亮，并且用自动驾驶3.0的判别式，验证自动驾驶公理下的新定律。这代表着自动驾驶的终局之战已经拉开了帷幕，也意味着整个自动驾驶江湖，又到了重新洗牌、重估位次的时候。至少，是时候提出这个问题了。 — 完—