渐进派破壁:西有特斯拉,东有毫末智行!用数据智能推动自动驾驶历史进城

新闻 2022-09-21 雷刚
435

“辅助驾驶更快赢得自动驾驶终局”

雷刚 发自 副驾寺 非常AI | 公众号 QbitAI 不争了。 辅助驾驶是通向自动驾驶的必由之路,渐进式路线更快赢得终局。 在创办的第1020天,在第六个HAOMO AI DAY现场,这种态度被亮得明确,结论讲得掷地有声。此时此地此身,在实践成果和趋势再清晰不过的情况下,多年的自动驾驶路线之争,已再无争论的必要。 特斯拉开创的路线,国外以FSD公测开始上路,国内则被速度更快的面壁者推向了检验时刻,而且是一个更大的数据闭环模型启动时刻。 这个在中国直道超车的面壁者就是毫末智行,现在还旗帜鲜明把行业公理真谛打上公屏:遵循数据智能,依靠数据智能,实践数据智能,这是驱动自动驾驶驶入终局的第一性原理。 并且随着自动驾驶相关的软硬件进入量产期,行业的探索来到了规模化进城时刻——新的分水岭,同样再清晰不过。 整个自动驾驶,将进入以数据智能驱动的3.0时代 大道至简,方法论清晰,自动驾驶已无壁可面。 实践成果是展现真理的唯一标准 毫末智行的面壁成果是通过实践成绩展现的。 自创办以来,毫末智行刚度过了第1000天,却已经快速坐稳了中国量产自动驾驶第一名。 量产自动驾驶,对应的是无人驾驶,指的是把自动驾驶能力应用于量产车落地的实践。 在乘用车领域,毫末智行在短短2年多的时间内,从无到有推出了三代乘用车辅助驾驶产品HPilot,两年6次OTA升级,实现搭载超过十款乘用车型量产落地,同时并行30个项目异步开发。 包括魏牌摩卡、魏牌拿铁、魏牌玛奇朵、坦克300、坦克500、哈弗神兽、拿铁DHT-PHEV等在内的上市车型,均已完成上车搭载。此外摩卡DHT-PHEV激光雷达版、欧拉闪电猫、欧拉芭蕾猫、全新一代长城炮等则正在陆续交付。 于是截至2022年9月,毫末用户辅助驾驶行驶里程突破1700万公里,在中国量产自动驾驶阵营坐稳第一名。 并且这只是规模化落地的开始,毫末智行方面称,到2022年底,HPilot预计搭载车型近30款,未来搭载车型达到百万量级。 同时自动驾驶历史进城号角,也已经被吹响。 就在成都车展上,魏牌宣布搭载毫末智行城市NOH的全新摩卡DHT-PHEV激光雷达版,9月计划量产,年内发售,上市即交付 城市NOH(Navigation On HPilot),正是毫末HPilot3.0的核心主打功能,计划让乘用车实现城市开放路况下的端到端智能驾驶 而一旦交付,也意味着将毫末城市NOH将成为中国第一个大规模量产的城市导航辅助驾驶,将再次刷新量产自动驾驶乃至整个中国自动驾驶赛道的纪录。 在现场,产学研大牛对毫末速度、模式和成绩,不仅表达了一致的认可,还认为毫末所代表的是自动驾驶产业化落地的前进方向。 中国工程院院士、清华大学教授、清华大学智能产业研究院(AIR)院长张亚勤说,毫末成立1000天取得的成就令人瞩目,而且坚持举办的HAOMO AI DAY也是国内非常难得的聚焦AI自动驾驶的技术盛宴,搭建起了一个行业技术交流平台。 阿里巴巴集团副总裁、知名AI框架大牛贾扬清,则认为毫末正在自动驾驶领域推动新的AI技术工程范式,特别是数据智能体系和自动驾驶超算打造,或许会成为全行业内都有影响力的体系。 知名AI芯片公司寒武纪创始人陈天石,分享了云端和车端正在展现的计算需求和趋势,认为毫末的速度,站在了趋势一方。 △毫末智行“天团”:董事长张凯(左二)、CEO顾维灏(右二)、COO侯军(左一)、CIO甄龙豹(右一) 所以毫末速度的秘诀是什么?董事长张凯这次开门见山给出了结论性答案—— 坚定地走渐进式发展路线。在自动驾驶的3.0时代,辅助驾驶是通向自动驾驶的必由之路。 张凯表示,目前中国已成为全球智能汽车主战场,预计到2025年,高阶辅助驾驶搭载率可达70%,智能驾驶的时代风口,避无可避。 之所以确认辅助驾驶是通向自动驾驶的必由之路,是因为数据驱动在其中的核心作用。 张凯强调,渐进式路线是数据积累的最佳路径越来越被行业所公认,成为自动驾驶公司的普遍发展方向。 毫末模式、毫末速度,就是对于渐进式路线的坚定实践的结果,也是自动驾驶行业最快1000天的速度之源。 接下来的问题是如何加速、且可持续? Attention大模型加速自动驾驶终局? MANA(雪湖),毫末自研建立的国内首个自动驾驶数据智能体系。 其中包含了数据获取、传输、感知、计算、验证等多个子模块,可以实现数据从输入到输出的迭代闭环,这也是毫末可以快速迭代、持续加速的保障。 在HAOMO AI DAY上,毫末披露了MANA的最新数据,截至2022年9月,MANA学习时长超过31万小时,虚拟驾龄相当于人类司机4万年。 毫末智行CEO顾维灏,还揭秘了MANA如何持续进化的秘诀。 一是来自产品和落地挑战的作用力。二则是不断吸收最前沿创新技术。比如在城市场景的落地中,就存在着4类场景难题、6大技术挑战 其中场景难题主要包括“城市道路养护频繁”、“大型车辆密集”、“变道空间狭窄”、“城市环境多样”等。 与之相对应会产生6大技术挑战: 如何在自动驾驶领域应用大模型?如何让数据发挥更大的价值?如何使用重感知技术解决现实空间理解问题?如何使用人类世界的交互接口?如何让仿真更真?如何让自动驾驶系统运动起来更像人? 在4大场景6大挑战之下,毫末智行对MANA的感知智能和认知智能都进行了针对性升级调整。 首先,数据标注。通过使用大规模量产车无标注数据的自监督学习方法,可以实现模型效果的有效提升,相比只用少量标注样本训练,训练效果提升3倍以上,可以更高效完成训练,更好适应感知需求。 其次,增量式数据学习方法。针对新增数据,抽取部分训练数据构成混合数据集,而不是新旧数据区别对外的方法,更追求新数据的拟合和新模型对齐旧模型的输出,这样能让整体算力节省80%,响应速度提升6倍,也能避免量产车规模化产生数据后,无法兼顾规模和效率。 第三,重感知轻地图,告别高精度地图依赖。通过用时序的Transformer模型在BEV空间上做了虚拟实时建图,使得感知车道线的输出更加准确和稳定,让城市导航辅助驾驶不必依赖高精度地图——这实际也是更快更低门槛落地城市导航辅助驾驶的必备能力。 第四,车辆信号灯识别。通过车端感知系统升级,对车辆刹车灯、转向灯状态进行专门识别,让驾驶员在处理前车急刹、紧急切入等场景中更安全和舒适。 第五,仿真系统进化。针对城市最复杂场景——路口,在仿真系统中引入高价值的真实交通流场景,与阿里云、德清政府合作,将路口这一城市最复杂场景引入仿真引擎,构建自动驾驶场景库,通过自动驾驶的真实仿真验证,时效性更高、微观交通流更真实,效破解了城市路口通过“老大难”问题。 值得注意的事,这是中国首个基于车路协同云服务的大规模自动驾驶场景库,也是中国第一个使用交通数据生成的自动驾驶场景库,对外发布和应用,也标志着中国自动驾驶来到了新阶段。 最后,拟人化认知。面对城市路况,如何让驾驶决策更像人类是公认的体验难题。毫末的方法则是通过对覆盖全国的海量人类驾驶进行深度理解,学习常识和动作拟人化,让系统能够结合实际情况选择最优路线保证安全,体感上也更像老司机。 以上,就是毫末在系统量产上车之后,获得的数据和场景的反馈作用力。 而在另一端,毫末延续本色,把AI最前沿创新技术的吸收作为进步的另一重保证。 现如今,大模型和Transformer落地应用自动驾驶已是业内所有玩家的共识,但熟悉行业前情的人或许多少还有印象,最早把Transformer作为新手段用于感知的,正是毫末。 最新前沿判断方面,顾维灏此次特别强调了Attention机制下的大模型带来的惊喜。 Attention大模型背后的机制,主要是用统一模型的思路解决问题,告别不同AI任务使用专门模型的范式。这种机制其实早在2014年便已经提出,但主要在NLP领域被应用,直到2020年起在计算机视觉领域也取得明显突破,从谷歌的VIT到微软的SwinTransformer,轻松刷爆各大排行榜。 基于Attention机制的Transformer结构,更是在各种通用任务中表现惊人,展现出有效的通用AI模型范式的潜力。 而且Attention机制结构简洁,可以无限堆叠基本单元得到巨大参数量模型,随着参数提升效果也在提升。 顾维灏认为,基于Attention大模型,辅助驾驶获得的大规模人机共驾数据就有了更高效地转换,随着量产车交付和上路,数据量不仅大而且足够多样,就能更快抵达自动驾驶终局。 这也是毫末认为“辅助驾驶是通往自动驾驶的必由之路”的技术底层自信,现阶段没有比辅助驾驶能更高效地积累到足够规模和多样性的数据。 但欲享Attention大模型之利,就得解决其落地之不易。 最核心的就是超大参数对于算力的需求:高需求、高成本,高落地难度,让摩尔定律不再有效。 顾维灏透露,毫末的方法是通过低碳超算来降低训练成本,通过改进车端模型和芯片设计来实现车端落地。云端和终端两头并举,两头优化。 于是毫末超算中心也正式亮相,成为首个构建超算的自动驾驶公司 毫末方面还透露,毫末超算中心的目标是满足千亿参数大模型,训练数据规模100万clips,整体训练成本降低200倍 自动驾驶的3.0时代? 量产、规模化、数据智能…… 这是毫末智行谈到最多的词、强调最多的词,也是对于自动驾驶发展阶段的最新认知的总结。 在自动驾驶的落地探索征程中,有过路线的划分,比如Waymo为代表的终极派和特斯拉为代表的渐进派;有过传感器的阵营,如激光雷达阵营和纯视觉阵营;甚至以商用模式为基准,还有To C、To B和To G的划分。 但如果从第一性原理出发,有没有大一统的标准和审视? 毫末智行认为:,而且只有一个标准:数据 按照数据的规模,也能把自动驾驶探索大道至简划归为三个时代: 1.0时代,硬件驱动为主,规模历程在100万公里左右,主要感知方式是激光雷达,认知则依赖人工规则。 2.0时代,软件驱动开始发挥作用,规模可以累积到1亿公里,感知开始融合,但依然是不同传感器单独输出的结果,认知方面依然人工规则占主导,开始用小规模小数据实现更好的预测和规划。 3.0时代,数据驱动为核心,硬件和软件在这里实现了大一统,感知也实现了多模态传感器联合输出的大一统,认知上可以实现依靠大模型大数据拥有可解释的场景化驾驶常识,能够驱动1亿公里以上的数据迭代。 实际上,按照毫末提出的三个时代划分,不仅很多过去的自动驾驶现象能得到解释,比如1.0时代堆砌了激光雷达的Robotaxi为何还会有低级事故,又比如2.0时代量产车上的高速环路导航辅助驾驶产品的体验差异……以及特斯拉AutoPilot和FSD的体验确实在日拱一卒、不断得到优化。 所以更重要的是,毫末提出的这种数据维度的划分,真正能让自动驾驶流派和演进万佛朝宗,业内和业外,都可以有更加客观的坐标和参考。 以前,衡量自动驾驶的技术发展水平,有过VC认可的维度,有过自报MPI的维度,有过体感体验的维度,也有过路测牌照的维度…… 但无一例外都是偏向主观的维度。 只有量产基础下的数据维度,才接近AI跃迁的原理,才是更加客观的维度。 而且这也是自动驾驶第一阶段竞速的结果,也是量产落地被作为自动驾驶中场哨的原因。 有意思的是,随着数据智能的自动驾驶3.0提出,自动驾驶领域已然无壁可面。无论哪一路线,无论哪个阵营,最核心的竞争力都已经被放在了明面上—— 有多大规模的数据?有多高效率的数据获取、训练和利用的能力? 这关乎迭代速度,也关于能耗、成本和赢得终局的加速度。 数据智能的能力,就是衡量自动驾驶公司核心壁垒的指标。 数据智能的能力,就是自动驾驶新阶段的分水岭。 其实这种分水岭效应,之前已经在更受关注的路线之争中展现。 特斯拉的价值,在产能问题被上海解决后得到了完全认可,股价和市值一飞冲天,马斯克个人登顶地球首富,AutoPilot和FSD技术能力越来越强……而且随着量产车上路越多,获取数据的规模越大场景越丰富,这种能力迭代和进化就还会持续。 作为对应,这波自动驾驶浪潮的开创者Waymo,估值却被一而再下调,落地和推进速度一而再delay,获取数据的规模和多元性——没能展现出更大的增长趋势。 不过,上述已经展现的这种分水岭效应,之前更多被作为特斯拉和Waymo的“私人恩怨”看待,遮盖了背后反应出的本质问题。 现在,摸着特斯拉过河的毫末智行,在敢于天下后的实践成果基础上,把渐进式、辅助驾驶更快赢得自动驾驶终局的道理喊得响亮,并且用自动驾驶3.0的判别式,验证自动驾驶公理下的新定律。 这代表着自动驾驶的终局之战已经拉开了帷幕,也意味着整个自动驾驶江湖,又到了重新洗牌、重估位次的时候。 至少,是时候提出这个问题了。 — 

相关文章