李想说的“理想智驾2024年成为绝对头部”真要来了!
1月16日,理想汽车搭载“高速端到端”和行业首创的“AI推理可视化”功能的OTA7.0版本正式向AD Max用户全量推送,成为国内首家、全球唯二实现高速+城市全场景端到端的车企,另一个则是自动驾驶的领先者特斯拉。
理想表示,自OTA 5.0版本切换至BEV架构并推出城市NOA起,理想便对AD Max启用了独立的版本号管理。在过去一年中,理想共完成了12次AD Max的重大更新。
为了使用户更清晰地感知智能驾驶的升级变化,此次OTA 7.0升级中,AD Max的内部智能驾驶版本号将向用户展示,智能驾驶版本升级为AD Max V13.0。
长期以来,被视作“智驾领域后来者”的理想汽车其实在今年5月才开启无图NOA内测,仅仅8个月时间就完成了“全场景端到端”的能力释放。
这意味着,理想汽车短时间内就实现了智驾技术的飞跃发展,完成了从追赶、持平到领先的追越,进入了世界第一梯队的智能驾驶水平。
作为理想L6 Max车主,驾仕派回顾了提车后的这6-7个月时间,从7月理想OTA 6.0 推出的无图NOA,到10月OTA 6.4版本全量推送端到端+VLM智驾,以及本次OTA7.0的全场景端到端+AI推理可视化,几乎每个大版本都进行了冲锋体验,更深刻感知到了理想汽车在高阶智驾能力上“以月为单位”的提升。
那么,为什么理想汽车可以在智驾领域做到如此快速地迭代、完成后来居上?作为中国汽车市场首批“吃到”基于one-model端到端+VLM“螃蟹”的用户,借着驾仕派在抢先升级、体验到理想汽车全场景端到端+AI推理可视化的契机,我们也想分享一些理想最新版本的实际体验和对理想汽车智驾发展的思考。
01
全场景端到端+AI推理可视化究竟是什么?
从字面上来理解,全场景端到端即城市、高速环路、高速路等场景都采用一体化的端到端技术架构,而AI推理可视化则是让用户直观地看到理想汽车这套智驾系统如何捕捉路况信息并做出选择。
如上图,即是AI推理可视化的界面:
1、我们可以看到中间Attention窗口中类似热感应的区域,代表了理想这套端到端系统对人、车、路沿等信息的关注度差异;
2、而图中E2E窗口则是端到端技术的体现,显示了端到端技术实时推理出的10种模态轨迹,系统会选出概率最大的作为最优的决策轨迹;
3、VLM窗口则是展示出它读取的路况信息,例如道路标识等,用作分析复杂路况。
换句话说,理想汽车现在把整套智驾系统的感知和决策逻辑展示给了用户,用户可以更清晰地看到系统是怎么做出的决策。这样可以让驾驶者对理想的智能驾驶系统有更多的信心、放心让车辆自己开。
这里面很有意思的地方在于,我们明显可以从界面上看到端到端和VLM是两套不同的系统。端到端给出的一系列运行轨迹的概率,而VLM系统则是通过进行了“自我对话”,把车辆自己“看到”的内容以图片输入、然后输出文字决策。
其实,VLM系统是理想汽车在智驾技术路线上和特斯拉最大的区别。
理想汽车自动驾驶研发副总裁郎咸朋就说:“我们在做技术方案时充分参考了世界上所有的先进方案,但始终无法解决一个问题是,当一套自动驾驶或智能驾驶系统,它工作时如果遇到之前没有见过的场景,应该怎么处理?我们认为就是端到端+VLM,就是系统1+系统2的方式,很好地模仿人类大脑的工作方式。”
你可以把VLM系统理解为一个专门处理复杂场景的系统,它的思考慢一些,但是更准确一些。
比如遇到高速施工道路,或者无法知晓什么是公交优先道、什么时候是可变车道时,端到端模型就会直接开过去。但是VLM却可以通过视觉感知识别,然后告知端到端系统这里是什么情况——比如施工道路车辆需要往左绕行、公交优先道不能通行、潮汐车道现在能不能开——再由端到端系统做出决策和执行。
这时候你还可以看到理想汽车在端到端路线上的一个理念,相比于目前中国市场上其他端到端的智驾方案,理想汽车是基于one-model的端到端技术架构。
所谓“one-model”也就是一段式,直接把传感器收集到的信息放到大模型里面,然后输出执行策略,而传统方式则是感知-预测-规划-控制四个步骤,就算是其他友商同样到了端到端阶段也使用的是感知+预测规控决策两段式模型。
one-model的优势就像传话游戏的人数上限改为了1,即所有感知硬件收集到的信息直接用来做出判断和行动,省去了中间传递可能存在的信息丢失,它不再依靠过去数据形成的模块化规则驱动,而变成了数据直接驱动。
“我们要做端到端时就给自己定了一个目标,一定要用纯数据驱动的方式来做这件事情,而不是结合了之前的规则来做,所以说它的性能上限会非常高。”郎咸朋解释了为什么要用one-model来做端到端,这也就能够理解为什么理想汽车很快实现了高速端到端的能力。
02
全场景端到端+VLM带来了什么?
说回实际体验,这次升级OTA7.0之后理想L6的AD Max体验更为顺滑,更像是“类人”驾驶风格。比如我们看到很多新势力在提到端到端智驾时往往会提到重刹率、接管次数、平顺性等热词,这些恰好也是真实影响用户在使用智驾系统时体验的主因。而理想汽车这套「全场景端到端+AI推理可视化」更新以后,以下四个场景我们认为非常具有代表性。
场景一:
当智驾系统决定变道超车,遇到侧后方车辆突然加速靠近,过去的智驾系统往往很难根据实时情况做出调整,要么继续强行变道,要么急减速、急打方向,这其中就存在追尾或撞到旁边车辆等安全隐患。而OTA7.0之后,我们发现它在变道途中能更像老司机一样行驶平稳,没有重刹或急打方向,这样不仅让变道效率变高,且更安全、体感更好。
场景二:
在使用城市NOA过程中,如果识别到道路限速为60km/h,那么此前的智驾版本车辆加速感会比较明显,而更新后,同类的场景下,车辆更多时候会均匀提速并正常进行跟车或均速行驶,驾驶策略更类人。
场景三:
面对成都道路切换较为复杂的人南立交下二环高架,之后需要跨多车道向右并道、驶入辅路的场景,大多数品牌的高阶智驾能力不足以应付这样的场景。理想在OTA7.0版本更新之后,我们发现它现在可以在等待右侧直行车辆通过后,自主切换到右转的辅路上行驶,并且会及时打开右转向灯提醒后车,还可以进行“变道博弈”,通行效率明显提升。
场景四:
更新OTA7.0之前,车辆从城市道路进入高速时,尽管已经实现了识别ETC自主通行,但是因为之前版本的高速智驾还是基于规则和先验信息的,所以面对城区/高速切换点时往往还是需要驾驶者接管。但是这次OTA7.0版本升级带来了高速端到端,用户可体验到NOA在城市、高速全场景更丝滑无感的智驾,比如成都机场高速收费站前后没有明确车道线,我们驾驶理想L6也能够顺畅行驶。