创造一个属于 AI、纯视觉的未来。
极越,只是一个成立将将 3 年的品牌。但我们在 2021 年构思这个产品的时候,就已经完全脱离了传统汽车的产品思路,完全不同于任何一个品类。 从燃油车到电动车,仅仅是能源形式的变化;而电动车到智能车,却是体验和使用方式的变化,只有 AI 驱动,才是真正的智能车。
这应该还是国内车企第一次面向公众举办 AI Day,上一次做这样的事情,还给我们留深刻印象的还是特斯拉。 AI Day,全国唯一用纯视觉方案实现全域高阶智驾,当这样的字眼碰撞在一起,极越可能是最像特斯拉的造车新势力了。 吉利浩瀚平台 + 百度 AI 技术协同赋能,极越 CEO 夏一平认为,极越具备了汽车机器人的三大核心能力,近乎自然交流的人机交互、依托于高阶智驾的自由移动以及能够自主学习的成长能力,极越汽车是行业里真正意义的 AI Car。
极越 CEO 夏一平 夏一平向我们透露,自去年 10 月底极越 01 正式上市以来,极越就展现出了强势的智能化渗透表现。 人机交互层面,极越用户的语音交互渗透率保持在 98%,平均每天每车就会进行约 63 次语音交互,这个频率接近是友商的 10 倍。
极越是中国唯一,世界唯二用纯视觉方案,实现全域高阶智驾的汽车品牌,而另一个则是特斯拉。极越高阶智驾系统 PPA 上市即实现交付,截至目前 PPA 智驾覆盖里程即将增加至 50 万公里。 覆盖范围增长,PPA 的车主渗透率也维持在了高位,在上海、北京、深圳以及杭州这些首批开城的城市里,PPA 的车主渗透率分别达到了 90.3%、84.8%、89.7%以及 85.1%。
智驾的智能化还体现在了行泊一体化,「极越 的APA 自动泊车渗透率达到 98%,其中平均揉库次数仅为 1.8 次,低于人类司机的泊车揉库次数,脚踏遥遥领先,极越拥有地表最强泊车能力」,夏一平说。 过去的 5 个月,极越通过车机助手 SIMO 累计收到超过 2.3 万次用户反馈,秒级的反馈效率能够实现的问题沟通解决,帮助极越建立完整的数据闭环。上市 5 个月内,极越累计完成了 5 次 OTA 推送,即将推送的 OTA V1.4 版本中,极越累计升级超过 200 项功能,解决 5300 个用户反馈问题,促成了良性的自我成长。
在 AI 的持续赋能下,极越的智能化保持着持续高效的迭代效率。Joe(夏一平)兴奋地向我们宣布:2024 年,极越汽车只要在有百度地图的地方,就能够使用 PPA 智驾功能,这也意味着极越的这一套纯视觉高阶智驾 PPA 即将「全国都能开」。
算力不设限,激光雷达做纯视觉导师如此高效的进步迭代,极越是怎么做到的?我们首先得从 PPA 的底层逻辑开始讲起。 2021 年,我们就在思考到底要做一款怎样的智驾产品?要做用户真正愿意用的,离不开的,能够成为购车头部考虑因素的产品。
百度智能驾驶首席研发架构师王亮认为,想要做成这样的智驾产品,要具备 4 个必要条件: 城区领航 全国范围的高时空覆盖 对用户体验的密切关注 数据飞轮促成的成熟迭代
而同时满足以上 4 个条件的智驾产品,行业内甚至不会超过 1/10。极越,是其中为数不多的成熟玩家。
王亮 在这四个维度上,极越 PPA 收获到了卓然的成效。根据极越官方给出的数据显示:PPA 领航辅助道路覆盖超过了 50 万公里,仅在 2024 年上半年极越就完成了超过 300 座城市的智驾开城。紧锣密鼓的开城过程中,极越完成了多达 324 次的 AI 模型迭代,优化 OTA 推送涉及超过 90 种智驾功能。 王亮向我们表示,看待一项新技术的发展速度,往往需要考虑到「初速度」和「加速度」。 迭代速度=初速度+「加速度」* 时间
「初速度」决定了技术原型的研发速度,在智驾技术开发过程中,激光雷达具有不小的初期优势,厘米级的精度能够有效降低开发的难度;而视觉则需要将二维恢复至三维,开发难度更高。 但一旦步入正轨,图像天然蕴含的信息量优势,会让纯视觉智驾技术具有更强、更敏捷的「加速度」,加之 AI 大模型的配合,纯视觉智驾技术路线的天花板会更高,相比激光雷达的技术思路,纯视觉智驾显然是条「先难后易」的道路。 坚持纯视觉智驾的极越,几乎重构了自动驾驶技术。 王亮进一步向我们透露,纯视觉方案所倚仗的摄像头硬件的采样点频是主流常规激光雷达的 160 倍,是最新激光雷达的接近 20 倍,摄像头所能采集的色彩、纹理等信息量更加丰富。
这么多的信息量,又如何设计算法提取信息?世间万物姿态万千,又怎样让模型掌握通用的泛化学习能力? 这要归功于百度 Apollo 全新自动驾驶视觉大模型 Vision Takes All(VTA Net)。大模型首先会对海量的驾驶场景进行「自监督训练」,图像会随机抹掉像素,并让视觉模型尝试还原恢复,提前让大模型对世界有更多的基础通用的理解,王亮把这种通用基础能力形容为视觉模型的「大底座」;第二步,大模型会针对性地做出如「景深识别」等专业性的训练。 在即将推送的 V1.4.0 版本中,极越 OCC 模型将会新增超过 1 亿帧数据,约有 72%提前使用到 1.4.0 版本的早鸟用户感受到了避障能力的显性提升。
除此以外,极越还将借助行泊全场景模型提升视觉 OCC 占用网络的「检测」能力。行泊全场景模型分为三大类: RIFLE「狙击步枪」模型,前向视距 200m,最高帧率 30fps PISTOL「手枪」模型,前向视距 120m,最高帧率 20fps,用以处理复杂城市道路场景,集中攻坚中远距离的博弈能力 DAGGER「匕首」模型,前向视距 30m,最高帧率 10fps,用以近距离肉搏,主要应对泊车场景
每个模型都有着对应的激光雷达产品作为训练「导师」,RIFLE 对应 1550nm 超长距激光雷达,PISTOL 对应 905nm 长距激光雷达,DAGGER 对应 905nm 补盲激光雷达。三维转二维,极越能全方位无盲区得到激光雷达的三维能力,行泊一体化的全场景大模型,同时也是业内首发。 检测、建图、跟踪测速、场景阅读能力全方位优化后,极越的下游决策规划能力跃升,能够更加自如处理诸如复杂城市道路、路口博弈、交互博弈以及连续避障变道等高难度动作。
「狙击步枪」、「手枪」、「匕首」三大场景模型 值得一提的是,王亮还向我们透露:百度目前坐拥北京、苏州、阳泉三大计算中心,仅投入到智驾的算力就累计达到了 2.2 EFLOPS,数据缓存高达 30PB,智驾有效训练时长占比 98%,百度对极越的算力投入并不设限。 一个多月前,电车实验室曾就智驾算力问题向王亮求证,王亮回应当时约有 5000 卡(H100)对等型号芯片投入到了极越的 AI 训练中来。 一件有意思的事情是,极越正在积极寻求生成式 AI 对智驾训练的帮助。极越的生成式 AI 具有「可控生成」的特点。在接收到 Robotaxi 无人车视频数据时,AI 可以将视角转化为极越的标准视角,并支持修改。 其二,根据文本、轨迹要素,Driving Diffusion 能够为极越生成一小段定制化路况视频帮助智驾训练。上一次展示模拟现实物理世界投入实际智驾训练的能力,也还是在特斯拉身上看到的。
正如王亮所说,智能驾驶时代并非虚幻,而是马上就会到来。
打通地图逻辑,指数爆炸的自我成长极越 PPA 很快全国都能开,还离不开百度地图的重要赋能。 在去年,「有图无图」仍旧是高阶智驾的最大争议。高精地图曾被行业认为是智驾开城的重要解决方案,但成本高昂的特点让许多车企望而却步。 百度副总裁尚国斌透露,仅是在广州完成一次高精地图的绘制,就需要付出上亿元的金钱成本,还不包括后期的维护、调整,而这也是图商、车企难以大规模启用,逐渐向「无图化」倾斜的致命原因。 百度,是国内唯一一家同时研发自动驾驶,并拥有地图能力的公司。
在车企逐渐向无图化妥协的过程中,安全还是必须要考虑的因素,百度的 LD 地图就是为了解决自动驾驶而生。
2020 年,百度在启动 LD 地图研发时,就将安全摆在了第一位。LD 地图不仅要帮助 L4 萝卜快跑无人车实现从区域级过渡至城市级,还要帮助极越城市智驾量产全国。 百度 LD 地图本质上是一张视觉感知大模型生成的地图,整个生成链路大致需要经过「采集-感知-建图-生成」的过程,百度向全国道路投放数百辆 L4 级别采集车,并通过大模型生成地图,颠覆了过往「99%人力生成地图」的生产方式,突破了高精度图无法大规模生产的难题。 智驾地图制作难点突破,PPA 的开城速度也跑了起来。去年上半年,百度开城速度约为一季度一城市,第三季度单季度能够开 30 座城市,截至今日,百度的开城速度是过去的 100 倍,成本是过去的 1/20,能够做到一天开一城。 目前,百度地图已经完成了全国 360 万公里的道路生成,LD 地图覆盖 360 个地级市,所有的 LD 地图数据都将与极越共同验证测试。 「百度地图有 6 亿用户,每天有接近 9 千万次导航在使用车道级导航,着意味着存在着大量用户的反馈。极越虽然目前的用户量还不大,但百度地图会帮助极越更新这个数据,成为最鲜活高效的地图」,尚国斌补充道。 此外,某种意义上 LD 地图还是智驾的安全冗余,百度地图能够为智驾带来三大图层。 经验图层:按照过往的行车轨道、经验,规划路线、速度,规避了高精地图墨守成规的不足,让智驾更拟人 安全图层:百度地图将会基于过去 2000 万起事故,做大量的分析,找到上万个事故频率较高的路口匝道,并对这些场景进行大量的精度增量,针对性比高精地图更强 实时图层:百度实时红绿灯几乎覆盖了全国 97%误差小于 1s 的信号灯,同时每天 10 万数量级的施工、事故动态数据也将会完全开放给极越,帮助极越汽车提前感知,做出更合理的路线规划。
通过 AI 帮助生成的 LD 地图,百度和极越打通了地图逻辑,跳脱品牌本身能够实现堪比「指数爆炸」级别的智驾成长。
百度副总裁尚国斌 LD 地图也将首次应用在极越未来的新版本,PPA 全国都能开只是一个基础起点,百度地图所见,PPA 即可开的版本预计将在今年的 Q2 季度正式推送。
有备而来的夏一平,在谈到「人-车-家智能生态」时候,还不忘略带火药味地反呛了一下行业,他称「极越基于大模型的人-车-家生态将率先落地,APP 已经是过去式,记住别买上一代的产品了,因为已经过时了」。
文章来源于车主指南,如有侵权请联系删除
|