奔驰G级 全部在售 2024款 2023款 2022款 2021款 2020款 2019款,成都奔驰G级团购优惠29万 欢迎到店试驾
2024款奔驰G500内饰...
事实就是如此,电动车相比燃油车最大的体验差异就是智能化,而且随着各式各样AI大模型的上车,拥有澎湃算力的电动车还会将优势进一步扩大。
随着竞争的加剧,我们能够明显感知不同车企之间的技术实力的确有高下之分,最终左右体验、左右技术实现的,还得是AI大模型。而谈到AI大模型,背靠百度的极越可能更有话语权,甚至于他们的技术分享活动直接命名为“AI Day”,首款产品也被称为“汽车机器人”。
对此我只能说,极越确实有这样的底气。在3月25日举行的AI Day活动中,AI大模型作为关键词贯穿了整个发布会,尤其是关键的智驾、语音识别两大领域,AI大模型仍在散发着惊人的魅力。
简单总结一下。3月25日晚的活动大致可以分为三个部分,首先是纯视觉智驾算法的继续升级,然后是“贤内助”百度地图的赋能,最后则是端侧大模型赋能下语音助手的能力升级。这些技术背后自然有大模型的帮助,但极越和百度本身的技术应用,也颇具前瞻性。
视觉算法的全面升级极越是目前市面上唯二坚持纯视觉智驾方案的电动车企业,尤其是在特斯拉FSD未能入华的情况下,在中国市场上多了一份独特意义。
当然,纯视觉算法如果应付高速高架这些相对简单的场景肯定是够用了,但极越的目标肯定是PPA辅助驾驶系统“全国都能用”,如此一来继续推进纯视觉算法的提升就变得非常重要。
这一次的AI Day上,极越向我们介绍了是如何利用AI大模型赋能让纯视觉算法更加聪明,已经为即将到来的城区PPA功能做好准备。
升级点其一针对OCC,也就是我们常说的“占据网络”,这是车内智驾系统理解真实世界的重要手段,极越想的是进一步提升纯视觉方案OCC技术的能力。极越提到,在数据训练的场景中他们部署了三种方案,分别是应对远距离视觉识别场景的“RIFLE”、中距离的“PISTOL”和近距离的“DAGGER”,这三种训练方案分别融入了不同波长的激光雷达,利用激光雷达生成的点云图,帮助视觉算法OCC更好地了解真实世界。
是的,在车载端使用纯视觉智驾方案的极越也有融入激光雷达,只不过是在数据训练的场景中。而针对不同视距的数据训练能够进一步提升视觉OCC的感知能力,让“眼神”更加锐利。
其次极越通过算法逻辑的升级让智驾系统能够理解路面物体的“时序关联”和“速度估计”,背后融入了一定的算法逻辑,让系统具备推理能力。简单来说,传统的方案是系统见到什么就是什么,不能联想和推理出同一物体具备移动能力,在被遮挡消失后还会出现,但现在极越的智驾系统则具备如此能力,能够预判运动物体的移动轨迹。
第三点能力的进化和百度地图有关,车辆在形式过程中也会实时收集道路信息,用不断建图的方式来不断补充道路数据,还能持续地保持自我训练。最终在体验上,可以做到只要百度地图覆盖就能使用PPA辅助驾驶,不分高速城区,这也是PPA技术“全国都能开”的重要基础之一。
最后一点是系统本身对场景理解、场景决策能力的提升,可以分成两个细分点。场景理解是指,PPA系统通过分析能够判断道路交通参与者所处的状态还有行为模式,判断为横穿马路的就要让行,违停的就该绕行。
决策能力主要体现在道路博弈上,比如汇入汇出、应对加塞等场景的处理更接近老司机。这些能力背后离不开大模型的支持,极越提到了“智驾数据生产线”的概念,用各种方式采集而来的道路数据会交由大模型进行处理,或是提高精度或是进行清洗,最终这些高品质的数据能够很好地帮助智驾系统了解、学习真实世界的交通运作模式,且懂得如何反应。
实际上借助AI的能力来训练AI这种生产模式并非极越首创,但如此积极应用AI大模型的恐怕就极越一家:一方面是百度技术体系带来的思维方式,另一方面也是强大的算力基建支持——三大数据中心拥有2.2EFLOPS的GPU算力、30PB的缓存数据,相信这些支持才是极越的底气所在。
底层能力的提升可以明确一点,百度地图是PPA智驾系统的能力基础,其中一个很重要的贡献是LD地图(车道级导航地图),一方面能够满足智驾需求,另一方面又不需要高精地图那样的重资产投入。
官方介绍,LD地图的来源不像高精地图那样需要采集车全程采集,而是借助ViT技术由自动驾驶的视觉感知大模型生成而来。百度强调,LD地图是“因自动驾驶视觉感知大模型而生”,它 很好地解决了当下智驾系统过度依赖高精地图的问题,进一步拓宽的智驾的应用范围。
而反过来的,LD地图的出现也为百度地图带来了不分道路的车道级导航功能,最终达到了“百度地图能用车道级导航,极越就能使用PPA”这样一石二鸟的结果。
往长远地说,极越和百度地图之间的合作还会出现“滚雪球”效应,9000万的百度地图用户源源不断地为极越提供道路数据,而极越用户行驶得越多,就越能帮助百度地图形成道路建模,完成数据的闭环。
在安全性能上,百度地图的道路交通信息也能为极越智驾“开天眼”,实际上这也是一种更轻量化的“车路协同”智驾模式。
我们知道百度是国内为数不多开展L4 Robotaxi运营的企业之一,而且主要的方案就是“车路协同”,不过和L4场景相比L2+始终要轻量级一些,所以不需要道路传感器的参与,光靠地图信息就足以让极越PPA智驾灵活应对。
语音识别脱胎换骨介绍完了智驾的动态后智能座舱也不能缺席,这一次的AI Day重点讲了他们是如何提升语音助手能力的。
最重要的是核心战略,极越做语音助手和其他品牌最大的不同在于将算力资源部署到了端侧而非云端,由此规避了传统语音助手可能出现的网络不稳、速度慢、算力有限和隐私风险四大问题。
然而想要将语音助手完全部署在端侧我们也知道最大的瓶颈来自于算力,尤其是CPU算力根本无法胜任复杂的自然语言处理工作,所以通过算法和技术逻辑手段降低端侧算力压力非常重要。
极越这里的做法首先是充分调用NPU算力,让整个语音交互系统都交由NPU处理,借助大模型强悍的计算能力解决传统机器计算做不到的事情,规避了CPU算力不足的问题。其次是算法的创新,百度应用了完全独立研发的SMALT2技术,将多语种、多方言和多场景的数据统一建模,一次处理,进而提升端侧的语音识别率。
百度介绍,基于这些技术的提升能够让整体交互的耗时缩短到700毫秒以内,而语音识别的耗时仅为500毫秒。
极越语音能力的领先还体现在多模态的整合,简单来说就是系统能够结合嘴唇运动、实拍画面等多个信息对音频进行处理,哪怕收音环境七嘴八舌、充满各种噪声,系统也能准确理解目标音频。
极越提到,目前只有极越能做多模态整合交互方案,最核心的因素在于隐私保护。因为涉及画面,如果数据交由云端处理百分百会有隐私风险,然而极越将计算资源部署在端侧,所以能够规避隐私风险,实现多模态交互。
另一方面,百度也积极地借助端侧文本大模型的能力来提升语音交互对话能力,重点帮助系统理解模糊语音指令,或者给用户的指令发出修正建议。
综合来说,大模型的广泛应用的确让极越的语音交互能力得到了飞跃式的提升,我认为现场演示的视频已经有非常强的说服力。
智能化竞争开始分层活动的最后极越正式宣布OTA V1.4.0开始推送,包含两百多项新的能力,还进一步融合了文心大模型。从演示视频中我们可以见到,传统“语音助手式对话”完全被取代,我们能够轻松地与SIMO交流,上下文理解、场景跳转的能力大大增强。
目前行业中也有不少车载语音助手宣布整合AI大模型,但受限于大模型本身的能力这些表现都不太能让人满足,直到极越这里,我认为基本做到了我们想要的样子。
而通过这一次的AI Day我认为,智能化虽然是新能源车竞争的下半场,但智能化本身也迎来的下半场,有些技术在持续的技术投入或者科技公司撑腰的情况下开始展现优势,体验差距日趋明显能够让消费者轻松感知到哪些是好,哪些是差。
一言蔽之,智能化的竞争也开始分层了,领跑的第一集团已经浮出水面。只论技术能力和储备的话,我相信极越肯定会是第一集团中的一员。
但回到整车的角度,我认为极越在智能化方面的努力还不足以让他们树立起有利于产品销售的市场认知,一方面可能源自于极越本身成立时间较短、产品知名度还不太高,另一方面也源自于市场对智能化的认可程度、接受程度还有待提升。
如果拉长时间线来看,智能化可以肯定是未来三到五年内主宰新能源车市场的关键,但对于大多数车企,包括极越,能够活到那个时候才有故事可讲。
和小鹏、问界这些借助智能化能力取得一定市场口碑的品牌相比,我认为极越还缺乏足够的市场说服力,如果未来能够开展更多和智能化相关的实测、对比,让技术得到市场验证、被大众消费者知晓,才能发挥出应有的能量。
不管如何,在百度的赋能下极越用自己的思考为我们描画了新能源车未来发展的另一种可能性,或许极越宣扬的“汽车机器人”真的不会离我们太遥远。至于更多的惊喜,还是留给北京车展吧。
当前非电脑浏览器正常宽度,请使用移动设备访问本站!