正文内容 评论(0)
昨天北京强降雨,各位晚上下班没少折腾吧?
和大家一块堵在路上的,还有这两位——大众中国CEO贝瑞德,以及地平线创始人、CEO余凯博士:
俩这么大老板,低调到拼一辆大众ID.4下班。
但背后动机不「低调」:
不期而至的北京大雨,成了地平线高阶智驾实力展示最好的舞台。
地平线智驾,什么实力?
根据官方发布的信息,这轮北京强降水持续30个小时,城区平均降水量24.3毫米,地平线所总部所在的西北部30毫米左右,已经达到大雨级别:
这种极端天气对于普通人类司机已经构成很大挑战,明显昨天路上的各类突发事故多了很多,尤其是在不规则路口转弯、汇入汇出等等复杂场景。
但地平线SuperDrive依然全程无接管,成功在暴雨中应对了一系列复杂路况。
比如在一个红绿灯已经明显不起作用的拥堵路口,完成了一次和老司机没差的博弈+左转:
不规则的施工路段,SuperDrive也成功识别了可通行区域,顺利完成左转:
以及在复杂的车流中识别出了公交车专用道,即使变道避让,也可以看成是面对拥堵情况的综合判断变道:
针对突发情况,比如鬼探头、加塞等等,也能及时避让:
还有一个城市场景高难度挑战——环岛而且是一个不规则环岛:
说两点SuperDrive最亮眼的表现,首先是避让动作,流畅优雅,也就是没有急促的刹车、猛打方向这样的动作。
第二是变道动作,旁车道空间小,多数系统会放弃变道或减速等待,但SuperDrive能根据前方空间条件主动加减速或调整转向角度,创造变道机会。
总结一下,SuperDrive在北京暴雨的测试中表现出的最大特点,反而不是零接管,而是“拟人”——驾驶策略拟人,以及执行动作拟人。
之前我们说过,各种智驾测试视频,含金量其实各有不同。通常最真实可信的,是普通用户在日常使用过程中记录的真实体验,前后不太可能有调试或剪辑,相当于智驾系统的“闭卷”考试。
还有就是车企老板的直播、4S店试乘路线等等,一般会针对特定路线进行优化,但控制不了突发情况,属于提前划过重点的“半开卷”考试。
当然也有“开卷”了,就是最常见的发布会或者官方账号发出来的“XX公里零接管”类小视频,大家也能想到,这种材料从策划到成品,最忙的要数剪辑师了。
那么地平线SuperDrive系统在昨天北京大雨中的测试,属于哪个级别?
其实一个最关键的点就能看出来:地平线的拍摄计划,可能很早就做好了,可以从视频中不少恰到好处的第三视角机位看出来。但是,昨天北京的暴雨不是地平线能预料或掌控的。
属于老师本来给你划好了重点考四则运算,但到考场上发现题目变成了微积分。
因为暴雨恶劣天气,对传感器就是一个巨大的的挑战,摄像头采集的图像质量大幅下降,雷达也会传回更多的杂波点云,以及湿滑的路面对于规控也提出更高要求。
但地平线的高阶智驾方案SuperDrive,极其出色的应对了暴雨气候。
以及从官方发布时间也能看出来。昨天北京普遍降暴雨是在晚上五六点钟开始,但地平线官方夜里11点左右就火速发布,加班加点。
按照通常的剧本,拍智驾视频遇到这样的突发 ,要么延后拍摄,要么后期精剪一番晚些发。不得不说地平线的团队头很铁啊,车上带着自己的大老板,还有客户爸爸的大老板,直接就开干了…
不过从另一个角度考虑,也许对地平线来说暴雨来了反而更兴奋,等的就是这样一个机会。
对技术能力欠缺的玩家来说是挑战,但于能力够强的来说,暴雨是证明实力的绝佳case:偶发,且不可复制。
背后是什么技术支撑
刚刚我们把“变道”作为一个亮点单独说,为啥?
不拟人的变道策略,基本上就是屡试屡败,最后只能提示接管,错过出口,把高阶智驾体验搞得支离破碎。
但现实却就是这样:大部分量产高阶智驾,都是用手写规则应对变道场景,判断变道时机的策略和执行方式僵硬刻板,十分劝退。
所以,变道是直接区分NOA水平高下的试金石;用户层面,它是智驾“可用”与否最关键的因素。
因为说实话,识别红绿灯、行人,严格跟导航这些功能,只要数据到位,没啥难的,现在基本各家都能做的很好。
地平线一直强调SuperDrive“拟人”,就是能在这些细节上给智驾体验带来巨大提升。
两个最主要的技术手段:端到端感知架构,以及数据驱动的交互式博弈算法。
一个是为了智驾系统看的更清楚更明白,一个是让智能代驾的“脑子”更灵活更高效。
端到端感知架构的优势,是避免了模块化算法架构中,数据多级传递造成的“损耗”,算法模型一端直接输入传感器数据,另一端直接输出轨迹预测,包括本车的,也包括道路其他交通参与者的。
端到端体现在SuperDrive将动态、静态、OCC(Occupancy占用网络)三网合一,统一在一个Transformer架构下,不需要对感知数据进行抽象和逐级传递,“所见即所得”:实现感知端到端同时,又保证了每个子网络的可解释性。
实际上SuperDrive的算法基础,正是来自于智能车参考前几天刚介绍过的CVPR 2023最佳论文成果——UniAD,地平线学者一作。
动态、静态、Occupancy三网合一的感知端到端架构下,有效解决感知架构时延高、规则多、负载重的问题。
感知端到端网络输出的结果,会接着进入数据驱动的交互博弈算法,这一算法也是基于蒙特卡洛树搜索的端到端深度学习算法。
名震一时的围棋AI AlphaGo背后的主要技术之一就是蒙特卡洛树搜索。简单来说,它的基础是一个概率模型,所要求解的问题是某种事件出现的概率。
在智驾场景中,这个“概率”可以是对象来车轨迹、前车变道意图、变道时多个目标的运动轨迹等等…
蒙特卡洛树搜索会通过某种“试验”的方法,得到这种事件出现的频率,或者这个随机变数的平均值。
试验方法,可以是人为定义,不过地平线选择的是通过10000小时高质量驾驶数据来训练,让算法最大程度理解效仿人类老司机的驾驶方法。
这就是上面例子中SuperDrive果断干脆变道的技术核心。
算法之外,SuperDrive“拟人化”还有一个独特优势——软硬结合,征程6系列计算硬件,CPU、BPU()、GPU、全功能的MCU四芯合一。
单颗征程6旗舰即可支持感知、规划决策、控制、座舱感知等全栈计算任务。同时,高集成度令开发难度进一步降低。
J6这一代产品,BPU纳什架构是核心,概括来说是支持大参数AI模型在车端的部署运行。
所以SuperDrive在北京暴雨遭遇战中的优秀表现,其实是“一个时代有一个时代计算架构”这个核心思想的体现。
怎么解读
地平线在北京暴雨中用智驾送老板下班,确实挺厉害的,但有啥用呢?
地平线不是一直称永远作Tier 2,专注硬件吗?
其实透过SuperDrive能力本身,地平线展现出关键的几点。
首先是证明只有在技术体系上重构、变革才能彻底解决城市NOA量产普及问题。
SuperDrive是一个最好的样板间,而实现这个目标的基础,是新的征程6系列。
而从地平线本身来说,SuperDrive方案搭配征程6系列硬件,从智能车和自动驾驶算法演变的角度设计硬件架构,提出专门为端到端模型和数据驱动算法服务的新平台。
说明生态正成为智驾的壁垒和新护城河。
最后是对于大众以及其他国际OEM来说,与地平线合资合作已经不是秘密,而联合最近安徽金标大众强调的「自主权」…
合资和自主的力量对比,后续可能变数更多。
One more thing
余凯和贝瑞德乘坐的ID.4,是地平线高阶智驾方案SuperDrive的工程版,现在店里卖的ID.4量产车是没有这样的高阶城区NOA能力的。
不过这也直接证明,迪斯当年主导推动的大众新能源革命是多么的前瞻:
基础电子电气架构,仍然能支持近10年后的高阶智能驾驶功能。
迪斯的遗产,目测大众还能享用3-5年。
至于后续嘛,何小鹏又给大众续上了: