●发现了一位宝藏研究者,不知道为什么他的链接始终贴不上来,他zh ID:eatelephant,想看的更详细请移步,另外他也开通了知识问答。以下记录几个我比较关心的知识点,如果你只想了解概括,看我的也可。
●Occupancy和CNN最大的不同:不以识别为基础。CNN需要训练识别分类,是一个标准的判别模型Discriminator,而Occupancy根据视觉数据构对路况实时建模,通过哪些空间被占用来做路径规划。Occupancy并没有完全替代BEV,是并行两套算法,当遇到数据集内没有明确分类的情况,由Occupancy进行判别。
(相关资料图)
●Diffusion是上个月Elon提到的算法,他认为现在的FSD对测量行人的行为、肢体角度表现不好,主要原因是FSD的世界中一切都是小方块,测量微小的动作很困难。我在网上看到一个案例,一个骑自行车的人挥手示意车辆等待,被车完全无视了。Diffusion的原理是逆向图像被噪声的过程,在AI绘图上表现出色,已经替代了GAN,但在自动驾驶上怎么用还不清楚,希望今年的ai day有进一步解释。
●Occupancy上限比Lidar更高。Lidar需要和相机时间同步,外参对齐,延迟更大,这也是Lidar不能很好的解决鬼探头的直接原因;Occupancy输出为36HZ,Lidar大多数是10Hz,尤为重要的是,Occupancy生成的模型自带速度信息,我理解这相当于一个FMCW的Lidar,并且语义信息丰富的多,雷达点云稀疏的问题是一个特性,很难解决。目前的激光雷达都是TOF的,FMCW远未成熟,基于这个考虑,我已经清仓了Aeva。
●Occupancy是3D感知,车道线也是带有高差起伏的。通过最近小鹏的案例,HD map路径规划非常机械,车完全按照地图路径走,真成有轨电车了,但实际上人类并不会这么机械的开车。纯视觉转弯曲线规划比高精地图预埋要合理很多,长期的看,确实有SD地图就够了。
●一个冷的知识点:特斯拉通过视觉扫描建立了一套众包地图,但他没有实际应用,而是内化到了感知模型中。
●另一个知识点:在使用BEV模型之后,人工标注数量大幅减少,接近自动标注了,这里我就理解了李想总说的“有多少人工就有多少智能”的出发点,还是在于算法的进步。
●车云两端不是实时通讯,在过去的认知中,车云通讯的机制是Trigger,只有一些特定的的case会被回传,比如突然急踩刹车,比如自动驾驶突然退出,或者其他异常,这些触发数据被发送到云端。目前理解又进了一步,云端会训练云端离线模型和车端在线模型,再通过影子模式部署回车端,完成数据闭环。
●性能=硬件极限算力×软件效率×神经网络占用率,任何一个短板都会拉低整体性能;在此为nio感到担心,算力甚至可以说超极限,但另外两项严重制约了自动驾驶的能力,很有可能直到nt2整代退役4片orin也没有拉满。相较nio,特斯拉是走钢丝的典型流派,善于榨干最后一点算力,绝对均衡,够用就好,不会浪费每一个美元。
●Photon Count,原始光子计数,不经ISP处理,他的含义是使摄像头超越人眼,在强光和极暗光线情况下获得信息。
●特斯拉从RNN、CNN、Transformer+BEV,再到occupancy这样一路走来,战略极其坚定,进步也极快,引领了整个行业的前进方向。一叶知秋,技术革新带来机会,也带来风险,作为投资者研究的意义,并不是成为专家,而是避免点错科技树遭遇价值毁灭。
$特斯拉(TSLA)$$小鹏汽车(XPEV)$$蔚来(NIO)$
关键词:
Copyright 2015-2022 人人城建网 版权所有 备案号:粤ICP备18023326号-36 联系邮箱:8557298@qq.com