古往今来,以月亮为题材的诗歌有很多。月亮是张若虚眼中的月光千里

此时相见不相闻,愿逐月华流照君。月亮是李白眼中的寂寥

举杯邀明月,对影成三人。亦是李白眼中的尽兴、长久

人生得意须尽欢,莫使金樽空对月。唯愿当歌对酒时,月光长照金樽里。月亮是杜甫眼中的思乡

露从今夜白,月是故乡明。月亮是杜牧眼中的有情

明月有情应识我,年年相见在他乡。月亮是欧阳修眼中的相思

月上柳梢头,人约黄昏后。月亮是苏轼眼中的不解

明月几时有?把酒问青天。亦是苏轼眼中的祝愿

但愿人长久,千里共婵娟。

月亮是你,这个世界乱糟糟,而你干干净净悬在我的心上,做我的月亮。月亮是乡愁

新月弯弯,像一条小船。我乘船归去,越过万水千山。 https://t.cn/A6VNOEew

古外今来,文人眼中的月亮有一万种美。
月亮是思乡,露从今夜白,月是故乡明。
月亮是寂寥,举杯邀明月,对影成三人。
月亮是友情,明月有情应使我,年年相见在他乡。
月亮是乡愁,新月弯弯,像一条小船,
我乘船归去,越过万水千山。
月亮便是你,这个世界乱糟糟,
而你干干净净悬在我的心上,做我的月亮。
月亮更是祝愿,但愿人长久,千里共婵娟。

特斯拉autopilot研发总监Ashok在CVPR2022上的演讲:如何检测障碍物并自动避让(中)

原创 瓦砾村钱罐 瓦砾村夫

今天,我想谈一谈在视频中没有展示的某个技术,那就是,我们如何处理一般障碍物。

当开始搭建我们更高级的技术栈时,我们想用某种方法来表示一般障碍物。我们一开始使用的是图像空间的分割方法,这几乎是个标准方法。这里,图像空间的每个像素,都被标记为可驾驶或不可驾驶。然后,我们希望规划技术栈可以使用这个信息来导航场景。

但这种方法有几个问题。首先,这些关于某个像素是否可驾驶的预测是在图像空间中完成的,基于图像的uv值,或者说,某个像素是可驾驶的像素,还是不可驾驶。但为了让汽车能够在三维世界中导航,它需要在三维空间中进行预测,这样才能建立互动的物理模型,并处理驾驶任务。

但在从图像空间转变到三维空间的过程中,如果采用这样的方式,像素分割会在系统中产生不必要的瑕疵或不必要的噪声。例如,取决于我们如何将这个图像空间转换到三维空间,图像中地平线上的像素可能会产生巨大的影响。而我们不希望规划技术栈处理带有如此多噪声的可驾驶空间。而这其实并不是一个根本性的局限,只是这种表示方式的局限。

另外,这种表示方式也不能提供场景完整的三维结构,因此很难推理出所有悬空的障碍物,或者墙壁,或者其他可以遮挡场景的物体。

对一般障碍物进行建模的另一个方法,是使用密集的深度信息。在这个任务中,你可以以像素为基础,让网络预测深度,这样每个像素都会产生某个深度值。

但是,尽管这些深度图在颜色空间中进行可视化时,看起来非常漂亮,但当你使用深度值,把射线反向投影计算得到三维点,并可视化这些三维点云时,虽然它们在近处看起来很不错,但随着距离的增加,它们就变得不一致,而且数据很难被后续流程所使用。例如,局部的深度变得不一致,因此,墙就不直了,可能是弯弯扭扭的。

这个方式也有同样的问题,即靠近地平线的物体只由很少的点来表示,这使得规划技术栈很难针对障碍避让编写合理的逻辑。

这些深度图是基于每个摄像机的图像平面生成的,这也使得这个方法很难生成一个汽车周围统一的三维空间。

由于深度图通常被建模为回归目标,很难通过遮挡来进行预测,而且由于网络的特性,边界上也很难进行预测,例如,它们可能会平滑的从车辆变为背景,而这会在三维空间中产生不必要的瑕疵。

对于这个问题,我们的解决方案就是我们内部所称的占用网络(occupancy network)。下面是一个使用我们的占用网络进行预测的例子,我在这里停一下,让你们看看预测结果。

这些占用网络接收所有八个摄像机流作为输入,并生成一个汽车周围空间的体积化的占用值。每一个体素(或汽车周围的每一个位置),网络都会生成该体素是否被占用的结果。事实上,它生成了一个该体素(或三维位置)被占用或不被占用的概率值。

如我所说,它接受所有8个摄像头作为输入,并生成了一个单一的体积化的输出。这个输出的产生,并不是通过拼接各个独立的预测结果完成的,而是网络完成所有的内部传感器融合,并产生一个单一的一致的输出空间。

这些网络能生成静态物体的占用值,比如墙壁和树木之类的东西,也能生成移动物体的动态占用值,比如车辆(大多数情况下),但有时,也包括其他移动的障碍物,如道路上的碎片。

由于输出空间直接是在三维空间中,我们可以通过遮挡来进行预测。你可以预测一条曲线的存在,尽管它可能暂时被汽车遮挡。

最后,这个方法在内存和计算方面都非常高效,尽管表面上看可能并非如此,因为它生成了密集的三维的占用值,看起来可能体积过于庞大。但最终,在内存和计算效率上,这是一种更优的方法,因为它把分辨率分配在那些关键的地方。

如我所说,密集的深度图,或图像中的可驾驶空间,远处的分辨率非常低,而近处的分辨率非常非常高。但在占用网络中,在与驾驶有关的所有体积中,分辨率几乎都一致,这让它变得极其高效。

例如,我向各位展示的网络,在我们的计算平台上运行的时间小于10毫秒,这使得网络可以以100赫兹的速度运行,比摄像机产生图像的速度快得多。

这是如何做到的?让我们简单了解一下架构。

这里我展示了几个摄像流:鱼眼摄像头,这是一个朝向正面的广角摄像头;左立柱摄像头,这是一个面向左边的摄像头。而网络的确获取所有的摄像机作为输入。

我们首先进行归一化处理,以移除所有跟特定车辆相关的配置,比如内部校准,或图像畸变,或类似的因素。

一旦进行了归一化处理,这些图像就会被输入到目前最先进的图像主干架构中。例如,这里我们采用regnets和BiFBNs来提取图像特征,但这可以换成最先进的架构,甚至是来自于CVPR2022的。

这些主干在图像空间中生成了高维特征,但我们希望占用值定义在三维空间中,对吧,怎样才能做到呢?

我们使用基于查询的注意力(attention),来生成这些三维的占有值特征。这其实与几年前一篇同名论文《占有网络》的出现颇为相似,那篇文章也是查询一系列三维点,以确定三维点是否被占用。

这里的网络也有类似的性质,我们接受三维的位置编码,然后将其映射为固定的查询。这些固定的查询然后参与我们每一个图像空间的特征,我们在图像空间中也嵌入了位置信息。这样,这些三维查询参与所有图像流的图像空间查询,然后生成三维的占用特征。

因为这些都是高维特征,很难在空间的每个点上直接进行计算。我们采用的方法,是在较低的分辨率下生成这些高维特征,然后使用典型的上采样技术,如反卷积(deconvs),来生成更密的高分辨率占用值。

有趣的是,当我们开始这个项目的时候,我们最初的目标是只处理静态物体,如墙或树。因为我们有很多不同的神经网络在车内运行,处理不同类型的障碍物,我们并没有继续搭建一个主要处理移动物体的网络,如车辆,行人,自行车手等。

而这些网络也生成了车辆的完整运动学数据,如深度,速度,加速度,动力等。我们有这个移动物体的网络,我们当时想,好的,我们这里不需要处理移动物体,我们只需要处理静态物体,如树,墙等。

但事实证明,很难生成显式定义的本体树。在这个例子中,这也是来自我们自己内部的测试:这里有一辆皮卡车,看起来像一个栅栏。


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 【在我心里常常有一种感受,对你说我爱你三个字,我心里总是感觉这三个字还不能完全展现和形容我心里的世间,总有一种感觉还太轻还不够厚重,我内心想要传递的还很多很多,
  • 心激昂!社会.病态人们不再愿意思考终日里沉迷于娱乐与游戏沉迷于低俗与暴力这些精神的鸦片腐蚀着灵魂和肉体在这金钱至上的时代里在这娱乐至死的时代里所谓的信仰在哪里明
  • #一无症状感染者曾在邢台西服务区停留#】#河北爆料# 邢台市信都区疾病预防控制中心发布最新公告,2022年4月10日16时55分,内蒙古乌海市无症状感染者吴某某
  • 这个菩萨是三乘菩萨,念老括弧说,「法报二身,经无量劫必可悟证」但是现前不行,「但当下尚非其分,故下云非我境界」不是我的境界。  印祖《文钞》云:如来一代时教,所
  • 图文摘要1引言传统生物脱氮工艺是基于硝化-反硝化过程,最后转化为氮气,工艺流程长,脱氮负荷低,占地面积大,投资高。颗粒污泥因其具有优异的沉降性能,可以保留大量生
  • #坤哥游玩记#即将结束的厦门之旅,一心想念的铁路文化公园还是由于时间紧凑而没有去成,卢卡位于文化园的末端,也还有一些轨道,小院的环境真是超赞[偷笑]安排的行程再
  • [泪][泪][泪]看之前看大家一直在说巨烂,我就没对剧情抱期望,就想着看老三部和新三部主角合体打团就好了,所以看完觉得很好,我的要求完全被满足了,还是大团圆结局
  • 脏死了,金发少年偏着头嫌弃的说道,却又在她一身凌乱却又笑意满满的给声中,凑过去舔干净了她脸颊上溅出的汽水沫,又在她呆愣望着他的时候,俯身给了她一个轻轻的吻,一触
  • @摩登兄弟刘宇宁 刘宇宁摩登兄弟刘宇宁老大宁哥棚主lyn刘宇宁开始推理吧[送花花]刘下来 刘宇宁说英雄谁是英雄[送花花]刘宇宁白愁飞刘宇宁做自己的光[送花花]刘
  • #苍井翔太[超话]# 转自推特:将ーーー!其所属偶像团体“Aqours”近日公开了“Aqours无限大WORLD☆Project”活动主题曲《ユメ+ミライ=無限
  • #一条plog告别六月# 上半年小结:✅ 去了宜家✅过年的欢乐气氛✅见了好朋友✅今年下雪了❄️✅一个雪容融✅遇到一群小可爱✅在这个夏天我们毕业啦!经历了3个月的
  • ​​​随手,拾起一片落叶,轻问:"这一季又一季的执着,有否带你淌过岁月的河川,写下永恒而不朽的亮丽篇章?随手,拾起一片落叶,轻问:"这一季
  • 我的宝贝侄子四岁了,今年过了,明年我就31岁人生路上走,走着走着,就多了两宝加一大宝珍惜之人,岁月无情竟是让人慢慢变老,但唯独没变的是一颗永恒之心,虽无情但有爱
  • 第三个是楚国首都郢,楚国首都最是与众不同,楚国曾经六次搬迁首都,但每个首都都叫“郢”我们这里说的是楚国最后一个首都,也就是如今的安徽省寿县,这座城市入选了中国第
  • 距离毕业还有整整一年提前收到了一份大大的surprise[礼物]…超级超级开心超级超级幸福[兔子]Thanks to my family已经当面‘叩谢’过了哈哈
  • 102㎡三居室,简单大气的舒适空间☑️本套住宅是一家四口居住,业主偏好现代风,在联系我们前已经在很多平台看了很多装修的案例,但是对于新居的想法比较碎片。☑️在经
  • 《觚剩·吴觚中》   ○仙根   李子静学士,少随其父如石先生官于吴,遇国变,不能归蜀,僦居锦帆泾侧,馆于乡间柴氏。柴氏子世俊,梦入玉京,试得状头,师得榜眼
  • 这句话对我帮助很大,一下子我仿佛就释怀了很多别人的评价,此刻心里感觉轻松,首先道的规律本就如此啊,上士闻道,勤而行之;中士闻道,若存若亡;下士闻道,哈哈大笑,不
  • “那个,你先起来...”王博别过脸不去看他,赞赞哦了一声翻了个身,侧着身子看王博:“今天能给我买草莓吃吗?赞赞的身子都贴到王博身上了,王博也不好直接挪开,只能佯
  • 主动应对反腐败斗争新形势新挑战,坚决防范和查处“七个有之”问题,对在党内搞政治团伙、小圈子、利益集团的人毫不手软,对年轻干部从严教育管理监督。“零容忍”一词,不