特斯拉autopilot研发总监Ashok在CVPR2022上的演讲:如何检测障碍物并自动避让(中)

原创 瓦砾村钱罐 瓦砾村夫

今天,我想谈一谈在视频中没有展示的某个技术,那就是,我们如何处理一般障碍物。

当开始搭建我们更高级的技术栈时,我们想用某种方法来表示一般障碍物。我们一开始使用的是图像空间的分割方法,这几乎是个标准方法。这里,图像空间的每个像素,都被标记为可驾驶或不可驾驶。然后,我们希望规划技术栈可以使用这个信息来导航场景。

但这种方法有几个问题。首先,这些关于某个像素是否可驾驶的预测是在图像空间中完成的,基于图像的uv值,或者说,某个像素是可驾驶的像素,还是不可驾驶。但为了让汽车能够在三维世界中导航,它需要在三维空间中进行预测,这样才能建立互动的物理模型,并处理驾驶任务。

但在从图像空间转变到三维空间的过程中,如果采用这样的方式,像素分割会在系统中产生不必要的瑕疵或不必要的噪声。例如,取决于我们如何将这个图像空间转换到三维空间,图像中地平线上的像素可能会产生巨大的影响。而我们不希望规划技术栈处理带有如此多噪声的可驾驶空间。而这其实并不是一个根本性的局限,只是这种表示方式的局限。

另外,这种表示方式也不能提供场景完整的三维结构,因此很难推理出所有悬空的障碍物,或者墙壁,或者其他可以遮挡场景的物体。

对一般障碍物进行建模的另一个方法,是使用密集的深度信息。在这个任务中,你可以以像素为基础,让网络预测深度,这样每个像素都会产生某个深度值。

但是,尽管这些深度图在颜色空间中进行可视化时,看起来非常漂亮,但当你使用深度值,把射线反向投影计算得到三维点,并可视化这些三维点云时,虽然它们在近处看起来很不错,但随着距离的增加,它们就变得不一致,而且数据很难被后续流程所使用。例如,局部的深度变得不一致,因此,墙就不直了,可能是弯弯扭扭的。

这个方式也有同样的问题,即靠近地平线的物体只由很少的点来表示,这使得规划技术栈很难针对障碍避让编写合理的逻辑。

这些深度图是基于每个摄像机的图像平面生成的,这也使得这个方法很难生成一个汽车周围统一的三维空间。

由于深度图通常被建模为回归目标,很难通过遮挡来进行预测,而且由于网络的特性,边界上也很难进行预测,例如,它们可能会平滑的从车辆变为背景,而这会在三维空间中产生不必要的瑕疵。

对于这个问题,我们的解决方案就是我们内部所称的占用网络(occupancy network)。下面是一个使用我们的占用网络进行预测的例子,我在这里停一下,让你们看看预测结果。

这些占用网络接收所有八个摄像机流作为输入,并生成一个汽车周围空间的体积化的占用值。每一个体素(或汽车周围的每一个位置),网络都会生成该体素是否被占用的结果。事实上,它生成了一个该体素(或三维位置)被占用或不被占用的概率值。

如我所说,它接受所有8个摄像头作为输入,并生成了一个单一的体积化的输出。这个输出的产生,并不是通过拼接各个独立的预测结果完成的,而是网络完成所有的内部传感器融合,并产生一个单一的一致的输出空间。

这些网络能生成静态物体的占用值,比如墙壁和树木之类的东西,也能生成移动物体的动态占用值,比如车辆(大多数情况下),但有时,也包括其他移动的障碍物,如道路上的碎片。

由于输出空间直接是在三维空间中,我们可以通过遮挡来进行预测。你可以预测一条曲线的存在,尽管它可能暂时被汽车遮挡。

最后,这个方法在内存和计算方面都非常高效,尽管表面上看可能并非如此,因为它生成了密集的三维的占用值,看起来可能体积过于庞大。但最终,在内存和计算效率上,这是一种更优的方法,因为它把分辨率分配在那些关键的地方。

如我所说,密集的深度图,或图像中的可驾驶空间,远处的分辨率非常低,而近处的分辨率非常非常高。但在占用网络中,在与驾驶有关的所有体积中,分辨率几乎都一致,这让它变得极其高效。

例如,我向各位展示的网络,在我们的计算平台上运行的时间小于10毫秒,这使得网络可以以100赫兹的速度运行,比摄像机产生图像的速度快得多。

这是如何做到的?让我们简单了解一下架构。

这里我展示了几个摄像流:鱼眼摄像头,这是一个朝向正面的广角摄像头;左立柱摄像头,这是一个面向左边的摄像头。而网络的确获取所有的摄像机作为输入。

我们首先进行归一化处理,以移除所有跟特定车辆相关的配置,比如内部校准,或图像畸变,或类似的因素。

一旦进行了归一化处理,这些图像就会被输入到目前最先进的图像主干架构中。例如,这里我们采用regnets和BiFBNs来提取图像特征,但这可以换成最先进的架构,甚至是来自于CVPR2022的。

这些主干在图像空间中生成了高维特征,但我们希望占用值定义在三维空间中,对吧,怎样才能做到呢?

我们使用基于查询的注意力(attention),来生成这些三维的占有值特征。这其实与几年前一篇同名论文《占有网络》的出现颇为相似,那篇文章也是查询一系列三维点,以确定三维点是否被占用。

这里的网络也有类似的性质,我们接受三维的位置编码,然后将其映射为固定的查询。这些固定的查询然后参与我们每一个图像空间的特征,我们在图像空间中也嵌入了位置信息。这样,这些三维查询参与所有图像流的图像空间查询,然后生成三维的占用特征。

因为这些都是高维特征,很难在空间的每个点上直接进行计算。我们采用的方法,是在较低的分辨率下生成这些高维特征,然后使用典型的上采样技术,如反卷积(deconvs),来生成更密的高分辨率占用值。

有趣的是,当我们开始这个项目的时候,我们最初的目标是只处理静态物体,如墙或树。因为我们有很多不同的神经网络在车内运行,处理不同类型的障碍物,我们并没有继续搭建一个主要处理移动物体的网络,如车辆,行人,自行车手等。

而这些网络也生成了车辆的完整运动学数据,如深度,速度,加速度,动力等。我们有这个移动物体的网络,我们当时想,好的,我们这里不需要处理移动物体,我们只需要处理静态物体,如树,墙等。

但事实证明,很难生成显式定义的本体树。在这个例子中,这也是来自我们自己内部的测试:这里有一辆皮卡车,看起来像一个栅栏。

#月邪漫展[超话]##月邪漫展果真不一漾#
【2022良牙暑期动漫节】
第一天顺利结束!
我们明天见[哇]
楼上楼下双层展厅[赢牛奶]
场内更多有趣好玩的内容等你探索[送花花]

⭐入场要求⭐
1.【所有观众】必须出示48小时核酸检测阴性证明
2.广西健康码绿码
3.通信大数据行程卡无异常(7天内有北海市、崇左市、海南省以及其他高中低风险地区的观众,无法进入场馆。)
4.配合测温无异常,规范佩戴口罩。

以最新的疫情防控通知为准,最新疫情形势和全国疫情风险等级可通过国务院客户端小程序查询,请大家密切关注并遵守。低风险地区不同于“常态化防控区域”,请注意新冠肺炎疫情风险区域的最新划定标准。

2022良牙暑期动漫节#月邪漫展#
活动时间:2022年8月20-21日
活动地点:南宁国际会展中心B1、B2展厅
GO PIAO:良牙文化 V / X 小 cheng 序

股市的本质

(重点提示:全文不评价任何投资方法好坏和不做任何优劣比较,只作为科普股市知识用途,敬请知悉!)

选股方式

很多股民都喜欢自己去瞎选股票,随便找一个股票就觉得这股票不错,没有真正的章法可言,拍脑门觉得好,凭感觉觉得好就买入进去了。。。然后就是长达10年的----问人世间认知库为何物。。。直教散户生死相许!!

今天就简单的大白话给你聊聊最基础的逻辑思路。 这个逻辑思路,如果你去看CFA书籍或者CIIA书籍,作为普通散户基本就看得眼花缭乱,其实没那么复杂。 把复杂的事情简单化,这才是抓到精髓。 你看股市好几千个票,怎么选啊? 一个一个翻吗?

因此你就需要了解到两个相对的名词:自下而上选股和自上而下选股。你可能看起来觉得真听起来很拗口,其实没什么难的,什么叫自下而上选股呢? 我就不用书本上的学术术语给你讲了,那跟读课本没任何区别,这也就是你看CFA和CIIA书籍都快吐了的原因,自下而上的意思就是:你可以通过某些数量指标,比如营业收入增长率,净利润增长率等财务指标,或者其他条件,进行筛选,选出符合标准的公司。这是第一步,也就是从公司层面通过某指标去筛,然后第二步筛出来以后,你会发现有大约几百个公司符合你第一步的要求,然后再分别进行行业分析,和第四步宏观分析。。。其实说到第三步你就发现了。。。已经出现问题了。。。倒推导第三步,逐个进行行业分析之后难道再逐个进行宏观分析吗?显然到这里,就出了逻辑上的冲突和错误了,你不可能一个一个票反复重复第三步和第四步,比如你筛出来了400-500个符合第一步的公司,那么你一家一家的进行行业分析。。。

然后咱们再来说说自上而下的选股方法, 那什么是自上而下的选股方法呢? 那就是把上面每一步都反过来,首先第一步进行整个宏观层面的分析,比如货币政策是宽松还是收紧?比如村里的大方向指引、宏观经济数据等等,这是宏观层面分析,用来做什么呢?用来确定大局会不会出大问题。相当于定大势,对大势定调。 如果第一步就发现有明显问题,那么后面几步就基本没必要进行下去了。 在第一步没问题的情况下,开始第二步行业分析,大势没有问题了,那么就需要针对某些行业进行分析,而这也是真正开始进入正题的部分,大A好几千个,如果你一个一个去选,那会非常累,那么看板块就相对轻松一点了,几千个票,而板块就几十个(非概念板块),从这几十个行业板块里面下手去分析,就更容易一点,从这里通过某些分析方法(不展开了,展开又得扯好几千字)来确定需要做的是哪几个行业,确定好行业以后,就可以进入到第三步以你确定好的这些行业为目标,然后按照行业下属所包括哪些企业来展开第三步将每一个行业的公司进行梳理,包括但不限于财务数据、公司未来发展潜力等等,对这些行业隶属的公司搞清楚,这样就有的放矢了,而不是从四千多个股票里面一个一个翻。 第四步将第三步精选出的公司,再放到K线图上面看如何切入,把第三步梳理好的股票一个一个股票建立好板块,这样以便于日后随时切换板块容易看盘。 这就是自上而下的选股思路。

以上简单科普了两个最基本的选股逻辑,自下而上和自上而下。已经尽可能简单给你描述了。下面再来聊聊技术分析的起源,技术分析起源于三大假设:(我按照这个三大假设进行注意掰开了揉碎了聊)

(1)市场的行为包含一切

这个行为那可就多了去了。。。自然也少不了周五上交所披露出来的几十起违法犯罪,32起加剧市场波动误导投资者决策,37起拉抬打压、虚假申报。 这些都是市场行为,市场就是人,人与人的博弈形成了市场的一切。按照基本定义市场的行为包含一切,这说的太笼统了。普通投资者根本就读不懂,啥叫市场行为包含一切? 这里你需要注意了,市场的行为K线图,这是你能看得到的最直观的体现,有的时候的确会反映出市场的行为。。。但是有的时候不一定会反馈出真实的市场行为,比如上面那32起和37起违法犯罪的事。你说说那叫不叫市场行为包含一切? 我个人觉得应该用一句话来表达: 你看到的不一定是真的,你没看到的不一定不会发生。低吸于千里马穷困潦倒之时,高抛于飞黄腾达、人声鼎沸之时。 有些你看到的比如借助资金优势拉抬。。打压股价。。你说那是真的吗? 真的是反馈出市场的方向吗? 尤其是支撑位被砸破。。。。吓得很多散户哭爹喊娘的。那种时候,并不能盲目的认为那是真正的市场行为。。。那只是某些坏蛋的行为而已。。。目的是啥。。。大家都应该知道,人的行为都是有目的的,这才是核心。。。。

你想想,周五上交所披露的那32起加剧市场波动误导投资者决策,37起拉抬打压、虚假申报。这都是为了啥呢? 无论是拉抬、打压,还是加剧市场波动,其实都是一回事,目的都是一个,财富转移。无非就是筹码的艺术, 打压,那是为了骗筹码,拉抬那是为了拉高了好把他手里的筹码 卖到更好的价格,这才是上交所披露的拉抬、打压,加剧市场波动,误导投资者决策的真正的大白话。什么叫误导投资者决策?那不太简单了吗? 无非就是看见猛拉去追涨。。。看见猛锤就吓得腿都软,割肉求生。殊不知。。。猛拉去追就被闷死在里面。。。大锤割肉刚割了没几天就大腿拍烂。。 这叫筹码的艺术,这才是股市的真谛。

同样一个筹码从低到高循环一圈。手里的钱变多了。这就是大坏狼做的事。 而借助的是什么东西呢?就是股票、就是公司。需要噱头。需要新闻。需要消息刺激。需要风口。需要热门。需要吸引眼球。 而本质就是筹码。低了收进来。。。高了筹码换人民币。而这一低一高之间,如果再有媒体的完美配合比如徐X她老婆。。。一句话就能给整个锂行业判死刑。借助这种方式进行打压。然后。完成第二轮吸筹。(你试试看天齐锂业如果徐某某他老婆不打压。怎么锤低。怎么吸第二轮筹码。)这就是打压。而拉抬呢?? 等日后某一天。随便借助点利好,需要煽风点火的时候。很容易就煽动市场的积极性,再有一些券商配合出研报。啥啥啥重大利好。未来前景无限。然后全国各地再抄袭一下子,再雇点网络水军四处发消息点火利好。主要财经新闻网上,比如什么东财、新浪、腾讯等等等等。。。市场情绪被调动起来了。板块开始全面启动。。。鸡犬升天。。。 你说说是不是市场的行为包含一切?? 如果从字面上看,的确人们都在往里冲。。买买买才导致鸡犬升天。。。但是真正的背后原因被人们忽视了。。。。而这才是我要跟大家说的:32起加剧市场波动误导投资者决策,37起拉抬打压、虚假申报,那都是为什么出现? 无非二字:利润! 真正的去洞悉人性。。。这才是股市的本质。因此,把这句话改一改。。。 人性、利润包含一切。并且与下面第二项完美衔接。。。

(2)历史会重演,但绝不会简单重演

为什么历史会重演呢?大家有没有思考过? 为什么股票不同,板块不同,但是很多股票走出的图形却经常非常相似? 仔细看我周五盘中的分享。。。自己去翻。。。(以后养成好x-i惯,我的某些分享内容,注意打印,别子欲看而文不在,再来找我,找我也没用,分享一切东西都在脑子里)。 周五那篇文章很好的解答了为啥股票不同。。怎么走法就那么有趣呢? 跌到某个位置就不砸了。。。。。何为低? 如何定义低? 低于哪里就叫低估了?拍脑门?看PE ?? 看PB ? 看PEG ? 如果你不知道。。。请仔细阅读周五分享。。。并打印。。。当然还有nnn个礼拜前我点名了不知道多少次的那篇。。。结合起来看,你会收获巨大。这就是为啥历史会重演的真正本质。。。 庄不同,股不同,行业不同,股价不同,市值不同。。。。但是为啥他们都有共性。。。 因为那才是真正的本质。。。拨云见日!!

(3)价格沿趋势运动

当你看完了上面的(2)并且也找到我周五分享以后,并且手里有辅助,你就可以一目了然看清楚,价格围绕着什么然后啥啥啥,一目了然就看清楚了。。。你心理瞬间豁然开朗。。。。


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 一开始袁了凡不太相信,巧合的是,此后的二十年,袁了凡的人生真的按照这位老者所算定的模式进行着,连考第几名等每一次都十分精确地应验了,这让他笃信了宿命论,认为“荣
  • 而演员更不能入戏太深,移动播报要的是真实生活反映,偶遇若是常态,便不愁没人理解,若是作秀,网民要看不出来,那简直就是侮辱大家的智商 ​​​今天带着闺女回老家,给
  • #翟鸿燊#人的良知一旦被腐蚀,那他的心就给了魔鬼,腐败能打通很多渠道,但用腐败的钱,兑换的不是阳光,而是丑恶。如果人人都泯灭良知,用坏良心的钱去交换,那社会也交
  • 大促购前领红包【求助214】❶我想问问有没有人知道wego丝带痛s码和l码分别能装下多少个75mm的吧唧,稍微叠起来一点的那种❷最近好心水进来买个包他们家的爱的
  • 我是大牙,期待着,下一次,与你的见面,拜拜我的详细设备清单:显示器:戴尔 U2720QM电 脑:3700X / 1060S / 32G屏幕灯:明基 Screen
  • Le taux d'inflation annuel de l'Allemagne a grimpé à 10,4 % en octobre, un nouve
  • 时隔10年在去年发售了画集『媚 薬』的画师笠井あゆみ出插图卡册啦。comicomi-studio.com/goods/detail/137012#任嘉伦[超话]
  • 总结一下抓马的一天:1.我今天吃麻辣烫的时候,也不是麻辣烫,(很香 p1)是那种串串店,不大,我坐的离选餐区近,碰到一对情侣,那个女孩子大概175的样子,挺漂亮
  • 温柔且浪漫的文案 1. 一半浮生,二两清酒,三生有幸,四季有你。 2. 青竹板凳,老酒几杯,只等故人归。 3. 心若静,物随人愿;情若真,年复一年。 4
  • 快给自己和家人安排起来【有光就能上网,一秒23部电影,能够淘汰WiFi的黑科技】这个科技叫做“LiFi”也叫做可见光无线通信,它是一项利用可见光波谱全新无线传输
  • #上海理工大学112周年校庆##上海理工大学[超话]#112载春秋,你自沪江之畔走来,践行信义、勤爱、思学、志远的信念。(图片来自:漫溯路) 【台湾来的参观考察
  • 动作戏不是我以为的真开打,更倾向武戏,有一段让我恍惚看到了三岔口,当时就被自己的联想笑到了[允悲]我旁边的一对不知道情侣还是夫妻说觉得开场那段舞蹈太长了,都怀疑
  • 不要因为自己多吃了一口而后悔,咱也可以在运动上把它消耗掉。减肥也千万不要不吃碳水,不然女性每个月的经期会消失不见从而给我们狠狠上一课。
  • 没错就是我们sb小虎队,怎么回事啊他们很爱我诶,婷知道我喜欢拍照给我选的ccd,元g给我买的音响也很适合播放音乐,我也超级喜欢的!我们哥竟然给我送了口红,简直是
  • Jennie的疲劳恢复程序半身浴+好吃的食物(ex.薄荷巧克力) + 看电影 + 睡觉智秀治愈食品 拉面 vs 拌筋面 vs 木瓜沙拉(泰式甜咸拌菜)因为这个意
  • 经常会翻自己找不回来的那个个微博号,自己那时候真的有在好好生活,遇见小刘以后也真的越来越幸福了,遇见他的前一个月,还在莫名其妙的伤感,那时候我是个愿意强行悲伤,
  • #任嘉伦[超话]#10任嘉伦#欧诗漫品牌代言人任嘉伦#任嘉伦#任嘉伦etro品牌代言人# 任嘉伦#任嘉伦无忧渡# 任嘉伦#任嘉伦宣夜#任嘉伦#任嘉伦暮色心约#
  • 当然少不了百事定制U盘、联名T恤、AIYA定制帆布袋、徽章等各种限量周边~——————店名:百事可乐阳光小玛特便利店门票:0元免费打卡位置:华府天地北门吉野家旁
  • 2022.10.15老公近来工作压力山大,有诸多不如意事,以致影响心情,我不住宽慰,同时开解, 我:老公你去下楼走走吧,运动能促进生成多巴胺,你会觉得快乐很多。
  • VX:casionchiu #中海汇智里# 中海滙智里海淀北的精装住宅售楼处销售☎郭培君16756106541(vx)1、昌平中关村创新基地,到海淀直线距离1k