#FLOKI中国社区[超话]##FLOKI中国社区[超话]##FLOKI中国社区[超话]##FLOKI中国社区[超话]##比特币超话##币圈超话##比特币超话##币圈稀饭[超话]#
FLOKI令牌的角色:
虽然用户最初可以通过USDT(最终可以使用任何加密货币)支付FlokiFi Locker的交易费用,但该协议本身将由FLOKI代币提供动力:具体来说,25%的交易费用自动进行FLOKI代币的交易购买和烧毁,使FLOKI代币永久通缩。剩下的75%归弗洛基的金库。例如,假设一个拥有100万美元流动性的项目将其LP代币与FlokiFi Locker锁住,收取0.5%的费用:即每笔交易5000美元!其中25%用于FLOKI令牌的自动交易购买和烧录,以“增强”协议,而其余的则流入国库。
FLOKI令牌的角色:
虽然用户最初可以通过USDT(最终可以使用任何加密货币)支付FlokiFi Locker的交易费用,但该协议本身将由FLOKI代币提供动力:具体来说,25%的交易费用自动进行FLOKI代币的交易购买和烧毁,使FLOKI代币永久通缩。剩下的75%归弗洛基的金库。例如,假设一个拥有100万美元流动性的项目将其LP代币与FlokiFi Locker锁住,收取0.5%的费用:即每笔交易5000美元!其中25%用于FLOKI令牌的自动交易购买和烧录,以“增强”协议,而其余的则流入国库。
什么是氨氮吹脱法
吹脱法多用于处理中高浓度、大流量氨氮废水,吹脱出的氨可以回收利用,但有容易结垢、低温时氨氮去除效率低、吹脱时间长、二次污染、出水氨氮浓度仍偏高等缺点,所以明确影响吹脱法的关键因素,提高氨氮去除率,对于氨氮处理成本控制、水污染得到控制、实现城市的可持续发展具有重要的意义。
一、什么是氨氮吹脱法?
氨氮吹脱法是利用气体分离定律(亨利定律)通过气体分压不同,将游离态氨氮吹脱出废水的一种方法!
1、氨氮吹脱法的原理
其具体原理是利用废水中所含的氨氮等挥发性物质的实际浓度与平衡浓度之间存在的差异,在碱性条件下使用空气吹脱,由于在吹脱过程中不断排出气体,改变了气相中的氨气浓度,从而使其实际浓度始终小于该条件下的平衡浓度,最终使废水中溶解的氨不断穿过气液界面,使废水中的NH3-N得以脱除,常以空气作为载体。氨吹脱是一个传质过程,推动力来自空气中氨的分压与废水中氨浓度相当的平衡分压之间的差,气体组份在液面的分压和液体内的浓度符合亨利定理,即成正比关系。此法也叫“氨解析法”,解析速率与温度、气液比有关。
吹脱法的基本原理是气液相平衡和传质速度理论。废水中的NH3-N通常以铵离子(NH4+)和游离氨(NH3)的状态把持平衡而存在的:
NH4++OH↹NH3+H2O
当PH为中性时,NH3-N主要以铵离子(NH4+)形式存在,当PH值为碱性,NH3-N主要以游离氨(NH3)状态存在吹脱法是在沸水中加入碱,调节PH值至碱性,先将废水中的NH4+转化为NH3,然后通入蒸汽或空气进行解吸,将废水中的NH3转化为气相,从而将NH3-N从水中去除。常用空气或水蒸气作载气,前者称为空气吹脱,后者称为蒸汽吹脱。
2、氨氮吹脱法的优缺点
优点
吹脱法用于处理高浓度氨氮废水具有流程简单、处理效果稳定、基建费和运行费较低等优点,实用性较强。
缺点
进出水需要调整PH、如果没有酸性吸收吹脱出来的氨气随空气进入大气引起二次污染、硬度高的废水结垢严重。
二、氨吹脱的装置类型
垃圾渗滤液脱氮常用的吹脱设备有曝气吹脱池、空气吹脱塔以及蒸汽蒸馏塔,采用装置的不同也将影响氨吹脱的效果,这几种吹脱装置的特性比较见下表。
三、影响因素
吹脱法一般采用吹脱池(也称“曝气池”)和吹脱塔两类设备。但吹脱池占地面积大,而且易污染周围环境,所以有毒气体的吹脱都采用塔式设备。塔式设备中填料吹脱塔主要特征是在塔内装置一定高度的填料层,使具有大表面积的填充塔来达到气—液间充分接触。常用填料有纸质蜂窝、拉西环、聚丙烯鲍尔环、聚丙烯多面空心球等。废水被提升到填充塔的塔顶,并分布到填料的整个表面,水通过填料往下流,与气流逆向流动,废水在离开塔前,氨组份被部分汽提,但需保持进水的pH值不变。空气中氨的分压随氨的去除程度增加而增加,随气水比增加而减少。影响吹脱法处理氨氮废水去除率主要是pH值、温度、气液比/吹脱水位深度、吹脱时间等因素。
1、PH
水中的氨氮,大多以氨离子(NH4+)和游离氨(NH3)保持平衡的状态而存在。其平衡关系式如下:
NH4++OH↹NH3+H2O (1)
式(1)受pH 值的影响,当pH值高时,平衡向右移动,游离氨的比例较大,当pH 值为11 左右时,游离氨大致占90%。
2、温度
氨与氨离子之间的百分分配率可用下式进行计算:
Ka=Kw /Kb=(CNH3·CH+)/CNH4+ (2)
式中:
Ka—— —氨离子的电离常数;
Kw—— —水的电离常数;
Kb—— —氨水的电离常数;
C—— —物质浓度。
由式(2)可以看出,pH 值是影响游离氨在水中百分率的主要因素之一。另外,温度也会影响反应式(1)的平衡,温度升高,平衡向右移动。表(一)列出了不同条件下氨氮的离解率的计算值。表中数据表明,当pH值大于10 时,离解率在80%以上,当pH 值达11时,离解率高达98%且受温度的影响甚微。
3、气液比
气液比: 指空气(蒸汽)和吹脱对象(含氨废水)的体积比。
影响氨气从水中向大气转移的因素有两个:一是水气界面处的表面张力;二是界面处的氨浓度差表面张力最小,气态氨释放量就最大。如果形成水滴,气态氨转移量的增加将会很小。因此,反复形成水滴有助于氨的吹脱。
水和大气中氨氮的浓度差是气态氨转移的动力。为使水滴周围环境中的氨氮浓度最小,必须将空气快速循环,用含低浓度气态氨的空气搅动水滴,有助于加快氨的释放。
对确定的废水量而言,增大气体量,传质推动力相应增大,有利于氨氮吹脱去除。但气量太大,气速过高,将影响废水沿填料正常下流甚至不能流下,即引起液泛现象。因此,对一定废水量,最小液气比受液泛气速控制;但是进水量较小时,会消耗大量的能源,所以一般氨氮吹脱工艺将气液比控制在3000左右。
4、吹脱时间
减小吹脱时间,有利于加快反应速度,提高处理量,减少设备的容积。徐颖采用吹脱法处理垃圾渗滤液,吹脱段pH值为11,气液比在2000~2300,吹脱时间9h,反应条件达到最佳吹脱效率才达到52.0%。卢平等采用吹脱—缺氧—两级好氧工艺处理垃圾渗滤液,垃圾渗滤液取自香港某垃圾填埋场,氨氮浓度1400mg/L,pH值为9.5,吹脱时间12h,经吹脱后氨氮去除率为60%。傅金祥等采用吹脱法垃圾渗滤液,进水氨氮浓度1800mg/L,最佳pH值为11,最佳气液比为360∶1,空气量为3.0L/min,吹脱时间为1h,去除效率可达88.75%。由此可看出处理相同的废水最佳吹脱时间也相差很大,可能是因为采用的填料不同、装置设计的合理性等原因造成,吹脱处理后能够很好地进行后续处理和控制运行成本。
吹脱法多用于处理中高浓度、大流量氨氮废水,吹脱出的氨可以回收利用,但有容易结垢、低温时氨氮去除效率低、吹脱时间长、二次污染、出水氨氮浓度仍偏高等缺点,所以明确影响吹脱法的关键因素,提高氨氮去除率,对于氨氮处理成本控制、水污染得到控制、实现城市的可持续发展具有重要的意义。
一、什么是氨氮吹脱法?
氨氮吹脱法是利用气体分离定律(亨利定律)通过气体分压不同,将游离态氨氮吹脱出废水的一种方法!
1、氨氮吹脱法的原理
其具体原理是利用废水中所含的氨氮等挥发性物质的实际浓度与平衡浓度之间存在的差异,在碱性条件下使用空气吹脱,由于在吹脱过程中不断排出气体,改变了气相中的氨气浓度,从而使其实际浓度始终小于该条件下的平衡浓度,最终使废水中溶解的氨不断穿过气液界面,使废水中的NH3-N得以脱除,常以空气作为载体。氨吹脱是一个传质过程,推动力来自空气中氨的分压与废水中氨浓度相当的平衡分压之间的差,气体组份在液面的分压和液体内的浓度符合亨利定理,即成正比关系。此法也叫“氨解析法”,解析速率与温度、气液比有关。
吹脱法的基本原理是气液相平衡和传质速度理论。废水中的NH3-N通常以铵离子(NH4+)和游离氨(NH3)的状态把持平衡而存在的:
NH4++OH↹NH3+H2O
当PH为中性时,NH3-N主要以铵离子(NH4+)形式存在,当PH值为碱性,NH3-N主要以游离氨(NH3)状态存在吹脱法是在沸水中加入碱,调节PH值至碱性,先将废水中的NH4+转化为NH3,然后通入蒸汽或空气进行解吸,将废水中的NH3转化为气相,从而将NH3-N从水中去除。常用空气或水蒸气作载气,前者称为空气吹脱,后者称为蒸汽吹脱。
2、氨氮吹脱法的优缺点
优点
吹脱法用于处理高浓度氨氮废水具有流程简单、处理效果稳定、基建费和运行费较低等优点,实用性较强。
缺点
进出水需要调整PH、如果没有酸性吸收吹脱出来的氨气随空气进入大气引起二次污染、硬度高的废水结垢严重。
二、氨吹脱的装置类型
垃圾渗滤液脱氮常用的吹脱设备有曝气吹脱池、空气吹脱塔以及蒸汽蒸馏塔,采用装置的不同也将影响氨吹脱的效果,这几种吹脱装置的特性比较见下表。
三、影响因素
吹脱法一般采用吹脱池(也称“曝气池”)和吹脱塔两类设备。但吹脱池占地面积大,而且易污染周围环境,所以有毒气体的吹脱都采用塔式设备。塔式设备中填料吹脱塔主要特征是在塔内装置一定高度的填料层,使具有大表面积的填充塔来达到气—液间充分接触。常用填料有纸质蜂窝、拉西环、聚丙烯鲍尔环、聚丙烯多面空心球等。废水被提升到填充塔的塔顶,并分布到填料的整个表面,水通过填料往下流,与气流逆向流动,废水在离开塔前,氨组份被部分汽提,但需保持进水的pH值不变。空气中氨的分压随氨的去除程度增加而增加,随气水比增加而减少。影响吹脱法处理氨氮废水去除率主要是pH值、温度、气液比/吹脱水位深度、吹脱时间等因素。
1、PH
水中的氨氮,大多以氨离子(NH4+)和游离氨(NH3)保持平衡的状态而存在。其平衡关系式如下:
NH4++OH↹NH3+H2O (1)
式(1)受pH 值的影响,当pH值高时,平衡向右移动,游离氨的比例较大,当pH 值为11 左右时,游离氨大致占90%。
2、温度
氨与氨离子之间的百分分配率可用下式进行计算:
Ka=Kw /Kb=(CNH3·CH+)/CNH4+ (2)
式中:
Ka—— —氨离子的电离常数;
Kw—— —水的电离常数;
Kb—— —氨水的电离常数;
C—— —物质浓度。
由式(2)可以看出,pH 值是影响游离氨在水中百分率的主要因素之一。另外,温度也会影响反应式(1)的平衡,温度升高,平衡向右移动。表(一)列出了不同条件下氨氮的离解率的计算值。表中数据表明,当pH值大于10 时,离解率在80%以上,当pH 值达11时,离解率高达98%且受温度的影响甚微。
3、气液比
气液比: 指空气(蒸汽)和吹脱对象(含氨废水)的体积比。
影响氨气从水中向大气转移的因素有两个:一是水气界面处的表面张力;二是界面处的氨浓度差表面张力最小,气态氨释放量就最大。如果形成水滴,气态氨转移量的增加将会很小。因此,反复形成水滴有助于氨的吹脱。
水和大气中氨氮的浓度差是气态氨转移的动力。为使水滴周围环境中的氨氮浓度最小,必须将空气快速循环,用含低浓度气态氨的空气搅动水滴,有助于加快氨的释放。
对确定的废水量而言,增大气体量,传质推动力相应增大,有利于氨氮吹脱去除。但气量太大,气速过高,将影响废水沿填料正常下流甚至不能流下,即引起液泛现象。因此,对一定废水量,最小液气比受液泛气速控制;但是进水量较小时,会消耗大量的能源,所以一般氨氮吹脱工艺将气液比控制在3000左右。
4、吹脱时间
减小吹脱时间,有利于加快反应速度,提高处理量,减少设备的容积。徐颖采用吹脱法处理垃圾渗滤液,吹脱段pH值为11,气液比在2000~2300,吹脱时间9h,反应条件达到最佳吹脱效率才达到52.0%。卢平等采用吹脱—缺氧—两级好氧工艺处理垃圾渗滤液,垃圾渗滤液取自香港某垃圾填埋场,氨氮浓度1400mg/L,pH值为9.5,吹脱时间12h,经吹脱后氨氮去除率为60%。傅金祥等采用吹脱法垃圾渗滤液,进水氨氮浓度1800mg/L,最佳pH值为11,最佳气液比为360∶1,空气量为3.0L/min,吹脱时间为1h,去除效率可达88.75%。由此可看出处理相同的废水最佳吹脱时间也相差很大,可能是因为采用的填料不同、装置设计的合理性等原因造成,吹脱处理后能够很好地进行后续处理和控制运行成本。
特斯拉autopilot研发总监Ashok在CVPR2022上的演讲:如何检测障碍物并自动避让(中)
原创 瓦砾村钱罐 瓦砾村夫
今天,我想谈一谈在视频中没有展示的某个技术,那就是,我们如何处理一般障碍物。
当开始搭建我们更高级的技术栈时,我们想用某种方法来表示一般障碍物。我们一开始使用的是图像空间的分割方法,这几乎是个标准方法。这里,图像空间的每个像素,都被标记为可驾驶或不可驾驶。然后,我们希望规划技术栈可以使用这个信息来导航场景。
但这种方法有几个问题。首先,这些关于某个像素是否可驾驶的预测是在图像空间中完成的,基于图像的uv值,或者说,某个像素是可驾驶的像素,还是不可驾驶。但为了让汽车能够在三维世界中导航,它需要在三维空间中进行预测,这样才能建立互动的物理模型,并处理驾驶任务。
但在从图像空间转变到三维空间的过程中,如果采用这样的方式,像素分割会在系统中产生不必要的瑕疵或不必要的噪声。例如,取决于我们如何将这个图像空间转换到三维空间,图像中地平线上的像素可能会产生巨大的影响。而我们不希望规划技术栈处理带有如此多噪声的可驾驶空间。而这其实并不是一个根本性的局限,只是这种表示方式的局限。
另外,这种表示方式也不能提供场景完整的三维结构,因此很难推理出所有悬空的障碍物,或者墙壁,或者其他可以遮挡场景的物体。
对一般障碍物进行建模的另一个方法,是使用密集的深度信息。在这个任务中,你可以以像素为基础,让网络预测深度,这样每个像素都会产生某个深度值。
但是,尽管这些深度图在颜色空间中进行可视化时,看起来非常漂亮,但当你使用深度值,把射线反向投影计算得到三维点,并可视化这些三维点云时,虽然它们在近处看起来很不错,但随着距离的增加,它们就变得不一致,而且数据很难被后续流程所使用。例如,局部的深度变得不一致,因此,墙就不直了,可能是弯弯扭扭的。
这个方式也有同样的问题,即靠近地平线的物体只由很少的点来表示,这使得规划技术栈很难针对障碍避让编写合理的逻辑。
这些深度图是基于每个摄像机的图像平面生成的,这也使得这个方法很难生成一个汽车周围统一的三维空间。
由于深度图通常被建模为回归目标,很难通过遮挡来进行预测,而且由于网络的特性,边界上也很难进行预测,例如,它们可能会平滑的从车辆变为背景,而这会在三维空间中产生不必要的瑕疵。
对于这个问题,我们的解决方案就是我们内部所称的占用网络(occupancy network)。下面是一个使用我们的占用网络进行预测的例子,我在这里停一下,让你们看看预测结果。
这些占用网络接收所有八个摄像机流作为输入,并生成一个汽车周围空间的体积化的占用值。每一个体素(或汽车周围的每一个位置),网络都会生成该体素是否被占用的结果。事实上,它生成了一个该体素(或三维位置)被占用或不被占用的概率值。
如我所说,它接受所有8个摄像头作为输入,并生成了一个单一的体积化的输出。这个输出的产生,并不是通过拼接各个独立的预测结果完成的,而是网络完成所有的内部传感器融合,并产生一个单一的一致的输出空间。
这些网络能生成静态物体的占用值,比如墙壁和树木之类的东西,也能生成移动物体的动态占用值,比如车辆(大多数情况下),但有时,也包括其他移动的障碍物,如道路上的碎片。
由于输出空间直接是在三维空间中,我们可以通过遮挡来进行预测。你可以预测一条曲线的存在,尽管它可能暂时被汽车遮挡。
最后,这个方法在内存和计算方面都非常高效,尽管表面上看可能并非如此,因为它生成了密集的三维的占用值,看起来可能体积过于庞大。但最终,在内存和计算效率上,这是一种更优的方法,因为它把分辨率分配在那些关键的地方。
如我所说,密集的深度图,或图像中的可驾驶空间,远处的分辨率非常低,而近处的分辨率非常非常高。但在占用网络中,在与驾驶有关的所有体积中,分辨率几乎都一致,这让它变得极其高效。
例如,我向各位展示的网络,在我们的计算平台上运行的时间小于10毫秒,这使得网络可以以100赫兹的速度运行,比摄像机产生图像的速度快得多。
这是如何做到的?让我们简单了解一下架构。
这里我展示了几个摄像流:鱼眼摄像头,这是一个朝向正面的广角摄像头;左立柱摄像头,这是一个面向左边的摄像头。而网络的确获取所有的摄像机作为输入。
我们首先进行归一化处理,以移除所有跟特定车辆相关的配置,比如内部校准,或图像畸变,或类似的因素。
一旦进行了归一化处理,这些图像就会被输入到目前最先进的图像主干架构中。例如,这里我们采用regnets和BiFBNs来提取图像特征,但这可以换成最先进的架构,甚至是来自于CVPR2022的。
这些主干在图像空间中生成了高维特征,但我们希望占用值定义在三维空间中,对吧,怎样才能做到呢?
我们使用基于查询的注意力(attention),来生成这些三维的占有值特征。这其实与几年前一篇同名论文《占有网络》的出现颇为相似,那篇文章也是查询一系列三维点,以确定三维点是否被占用。
这里的网络也有类似的性质,我们接受三维的位置编码,然后将其映射为固定的查询。这些固定的查询然后参与我们每一个图像空间的特征,我们在图像空间中也嵌入了位置信息。这样,这些三维查询参与所有图像流的图像空间查询,然后生成三维的占用特征。
因为这些都是高维特征,很难在空间的每个点上直接进行计算。我们采用的方法,是在较低的分辨率下生成这些高维特征,然后使用典型的上采样技术,如反卷积(deconvs),来生成更密的高分辨率占用值。
有趣的是,当我们开始这个项目的时候,我们最初的目标是只处理静态物体,如墙或树。因为我们有很多不同的神经网络在车内运行,处理不同类型的障碍物,我们并没有继续搭建一个主要处理移动物体的网络,如车辆,行人,自行车手等。
而这些网络也生成了车辆的完整运动学数据,如深度,速度,加速度,动力等。我们有这个移动物体的网络,我们当时想,好的,我们这里不需要处理移动物体,我们只需要处理静态物体,如树,墙等。
但事实证明,很难生成显式定义的本体树。在这个例子中,这也是来自我们自己内部的测试:这里有一辆皮卡车,看起来像一个栅栏。
原创 瓦砾村钱罐 瓦砾村夫
今天,我想谈一谈在视频中没有展示的某个技术,那就是,我们如何处理一般障碍物。
当开始搭建我们更高级的技术栈时,我们想用某种方法来表示一般障碍物。我们一开始使用的是图像空间的分割方法,这几乎是个标准方法。这里,图像空间的每个像素,都被标记为可驾驶或不可驾驶。然后,我们希望规划技术栈可以使用这个信息来导航场景。
但这种方法有几个问题。首先,这些关于某个像素是否可驾驶的预测是在图像空间中完成的,基于图像的uv值,或者说,某个像素是可驾驶的像素,还是不可驾驶。但为了让汽车能够在三维世界中导航,它需要在三维空间中进行预测,这样才能建立互动的物理模型,并处理驾驶任务。
但在从图像空间转变到三维空间的过程中,如果采用这样的方式,像素分割会在系统中产生不必要的瑕疵或不必要的噪声。例如,取决于我们如何将这个图像空间转换到三维空间,图像中地平线上的像素可能会产生巨大的影响。而我们不希望规划技术栈处理带有如此多噪声的可驾驶空间。而这其实并不是一个根本性的局限,只是这种表示方式的局限。
另外,这种表示方式也不能提供场景完整的三维结构,因此很难推理出所有悬空的障碍物,或者墙壁,或者其他可以遮挡场景的物体。
对一般障碍物进行建模的另一个方法,是使用密集的深度信息。在这个任务中,你可以以像素为基础,让网络预测深度,这样每个像素都会产生某个深度值。
但是,尽管这些深度图在颜色空间中进行可视化时,看起来非常漂亮,但当你使用深度值,把射线反向投影计算得到三维点,并可视化这些三维点云时,虽然它们在近处看起来很不错,但随着距离的增加,它们就变得不一致,而且数据很难被后续流程所使用。例如,局部的深度变得不一致,因此,墙就不直了,可能是弯弯扭扭的。
这个方式也有同样的问题,即靠近地平线的物体只由很少的点来表示,这使得规划技术栈很难针对障碍避让编写合理的逻辑。
这些深度图是基于每个摄像机的图像平面生成的,这也使得这个方法很难生成一个汽车周围统一的三维空间。
由于深度图通常被建模为回归目标,很难通过遮挡来进行预测,而且由于网络的特性,边界上也很难进行预测,例如,它们可能会平滑的从车辆变为背景,而这会在三维空间中产生不必要的瑕疵。
对于这个问题,我们的解决方案就是我们内部所称的占用网络(occupancy network)。下面是一个使用我们的占用网络进行预测的例子,我在这里停一下,让你们看看预测结果。
这些占用网络接收所有八个摄像机流作为输入,并生成一个汽车周围空间的体积化的占用值。每一个体素(或汽车周围的每一个位置),网络都会生成该体素是否被占用的结果。事实上,它生成了一个该体素(或三维位置)被占用或不被占用的概率值。
如我所说,它接受所有8个摄像头作为输入,并生成了一个单一的体积化的输出。这个输出的产生,并不是通过拼接各个独立的预测结果完成的,而是网络完成所有的内部传感器融合,并产生一个单一的一致的输出空间。
这些网络能生成静态物体的占用值,比如墙壁和树木之类的东西,也能生成移动物体的动态占用值,比如车辆(大多数情况下),但有时,也包括其他移动的障碍物,如道路上的碎片。
由于输出空间直接是在三维空间中,我们可以通过遮挡来进行预测。你可以预测一条曲线的存在,尽管它可能暂时被汽车遮挡。
最后,这个方法在内存和计算方面都非常高效,尽管表面上看可能并非如此,因为它生成了密集的三维的占用值,看起来可能体积过于庞大。但最终,在内存和计算效率上,这是一种更优的方法,因为它把分辨率分配在那些关键的地方。
如我所说,密集的深度图,或图像中的可驾驶空间,远处的分辨率非常低,而近处的分辨率非常非常高。但在占用网络中,在与驾驶有关的所有体积中,分辨率几乎都一致,这让它变得极其高效。
例如,我向各位展示的网络,在我们的计算平台上运行的时间小于10毫秒,这使得网络可以以100赫兹的速度运行,比摄像机产生图像的速度快得多。
这是如何做到的?让我们简单了解一下架构。
这里我展示了几个摄像流:鱼眼摄像头,这是一个朝向正面的广角摄像头;左立柱摄像头,这是一个面向左边的摄像头。而网络的确获取所有的摄像机作为输入。
我们首先进行归一化处理,以移除所有跟特定车辆相关的配置,比如内部校准,或图像畸变,或类似的因素。
一旦进行了归一化处理,这些图像就会被输入到目前最先进的图像主干架构中。例如,这里我们采用regnets和BiFBNs来提取图像特征,但这可以换成最先进的架构,甚至是来自于CVPR2022的。
这些主干在图像空间中生成了高维特征,但我们希望占用值定义在三维空间中,对吧,怎样才能做到呢?
我们使用基于查询的注意力(attention),来生成这些三维的占有值特征。这其实与几年前一篇同名论文《占有网络》的出现颇为相似,那篇文章也是查询一系列三维点,以确定三维点是否被占用。
这里的网络也有类似的性质,我们接受三维的位置编码,然后将其映射为固定的查询。这些固定的查询然后参与我们每一个图像空间的特征,我们在图像空间中也嵌入了位置信息。这样,这些三维查询参与所有图像流的图像空间查询,然后生成三维的占用特征。
因为这些都是高维特征,很难在空间的每个点上直接进行计算。我们采用的方法,是在较低的分辨率下生成这些高维特征,然后使用典型的上采样技术,如反卷积(deconvs),来生成更密的高分辨率占用值。
有趣的是,当我们开始这个项目的时候,我们最初的目标是只处理静态物体,如墙或树。因为我们有很多不同的神经网络在车内运行,处理不同类型的障碍物,我们并没有继续搭建一个主要处理移动物体的网络,如车辆,行人,自行车手等。
而这些网络也生成了车辆的完整运动学数据,如深度,速度,加速度,动力等。我们有这个移动物体的网络,我们当时想,好的,我们这里不需要处理移动物体,我们只需要处理静态物体,如树,墙等。
但事实证明,很难生成显式定义的本体树。在这个例子中,这也是来自我们自己内部的测试:这里有一辆皮卡车,看起来像一个栅栏。
✋热门推荐