但是又清楚得知道，让你这样的，和让我们能够遇见的，又何止是因为一个地方呢?【CVPR

首页发布

真的想读弘一法师的文字好久好久了。终于在农历七月十三那天，和他的缘分来了!

怀着在千万人之中遇见了想遇见的李叔同的欣喜，发现了他也不是我想象的样子。我赋予了他光环，忘记了他也是个有血有肉的人。[跪了]

我也曾经想，来个天崩地裂坠入无边深渊是不是可以了解自己，是不是这样更好，现在更偏向于在每一个平静的日子中去感悟爱和慈悲的真谛，在每一件小事中去修养身心修证道德。

感恩遇见你，弘一法师，读你的文字的时候，仿佛是在时光长廊中，和你擦肩而过了。

有时间要去虎跑寺，看看让你决定出家的地方。但是又清楚得知道，让你这样的，和让我们能够遇见的，又何止是因为一个地方呢?

【CVPR 2022 | 大幅提升全景分割效率，#谷歌# 联合学界从聚类角度重新解释掩码转换器】

在#自动驾驶# 、图像识别等领域，图像分割技术是其核心技术之一。全景分割方法是近年来发展迅速的最前沿的一种重要方法，它不仅可以赋予计算机更多的想象力，还可以帮助其预测周围的环境。

早期的全景分割方法通常将全景分割分为两大类任务，即语义分割（semantic segmentation）和场景分割（occasion segmentation）。在自动驾驶场景中，语义分割的目的是给图片中的每个像素分配其语义标签，如“行人”“天空”等，在接下来进行的场景分割中，计算机则会在图片中找到并分割出每一个可数的对象，如“行人 A”、“行人 B”、“汽车 A”等等。

而且更为繁琐的是，这两类任务还被划分为许多个子任务，其中每个子任务都被单独处理，之后每个子任务阶段的结果，则通过进一步的模块来合并。这样带来的问题是，在处理子任务并将不同子任务阶段的结果进行合并时，会引入许多手工模块。

在 2021 年的 CVPR 上，由谷歌研究院以及#美国约翰霍普金斯大学# 的研究人员发表的 MaX-DeepLab 方法的相关论文里，受转换器（Transformer）和 DETR 方法的启发而提出，该方法是一种使用了掩码转换器的端到端的解决方案，有效克服了上述缺陷。

具体来说，该方法采用由卷积神经网络组成的像素路径，来完成像素提取的工作；并且采用由转换器解码模块组成的记忆路径，来进行记忆的提取；同时还引入了双路径转换器，来完成所选像素与所选记忆之间的交互工作。

不过这一方法存在一个问题：双路径转换器中的交叉注意力模块，本来是为语言任务而开发，也就是说作为输入的序列通常只有几十个或更多的短语。

但是如果将这一方法用于全景分割，尤其是那些带有联想型或前瞻性的任务中时，作为输入的序列则由数十个或更多的像素组成，规模变庞大了许多，这时该方法就有些余力不足。

也就是说，既将原本为自然语言任务设计的交叉注意力模块应用于图像领域，需要进一步的调整。

而就在最近，该团队在 CVPR 2022 上发布的名为《CMT-DeepLab：用于全景分割的聚类掩码转换器》（CMT-DeepLab: Clustering Masks Transformers for Panoptic Segmentation）以及在 ECCV 2022 上发表的《kMaX-DeepLab：k-means掩码转换器》（kMaX-DeepLab: k-means Masks Transformer）这两篇论文中，针对 Max-DeepLab 方法进行了改进，尤其是将交叉注意力以聚类的视角进行了重新解释与设计，提出了更适合带有联想型或前瞻性任务的全景分割方法。

戳链接查看详情：https://t.cn/A6S2BM67

观陶艺术馆是由观陶联合100位国家级陶瓷艺术大家倾力打造的公益性展示馆，内含四大区域，包括作品陈展、陶艺体验、学术研究交流、投资交易等。

观陶艺术馆专门设立了陶艺体验区，以趣味实践教学的方式来推广陶瓷工艺，发挥每个小朋友的想象力和创造力，给每一个陶艺制品赋予了新的美感和意义，创造独属于体验者的陶艺之旅。