何恺明组新论文:只用ViT做主干也可以做好目标检测
做目标检测就一定需要 FPN 吗?昨天,来自 Facebook AI Research 的 Yanghao Li、何恺明等研究者在 arXiv 上上传了一篇新论文,证明了将普通的、非分层的视觉 Transformer 作为主干网络进行目标检测的可行性。他们希望这项研究能够引起大家对普通主干检测器的关注。
https://t.cn/A66lW9Qf
做目标检测就一定需要 FPN 吗?昨天,来自 Facebook AI Research 的 Yanghao Li、何恺明等研究者在 arXiv 上上传了一篇新论文,证明了将普通的、非分层的视觉 Transformer 作为主干网络进行目标检测的可行性。他们希望这项研究能够引起大家对普通主干检测器的关注。
https://t.cn/A66lW9Qf
#NVIDIA# #GTC22# 【GTC22 | 从智慧城市到体育组织:了解智能视频分析技术如何改变未来】3 月 21 日至 24 日召开的全球 AI 大会 —— NVIDIA GTC 将举行 900 多场分会,其中有 20 多场分会将以视觉 AI 为主题,届时将有许多 AI、高性能计算和图形学领域的全球顶尖研究者和行业领袖出席。查看详情:https://t.cn/A66fMF61
西安交大最新「基于深度神经网络的高效视觉识别」综述论文,32页pdf329篇文献阐述深度视觉识别研究进展与新方向
视觉识别是当前计算机视觉、模式识别乃至人工智能领域最重要、最活跃的研究领域之一。它具有重大的基础重要性和强烈的工业需求。在大量训练数据和新的强大计算资源的帮助下,深度神经网络在许多具体任务上大大提高了其性能。虽然识别精度通常是新进展的首要考虑,但效率实际上是相当重要的,有时对学术研究和工业应用都至关重要。此外,整个社会也高度需要对效率的机遇和挑战有深刻见解。虽然从不同角度对DNN的效率问题进行了全面的调研,但据我们所知,很少有系统地关注视觉识别,因此不清楚哪些进展适用于视觉识别,还有哪些需要关注。在本文中,我们回顾了近年来的研究进展,并对提高DNN相关视觉识别方法的效率提出了可能的新方向。我们不仅从模型的角度进行调研,而且还从数据的角度进行调研(在现有的调研中并非如此),并关注三种最常被研究的数据类型(图像、视频和点)。本文试图通过全面的调研,对视觉识别问题进行系统的总结,以期对从事视觉识别研究的研究者和实践者提供有价值的参考。
https://t.cn/A66GbbwD
视觉识别是当前计算机视觉、模式识别乃至人工智能领域最重要、最活跃的研究领域之一。它具有重大的基础重要性和强烈的工业需求。在大量训练数据和新的强大计算资源的帮助下,深度神经网络在许多具体任务上大大提高了其性能。虽然识别精度通常是新进展的首要考虑,但效率实际上是相当重要的,有时对学术研究和工业应用都至关重要。此外,整个社会也高度需要对效率的机遇和挑战有深刻见解。虽然从不同角度对DNN的效率问题进行了全面的调研,但据我们所知,很少有系统地关注视觉识别,因此不清楚哪些进展适用于视觉识别,还有哪些需要关注。在本文中,我们回顾了近年来的研究进展,并对提高DNN相关视觉识别方法的效率提出了可能的新方向。我们不仅从模型的角度进行调研,而且还从数据的角度进行调研(在现有的调研中并非如此),并关注三种最常被研究的数据类型(图像、视频和点)。本文试图通过全面的调研,对视觉识别问题进行系统的总结,以期对从事视觉识别研究的研究者和实践者提供有价值的参考。
https://t.cn/A66GbbwD
✋热门推荐