与传统的成对的自注意力相比，这种模型可以迫使不同模态的信息通过少量的瓶颈隐表示，从而

与传统的成对的自注意力相比，这种模型可以迫使不同模态的信息通过少量的瓶颈隐表示，从而

首页发布

【NeurIPS】新颖的音视频模态融合架构 MBT，多模态融合注意力瓶颈

出品人：jaelgu（GitHub）

人们通过从多种模态（比如视觉和音频）处理和融合高维输入来感知世界。机器感知模型通常会针对模态来进行设计和优化。因此晚期阶段融合一个单独模态的的特征或者预测结果，是多模态视频分类的一个主流范式。与此不同，MBT （Multimodal Bottleneck Transformers）提出了一个新颖的策略，基于 transformer 架构使用了“融合瓶颈”，在多个层进行模态融合。与传统的成对的自注意力相比，这种模型可以迫使不同模态的信息通过少量的瓶颈隐表示，从而要求模型来去压缩每个模态的相关信息。这种策略可以在减少计算开销的同时改进融合性能。

MBT 限制在同一层内 token 之间跨模态的注意力流。具体来说，是允许模态内的的自由注意力流，但是强制模型来压缩模态的信息。其核心想法是引入一小部分隐式的融合单元形成一个“注意力瓶颈”，跨模态的信息必须从中进行通过。MBT 证明了使用该方法的模型超过了无约束的模型，并且降低了计算量。

如果你觉得我们分享的内容还不错，请不要吝啬给我们一些鼓励：点赞、喜欢或者分享给你的小伙伴！

如果你对我们的项目感兴趣请关注：

[微风] 用于构建模型推理流水线的框架 Towhee：https://t.cn/A6SZZgUj

#男子炒菜触发消防喷淋被淋1小时#许多火灾事故的发生，都是因为不注意小细节引起的。因此，日常生活中，一定要注意以下几点：①将灭火器放在易取的位置；②将打火机等可能引起火灾的物品远离卧室；③做饭中途请不要随意离开厨房；④微波炉、烤箱等大功率电器必须配置专用插座；⑤电插座上插头不宜超过3个…更多内容戳图了解↓↓及时消除火灾隐患，时刻注意消防安全

#男子炒菜触发消防喷淋被淋1小时#许多火灾事故的发生，都是因为不注意小细节引起的。因此，日常生活中，一定要注意以下几点：①将灭火器放在易取的位置；②将打火机等可能引起火灾的物品远离卧室；③做饭中途请不要随意离开厨房；④微波炉、烤箱等大功率电器必须配置专用插座；⑤电插座上插头不宜超过3个…更多内容戳图了解↓↓及时消除火灾隐患，时刻注意消防安全！

发布 👍 0 举报写留言 🖊

✋热门推荐

[好喜欢] 给自己和娃娃准备的必须是好的[酷]早上面包煎蛋配上一杯泰[太阳]国高品质植物奶活力满满[羞嗒嗒]天然椰子花蜜甜味不长胖~ 和娃娃一起干杯呀～[

据粗略统计，他们的共同财产约为6.4亿元，是韩国最富有的明星夫妇因为结婚消息的突然到来，外界猜测他们是奉子成婚，但他们的回应是：“他们觉得是时候结婚了，并不是因

#北京招聘[超话]##国考[超话]##公务员考试[超话]##事业单位[超话]##教师招聘[超话]##考研国家线[超话]##新传考研[超话]##传媒招聘[超话]#

#阳光信用# 善良是黑夜的月光，给夜行的人照亮前行的路；善良是寒冬的暖阳，给寒冷的人些许温暖的光；善良是酷暑的微风，给闷热的人一丝期待的凉。善良是黑夜的月光，给

我永远爱易烊千玺啦～[心]#易烊千玺[超话]#今天学个了吉利数字：8小时8分【发大财啦】✌(̿▀̿ ̿Ĺ̯̿̿▀̿ ̿)✌臭屁烊是我的是动力啊，我也要努力追上他

#热门楼盘推荐#【金州金宸联郡】价格：约8700元/㎡全部户型：二居室(79㎡) 三居室(87㎡)楼盘概况：金宸联郡位于金州新区五一路南部核心区域，北邻大黑山自

有些精彩注定属于他人，你无须驻足；走好平凡的步履，期待常会不约不至。有些精彩注定属于他人，你无须驻足；走好平凡的步履，期待常会不约不至。

一家班列运营公司相关负责人向证券时报·e公司记者表示，目前公司从阿拉山口出去到德国的线路，基本已停止运行，但至俄罗斯、中亚的班次增多了，总体运行班次没有变化。此

至此，东数西算的二波反抽，虽然只有几天的时间，但都完美收官，每个票全部大肉出局，后续虽然保持关注，但股桃小妹基本未提示相关个股，直到下次重新出现明确的龙头个股后

我一同事昨天感冒了，有点难受，想请一天假休息一下，由于我们刚进入这个部门没有多久，就没有领班的联系方式，想着在工作群里加她好友跟她说一下，结果人家直接不理她[允

暴力测试可能比较极端，但是如果你愿意花点时间，就能搜到非常多“iPad Pro 2018机身弯曲”的案例。值得一提的是，后来苹果并没有重视这个问题，Zack又测

5k-5w-常见眼综合模版：（如图）元气少女眼网红芭比眼初恋电眼原生魅眼有些人的眼型依靠高超的化妆技术可以改善，但是有些女生的眼睛是依靠化妆也无法拯救的，想做眼

上半场就三次后场一条龙得手，下半场一开始，招了恩比德和哈里斯的夹击后，平时会传球的他选择不传，一个反变向摆脱强投三分球，投完后朝对面瞪眼：打的就是你！但勇士的防

其实尝试看开了以后，我的理解是这样的：现在改用了便宜一点的手段去做不那么好的3D子供动画，是为了至少实现项目收益，让公司能挣钱，那么日后才有机会去做像以前那样好

老祖宗泰伯三让天下的美德和开发江南的功德，受到世世代代的传承与敬仰……”#好好的名字被姓毁了#【无锡姓氏的来源与分布】先秦，无锡姓氏为数不多。吴姓祠堂的对联写的

还是想发出来[哇]我跟partner都挺满意的海报虽然说因为没做ppt被骂的狗血淋头但是要说我们主题不突显标题少冠词是silly mistake（并没有错、我

UCCA Lab 邀请Fn媒体实验室以南明河为灵感，创作全新的新媒体交互装置作品《南明秘境》。因为疫情防控需求，磐安县文化和广电旅游体育局将原本线下樱花季活动改

▪️公园保留了居住在该地区的古代土著部落的遗址，包括古代普韦布洛人（也称为阿纳萨齐）和纳瓦霍人，现在仍然是大约 40 名纳瓦霍人家庭的家园。所以直到现在在欧洲城

#香港##港闻##守护香港##疫情防控##守护香港# （点新闻）#杭州圈[超话]# 3月2日，杭州萧山国际机场传来好消息：杭州萧山国际机场三期项目新建航站楼及陆

年少的欢喜往往需要很少的养料，你朝我不好意思的望笑一撇就够我快乐好几天，咀嚼四分之一的酸枣能尝出两百多天阴晴雨暖，牵过的手不肯洗，留过余温的铅笔写起来流水行云，