扎克伯格：AI技术才是AR和VR的万物之源

扎克伯格：AI技术才是AR和VR的万物之源

首页发布

hi188｜编辑

在去年一连串的轰炸之下，“元宇宙”这个词终于被“用滥了”。

当Meta提出全面转型元宇宙时，就已经骗过了不少人。而当那些追随者纷纷晒出自己所谓的“元宇宙”产品时，Meta再一次拿技术实力打了它们的脸。

充分结合了AI技术，将是未来AR/VR发展的重要一环，这一点我们在Quest 2、以及Workrooms等产品上已经看到。包括Quest 2的定位追踪，手势识别，桌面和沙发追踪，键盘追踪等都不离不开AI技术的加入。

这一次，Meta打算进一步发挥AI的作用，让AI技术生成你想要的虚拟场景，“你说出来，机器就做出来”，给了一众BUG多、审美怪的”元宇宙“怪咖当头一棒。

不仅如此，这项研究基础“基于AI的语言和机器翻译模型”也将被用于更多场景。在今天的AI技术论坛（Inside the Lab）上，Meta向外界展示包括：Builder Bot、基于LASER语言工具包的多语言翻译模型、语音助理AI模型Project CAIRaoke、成立人工智能学习联盟，免费在线提供课程。

同时，Meta熟悉AI科学家杨立昆也分享了打造具备生物级别思考能力的AI模型愿景，通过自主智能架构，让AI模拟世界的运作方式，接近人类智能水平，简直不可思议。

当然，我们在本文中将重点来说一下Builder Bot和多语言翻译模型。

1，理想化的三维场景创建模型

众所周知，目前的VR设计平台一个重点就是虚拟场景的丰富性，其中包括头部VR社交平台已经允许用户自定义虚拟场景，这是保持多样性的重要一步。

对于大多数而言，在三维场景中（例如佩戴VR条件下）创作并非易事，不仅效率低下，而且难以达到理想的状态。当然，我们知道很多的虚拟场景基本上也都是在2D屏幕下，通过专业设计师或准专业人士（爱好者等等）来开发的。

所以，对于Meta这样的企业也一直在思考，VR和AR中的便捷性如何体现。

AI或许是最好的方案。就像是如今AI创作画作一样，将AI技术延伸到三维场景中，你指出要说出你想要的场景，Builder Bot就能帮你实现。

从上面的视频也能看出，扎克伯格的整个演示视频基本十分流畅，机器能够听懂创作者意图并且给出基本合理的场景，很难挑出其中的瑕疵。

扎克伯格表示：AI是元宇宙的关键技术之一。正如AI、机器学习等技术在其它领域的应用，在虚拟场景中它可以用来帮助我们很好地理解上下文，甚至像人类一样理解和预测我们想要做什么。这一趋势，未来会更为明显。

2，人工智能学习联盟

在介绍翻译系统之前，我们先来看一下Meta的人工智能学习联盟。

扎克伯格举例表示：目前的AI系统多收到过监督学习训练，也就是说，如果想让系统知道这张照片中是一只猫，就需要明确告诉它，并且拿出几万张猫的图片进行标注，让系统进行监督学习。这些系统有着不错的效果，尤其是用于图像和视频领域，但前提是需要进行大量数据标注的学习过程。

因为在虚拟的三维场景中，环境复杂多变，就像现实环境一样，几乎很难用传统的数据标记法进行监督式学习，因此也就无法支撑自由、随意互动的元宇宙生态。

Meta首席AI科学家杨立昆，也是2018年图灵奖得主，他认为：“自监督学习”可以提供真正的接近人类思维的AI系统。感兴趣的朋友，也建议读一下杨立昆的《科学之路》这本书。

自监督学习的优势在于无需给出数据标注，模型可以从无标注的数据中自我学习，是一种理想的机器学习模型。

目前Meta已经联合13所大学组成联盟，组成了有史以来最大的自我监督学习数据集，目前积累了几千小时的第一人称视频，大家可用于研究在虚拟空间中的任何工作。

3，多语言翻译系统

虽然现在翻译软件已经能够很好的应用到文本中来，YouTube视频也支持提取英文并进行翻译，但是在三维场景中存在同样的问题。

如同我们日常生活，在虚拟场景中与任何人交流时并不会看到文字或字幕，即便是外国人。因此，常规的翻译方案并不适用于三维场景。

扎克伯格表示：目前全球仍有近一半人群无法在互联网上使用自己的语言，例如在中非和西非地区有几百万人的语言在互联网并不流行，只能访问英文或其它语言。

另一个现实是，即便目前最主流的机器学习翻译模型，也只能通过英语作为中转语言，即：将A语言翻译为英文，再将英文翻译为B语言。

而这就会给翻译增加一些噪点和不确定性。为此，Meta推出了开源AI翻译模型：LASER语言工具包。

LASER特点是可以将任何句子转换为其它语言，省去了英文中转步骤，例如A语言可以直接翻译为B语言。

目前，已经支持100多种语言的翻译，并且进行了1400小时的法语、德语、西班牙语、英语之间确定性的语音对齐。这其中的难点包括：口语到书面语的表达形式不同，尤其是少见的没有书面习惯的语言。

为此，Meta也正在开发一套语音到语音翻译系统，即可以实现：A语言的人说话，B语言的人直接收听翻译后的语音。Meta表示：这种方法已经被证明比常规单独语音识别+机器翻译的合成模型要更快。

当然，这类语音到语音的翻译系统，更是为了今后的AR眼镜所准备，届时一套接近人类翻译水平的实时翻译眼镜就。

除此之外，Meta还公布了CAIRaoke，这是一套专为AR虚拟助手开发的AI对话模型，目的是让机器人聊天助手更好的理解你的说话内容，可以更好与你对话，在三维场景中互动。

（ END）

发布 👍 0 举报写留言 🖊

✋热门推荐

洗衣服时，清洗衣物的水，可用于冲厕所、擦地板，一次可节约30L~40L水。刷牙使用杯子接水，如果水龙头开着两分钟，则会浪费掉18L左右的水，而用杯子接水漱口，只

时光在岁月长河里不停地轮回记忆在前世今生里不停地交汇漫漫星河醉转眼间春去秋来雁儿已南飞谁又能舍下和你这一生相随在梦里转了千百回看落花无言流

今天我们见到aki啦！！

1、在社会心理学中，人们把只想做好当前事从不考虑此外的一切其他事而所取得成功的现象，称之为“瓦伦达效应”。[2]瓦伦达效应告诉我们，做事情要专心于事情过程的本身

这电影是真实事件改编的，很好看，上学的时候在中央六看过，没感觉，那时候我还小，不能体会一个单亲妈妈的感受，现在感同身受，不同的是她有三个孩子，所以我感觉乔治简直

哈哈哈哈哈哈哈我对娱乐和挂粉都什么兴趣，我说漫画都是我资深独家。）我最开心得是出书，我跟别人的点永远不一样！

”#曼联[超话]##C罗##曼联足球俱乐部# ⚪️⚫️⭐️在连续获得英超三月最佳进球和俱乐部三月最佳球员奖项后，C罗表示：：“虽然个人成就总是令人愉悦，但当它们

小陈每天小毛驴横跨三大区，想想就觉得自己可能在干什么伟大事业，然后认真想了想，我连下乡支援都算不上，害。小陈六点多下楼排队做核酸为了能够按时上班，以为今天会很困

整理一下目前中传绿色通道部分明星考生成绩贺峻霖：播音主持A 表演B 敖子逸：表演A 马启越：表演A 边程：表演A 黄星羱：表演A 表演（音乐剧双

」酒酣尽性后，怀素和其师法的张旭，喜醉后纵笔，抱影飞舞的书境非是随兴想像，则是在长期苦练里 , 摸索书艺气韵的严肃章法；蕴藏的内功，运筹帷幄之中，挥毫千里之外。

#罗云熙[超话]#【碎碎念】咱做兔子[兔子]的得耐得住寂寞，守得住底线，扛得住妖怪，抵得住酸爽。粉罗云熙就像在跟一个爱打游戏的男生谈恋爱，说不得，打不得，吵不得

2022年1月10日下午，广西桂天能源集团有限公司为宾阳县思陇中学捐资10万元，这是在思陇乡贤黄培智带动下又一家企业为学校捐款。#其它寻人# 约1975年出生1

#甘肃新闻# 【关于“五一”假期对S106线折达公路实行货车分时段临时限行的通告】为确保“五一”小长假期间临夏回族自治州道路交通安全畅通，经临夏州公安局交警支队

房子我在房东手里签的所以没有中介费用[太开心]随时可入住房子在富力运河十号，环境超级高档小区内就是地铁哦！房子我在房东手里签的所以没有中介费用[太开心]随时可入

#比赛时间# 2021年11月，江苏·南京#比赛级别# 此次竞赛是国家人力资源和社会保障部批准的国家二类竞赛，由中国就业培训技术指导中心、中国工程建设焊接协会联

怎么做到呢?[心]进入母亲的角色，做宝宝的保护者产后最初的一段时间，妈妈需要转换自己的角色，勇敢承担起为人母的责任，捍卫宝宝需要母乳喂养和妈妈陪伴的权利，而不

#极致be美学# 我倒要看看谁看了这个tag不会想起灰塔笔记[失望]他们的爱与哀恸为伍，和悲剧永存：■“你这是谋杀，亲爱的。今天看了以爱的演唱会真的很有感触隔

全面综合的补充缺水初老肌肤所需营养[666]，历经加拿大多项严苛的质量检验，品质放心。医食本是同源，食物运用得好同样也可以治病。

#mrmiss组合[超话]##疗养院夜话##mrmiss粉丝可真棒# 请大家记住：MrMiss有大家才是真的了不起！如果不是因为有她的话，我是当真不知道原来女孩