尖峰对谈:联邦学习奠基人的首次思想碰撞
近年来,人工智能技术快速被应用于千行百业,数据作为新时代的重要生产要素,是各机构、领域乃至社会的基础性战略资源成为全球共识。如何解决“数据孤岛”问题,保证数据安全与隐私保护,成为业界关注的核心问题。联邦学习作为新一代隐私计算关键技术,能有效解决AI协作与联合建模中的隐私保护和数据安全问题,实现“数据不动模型动,数据可用不可见”,因而受到产学研用各界的广泛关注。
在联邦学习技术走向纵深发展的关键期与变革期,IEEE标准协会组织了这场巅峰对话,围绕联邦学习的技术突破与实践进展、生态建设、国际标准等维度,两位联邦学习领域的科学家国际名人进行了精彩纷呈的对话。
事实上,Blaise Aguëra y Arcas博士与杨强教授颇有渊源,双方都在联邦学习技术的发展史上留下了浓墨重彩的一笔。2016年,Blaise Aguëra y Arcas博士所在的谷歌研究团队首次提出基于个人终端设备(C端)的“横向联邦学习”算法框架,正式将联邦学习这一新技术配置引入人工智能领域。2018年,杨强教授团队在国内首次提出面向企业和机构(B端)的“纵向联邦学习”算法框架,成为打破企业与企业、机构与机构间“数据孤岛”阻碍的关键技术,随后又进一步提出了更具通用性的“联邦迁移学习”解决方案,将联邦学习带入了大众视野。
时至今日,联邦学习已被大量应用于金融、医疗、智能营销等多个领域,并于2019年首次列入Gartner数据科学与机器学习技术成熟度曲线,成为当前最值得关注的技术趋势之一。在学术界、工业界和产业界的共同关注与推动下,联邦学习在技术研发、产业应用及国际标准制定方面均取得了高质量的发展成果,并朝着新的发展阶段迈进。
国际共识:联邦学习技术发展进入“生态系统”阶段
对谈中,针对联邦学习“标准化”建设,Blaise Aguëra y Arcas博士与杨强教授一致认为,当前联邦学习“标准化”的几大关键要素:联邦学习持续发展过程中不断升级的安全性需求应对、市场教育与商业化以及联邦学习生态建设的激励机制构建等
关于联邦学习生态的未来前景,无论是基于谷歌C端业务实践还是国内企业级解决方案的应用,两位科学家达成共识:目前,联邦学习已进入“生态系统”阶段,并各自给出了针对如何推动联邦学习生态发展的建议。
Blaise Aguëra y Arcas博士作了一个生动的比喻,“数据迁移好比DNA的交换与移动。在一个巨大的生物体上,分散在不同细胞的DNA能够从一个细胞到另一个细胞的横向转移。同理,联邦学习也像巨大的、分布式有机体,它有一个元基因组,比任何一个特定的细胞都要大得多。”
联邦学习首创团队带头人、谷歌研究院副总裁Blaise Aguëra y Arcas博士
他表示,联邦学习解决了一般机器学习未能解决的问题,即在不牺牲隐私的前提下,实现数据“基因”在生态内的流动,该生态环境十分广阔,甚至可能超过了我们的想象范围。
杨强教授表示认同,他认为这种机器学习在现阶段的变革和自洽正是人工智能进一步成熟化的标志。在他看来,下一步是去利用所有的数据仓库来建立小的模型,这些小模型尽管不能实现实体共享,但能纳入一个模型网络来建立一个虚拟的预训练模型。“这种虚拟模型会更加活跃,在某种意义上也更加先进。是对当前分布的一个更加准确的映射。”
国际标准:联邦学习“标准化”提供规则及通用语言基础
IEEE标准协会CXO及中国战略合作总监王亮迪博士作为对话主持人, 在总结时提到,两位科学家让我们看到,联邦学习是个进化中的生命体,色彩纷呈,保护个人用户的隐私、建立社会信任是它的生命力所在。2022年联邦学习迈向超级“元生态”,愿它服务于人类福祉。两位科学家和他们的工作为人师表,让我们加入他们,一起用联邦学习的技术、产业、生态共创美好世界。