编辑: lonven | 2019-12-21 |
4 期 一场学习革命 (北京大学 赵鹏巍 编译自 Marric Stephens.
Physics World, 2019, (3): 45) 图1 新型学习.人工神经网络近似模拟真实生物大脑 的工作模式,每个输入经由一层或多层隐藏的人工神 经元处理 当银行打电话提醒你的信用卡 在陌生时间发生可疑大额消费时, 这不大可能是经由一位亲自梳理过 你个人帐户的好心银行员工发现 的,相反,这更像是机器学会了判 断与犯罪活动相关联的行为,并在 你的账单中发现了一些意外情况. 银行的计算机系统利用算法可以静 静地、高效地监控你帐户上的盗刷 迹象. 监控信用卡只是 机器学习 的一个例子.机器学习是指计算机 系统通过在给定的示例集上训练, 从而发展出灵活自主地执行任务的 能力的过程.作为更广义的人工智 能领域的一个子集,机器学习技术 能够被应用于任意可挖掘输入输出 之间关联的大型复杂数据集中.对 于上面提到的银行,算法将分析大 量合法以及非法交易数据,以便从 给定输入( 凌晨
3 点产生的大额消 费 )产生输出( 盗刷嫌疑 ). 机器学习不仅仅应用于金融领 域,也正在被应用于医疗保健、交 通运输、刑事司法以及科学研究等 许多其他领域. 量子问题 机器学习对量子物理,特别是 量子多体问题 的求解可能产生深 远的意义.这类问题产生于一组相 互作用着的物体,且只能通过考虑 其量子性质才能理解整个体系.美 国纽约西蒙斯基金会Flatiron研究所 的物理学家 Giuseppe Carleo 指出: 量子多体问题的共性在于研究体系 的性质原则上需要完全了解体系的 多体波函数这一事实 ,而多体波函 数,用Carleo 的话说, 是一个怪 物,其复杂程度随着体 系组分数量的增加而呈 现出指数级的增长 . 例如,考虑一组由若干 粒子组成的系统,每个 粒子均有顺时针和逆时 针两个自旋方向.对于 两粒子系统,共有四种 可能的状态,三粒子系 统则有八种可能状态, 这时体系仍然是容易处 理的.但随着粒子数增 多,复杂程度很快就会 超出可控范围. 传统方法无法有效地处理具有 一定组分数量的量子多体问题,所以Carleo 及其瑞士苏黎世联邦理工 学院的同事 Matthias Troyer 使用了 机器学习方法.他们发现一个相对 较 浅 的神经网络――仅使用单 个隐藏层,已经可以有效地 学习 表征体系的波函数了,一维或 二维晶格上的自旋问题便是一例. 与求解量子多体问题相同的困 难也出现在 量子态层析成像 中.正如层析成像从外部测量来重 建物体的内部结构一样,量子态层 析成像通过对量子态易于测量的部 分进行少量次数的测量来确定一个 系统的量子状态.与量子多体问题 一样,编码在波函数中的信息量随 着系统中组分数量的增加而呈指数 增长. 量子比特在量子计算机中的纠 缠方式是一个值得描述的量子态, 这使得量子态层析成像对于理解量 子计算机应该如何应对噪声和退相 干性至关重要.问题在于任何实用 的量子计算机都将包含数十或数百 个量子比特,故直接去确定其量子 态的方法是不合适的.这正是人工 神经网络可以发挥作用的地方,Carleo 发现神经网络可以高效地重 建含
100 个量子比特的量子计算机 的量子态,而标准方法仅限于大约 机器学习的基础工作早在上世纪中叶已经奠定.然而,正如Marric Stephens所发现的,越来越强大 的计算机以及过去十年间不断改进的算法,正推动着机器学习在从医学物理到材料科学等诸多方面应用 的爆发. ・ ・
246 ・48卷(2019 年)
4 期 8个量子比特. 机器学习的应用还远没有结 束.机器学习方法仅是最近才被应 用于量子物理领域,这意味着研究 仍处于原理论证阶段.实际上,Carleo 及其同事展示的方法通常涉 及仅含一或两个隐藏层的神经网 络,而更成熟的商业应用――如Google 和Facebook 等,能够利用更 深层的架构,并在针对特定任务优 化的专用硬件上运行. 不幸的是,量子物理的奇异特 性使得这些更复杂的神经网络不能 简单地直接移植到量子问题上,Carleo 等人不得不几乎从头开始设 计算法,目前还未达到与机器学习 应用前沿相当的复杂度,而赶上那 些成熟的算法,将允许人工神经网 络解决更复杂的量子问题.Carleo 指出: 我认为未来几年会看到原理 方法与技术实现之间的鸿沟越来越 小,并带来我们现在甚至无法想象 的应用. 寻找新材料 虽然人工神经网络在给出有用 的结果前通常必须有大量数据集作 为输入,但美国弗吉尼亚大学的 Prasanna Balachandran使用一些数据 需求并不是很大的方法.他的研究 目标是从巨大的多维可能性空间中 找出相对较小的能制造有益材料的 配方空间.通过试错法来寻找这样 的空间将会花费太长时间,而且对 应属性已知材料的区域也仅仅是全 空间的极小一部分. Balachandra 用来解决这一问题 的方法是一种特殊类型的机器学 习,称为统计学习.这种方法通过 假设数据特征遵循严格的统计规律 来绕过机器学习对大量训练集的需 求.他解释道: 我们训练机器学习 模型去掌握我们已经 知道的东西,进而用这 些模型来预测我们不知 道的东西 . 在新材料研究中, 我们知道某些材料组 合的行为,而想要预 测的是每个其他可能 组合的性质.然而,预测给定材料性质的 可信度依赖于对其邻 近材料的了解情况,因此,对于每个预测, Balachandran 还量化了 与每个预测值相应的误差. 统计,统计,统计 尽管机器学习技术已经在医 学、量子和材料物理学方面形成了 具体的成果和无可替代的前景,但 在统计物理学中的进展却没有那么 清晰.在法国巴黎萨克莱大学研究 机器学习理论的 Lenka Zdeborová承 认道, 我们仍在等待一个被科学同 行认可的,没有机器学习的帮助就 无法完成的重要例子. 当然,机器学习技术在统计物 理学中有一些有希望的进展,但Zdeborová说这些技术迄今尚未处于 该领域的前沿.她指出,有数十篇 论文使用神经网络来研究一些统计 模型,例如二维伊辛模型――该模 型描述了二维晶格上自旋粒子之间 的相互作用,但迄今还没有得到任 何全新的发现. 机器学习尚未推动统计物理学 的进步也许会令人感到失望,但相 关的知识与前景必定走向另一方 向.试想识别图像所需的神经网 络,每个图像都会包含大量数据(像素)并且会伴有噪音(因为任何给定 的图像都会被大量不相关的特征掩 蔽),而且网络中的不同权重之间也 存在相关性. 令人高兴的是,多维、有噪声 和有关联的问题正是统计物理学家 自上世纪中叶以来一直在学习如何 应对的问题.研究一种被称为 自旋玻璃 材料的Zdeborová 说道: 试想针对无序系统中发展出来的物 理学理论 .这样的系统具有许多粒 子(即许多的维度),具有有限的温 度(即具有热噪声),而且具有许多 粒子间的相互作用(即许多的关联).事实上,在某些情况下,描述 机器学习模型的方程与用于处理统 计物理系统的方程完全相同. 这一发现可能是发展一个全面 理论的关键,这一理论可以解释为 什么这些方法会如此有效.虽然目 前机器学习的发展也许比几十年前 通常预测的还要进步一些,但其成 功仍然主要来自经验性的试错法. Zdeborová总结道: 我们希望能够 预测最优的机器学习架构,知道应 该如何设置参数以及采用何种算 法,目前我们还没有线索知道如何 在不投入大量人力的情况下获得这 些知识. 图2大浪淘沙,沉者为金. 统计学习可用于从大量 可能的材料结构中筛选出可控的数量以进行实验 ・ ・ 247
........