机器学习:现在与未来

王威廉

卡内基梅陇大学计算机科学学院,美国宾夕法尼亚州 匹兹堡15213

2016年3月,在韩国首尔四季酒店举行的谷歌DeepMind围棋挑战赛,人工智能围棋软件AlphaGo以4∶1战胜了韩国棋手李世乭九段。本次比赛后,关于人工智能和机器学习的话题迅速升温,引起社会各界的关心。然而,除了在本领域工作的一线科研人员,其他人士对人工智能和机器学习的发展现状和前景了解的却不多,甚至存在不少误解。在此,本文希望能跟读者探讨一下人工智能和机器学习,谈谈其发展现状与未来趋势。

1 什么是机器学习?

机器学习是人工智能的一个分支学科,主要研究的是让机器从过去的经历中学习经验,对数据的不确定性进行建模,在未来进行预测。举一个最简单的二分类例子(图 1),假设现在想用机器自动把网页分成2大类:体育和非体育类网页。首先需要收集训练样本,在这里,指得就是各种体育类和非体育类的网页。接下来,需要对样本进行分析,通过一些抽象化的描述,定义特征。譬如,分析网页里应用的词语以及每个词语出现的次数。第三步为数据建模。通常,需要设计数学模型,来分析特征与标签的分布情况。具体来说,是通过优化方法,学习一个映射函数,其输入是一个样本的特征向量,其输出是标签(体育类或非体育类)。在预测阶段,当用户输入一个新的网页样本时,我们同样做特征抽取,通过使用学习完毕获得的映射函数,自动去预测这个样本的标签类别。


图1   一个机器学习中的二分类问题示范例:网页示范

上述例子仅是一个较常见的有监督二分类问题。在机器学习领域,通常人们习惯把算法分为3类:有监督学习、半监督学习和无监督学习。所谓有没有“监督”,指的是机器在学习阶段,能否看到样本的标签(如上述例子中的体育及非体育类别)。半监督学习通常也被称为弱监督学习,目的是通过少量的例子,在无标签的样本中自动学习参数。至于无监督学习,通常人们接触比较多的是聚类问题:通过分析数据样本的相似性,来把相似的数据组合成集群。

2 机器学习的当前研究重点和发展趋势

除了上述3大类算法,机器学习还有很多有趣的子领域。比如近些年兴起的深度学习热潮,指的是通过使用多层的神经网络模型在大数据上建模。比如谷歌的AlphaGo系统,就是通过在数十万的人类对弈棋谱上学习策略网络(Policy Network)和估值网络(Value Network),再结合蒙特卡洛搜索树算法来决定如何走棋的。所谓策略网络,其实是一个卷积神经网络,用来选择如何落子。所谓估值网络,也是一个卷积神经网络,用来分析当前的胜率。围棋的棋盘相对较大,是一个19×19的网格,每一步有上百种走法。对于李世乭这类顶级棋手来说,可以预测未来的局势。对于计算机来说并非易事,因为可以落子的搜索空间太大。谷歌之所以取得成功,正是因为其很好地把这2个神经网络与蒙特卡洛搜索树结合,精确地分析和预测了李世乭的棋路。

在大数据时代,机器学习领域还有一个热点是把系统与算法结合,设计大规模分布式的机器学习算法与系统,使得机器学习算法可以在多处理器和多机器的集群环境下作业,处理更大量级的数据。这方面较为知名的系统包括:加州大学伯克利分校的Spark、谷歌的TensorFlow、华盛顿大学的Dato(原名GraphLab)、卡内基梅陇大学的Petuum、微软的DMTK系统等。也许在几十年前,计算机科学的核心是操作系统、算法和编程语言。但是在今天,在大数据的背景下,计算机科学逐渐演变成一个越来越强调跨领域合作的学科。如何有效地把系统和机器学习方法相结合来处理海量数据,这将是未来人工智能和计算机科学发展的关键。

除了这2个最近5年比较热门的领域,其实机器学习还有许多有意思的科研方法。譬如,优化算法一直是机器学习领域的重点,如何处理各种凸优化和非凸优化问题、如何处理分布式优化,避免局部最优解,一直是学者最关注的问题之一。其他值得关注的领域,还包括强化学习(reinforcement learning)、概率图模型(probabilistic graphical models)、统计关系学习(statistical relational learning)等。

3 谷歌AlphaGo成功的启示

在谷歌的AlphaGo系统战胜李世乭后,由于对技术背景缺乏了解,加上部分公司和媒体为了达到商业目的而进行的夸张宣传,部分人对人工智能和机器学习技术的发展表示担忧。有人认为,围棋是人类最后的智力堡垒,计算机攻克了围棋,那么人类是不是离灭亡也不远了?

在国内外人工智能学者的讨论中,美国乔治亚理工大学机器学习助理教授Le Song认为这种论断具有基本的逻辑错误,因为古今中外,会下围棋并不代表能统治世界,绝大多数的国家领导人也都不是围棋棋手。从事实出发,谷歌的AlphaGo系统仅仅是在人类棋谱上训练而成的计算机围棋软件系统,其根本不具有理解人类语言、图片和推理等其他机器智能。另外,需要强调的是,AlphaGo系统的背后,是几十名谷歌科学家数年的辛苦工作,设计算法和调试程序的反复迭代,才取得的成果。所以,AlphaGo的棋商,归根到底也是谷歌科学家们集体智慧的结晶。

不久前,我通过微博对我的朋友们(主要来自科技界)做了一项多项选择调查:“你觉得AlphaGo战胜李世乭意味着什么?”361位用户参与了投票,其中44.5%的票投给了“一次对技术发展有益的测试。”;29.5%的票投给了“AI历史上的里程碑事件。”;13.8%的票给与了“无感,围棋规则明确,机器善长。”;另外有10%左右的票认为李世乭不在巅峰,应该给柯洁机会。然而,只有0.6%的票认为“机器即将灭亡人类”。由此可见,科技界总体相对还是比较理智的。

毫无疑问,我认为AlphaGo是近年来机器学习、系统和高效搜索算法结合成功的典范,谷歌AlphaGo成功给我们的启示是多方面的:

1)正确的选题。谷歌选择了可以量化、规则明确的计算机围棋领域,其主要负责人David Silver和Aja Huang的博士论文均是计算机围棋,有着超过10年的经验。

2)恰当的方法与时机。在计算机性能大幅度提升的大背景下,谷歌通过训练大规模深度学习网络,结合高效的传统蒙特卡洛搜索树,成功地控制了围棋的复杂度。

3)精密的工程实现。在数十名谷歌工程师的努力下,AlphaGo有了单机和分布式2个版本,针对时间限制,设计了快速落子和仔细斟酌的策略,对时间采取毫秒级别的估计。这些工程上的细节,无疑是决定成败的关键之一。

卡内基梅陇大学博士、Facebook围棋项目负责人田渊栋认为:谷歌AlphaGo的成功,告诉我们结合机器学习与传统符号搜索方法可以解决人工智能里相对复杂的推理问题。这点我十分同意。David Silver等2016年1月在《Nature》发表的介绍AlphaGo的论文中,也明确提到了,只有把机器学习与高效的搜索方法集合,AlphaGo才能取得最高的Elo棋力评价(图 2)。


图2   AlphaGo棋力评价(图片来源:David Silver等2016年1月在《Nature》发表的介绍AlphaGo的论文)

4 理性看待人工智能和机器学习的未来

人工智能和机器学习的路还很长,我们应该正确认识AI能够在当前取得的成就,才可以解决更加复杂的问题。我们能看到上述AlphaGo对技术发展的积极启示,但是也不能忽略:对于自然语言理解,虽然经过了数十年的发展,依然没有人工智能系统可以做到完全正确地理解人类的语言(包括语音识别和机器翻译);在机器人领域,即使工业机器人发展迅速,我们依然没有看到具有常识和推理能力的智能家庭机器人;在计算机视觉领域,即使我们在人脸识别和图片分类上取得了不小的成就,但是对于关系理解和完整的场景认知,现在系统能做到的还很有限。

作为科学工作者,我们的本质工作就是追寻事物发展的基本规律,寻找真理。所以在媒体出现与事实不符的报道时,我们需要客观地分析技术的发展,理性地看待科学技术的成长,澄清谣言。

历史上,也曾出现过由于对人工智能的炒作而造成的技术发展停滞,这一时期被称作是AI寒冬(AI winter)。在1970年代,由于较早前对人工智能技术发展过于乐观,但在由于实际实现中发现困难重重,美国国防部先进研究项目局取消了大部分对人工智能研究项目的资助,导致人工智能技术在当时发展停滞不前。

对于“人工智能威胁论”,大可不必担心机器灭亡人类。至于人工智能技术发展对于社会的影响,我认为是双向的。首先,我同意卡内基梅陇大学机器学习系Alex Smola教授的观点:AI技术在未来确实有可能对流水线工人、卡车司机、保洁员等相对低技能要求的工种造成冲击,然而解决的办法只能是提高整个社会的教育水平。其次,我认为社会也在对人工智能技术的发展产生各种积极的约束:譬如,用户对于技术的安全性和稳定性的要求;用户对于数据隐私的要求;用户对于产品的道德约束。总而言之,当前是人工智能发展的一个令人兴奋的时期,机器学习技术对于整个人类的发展,也是具有不可估量的潜力。我们应该正视科学技术发展的进步,理性看待所取得的结果。

(编辑 祝叶华)