·科技建议·
关于发展我国人工智能技术与产业的建议
近期谷歌人工智能程序阿尔法围棋(AlphaGo)以4:1的成绩击败了代表人类的世界围棋冠军李世乭职业九段,引发了全社会的广泛关注。从学术界、产业界,再到职业围棋棋手、社会大众,都在热议“人工智能是否会超越人类智能”,同时纷纷对“人机大战”进行各种解读和分析。一时间,关于“奇点到来”“强人工智能”“超人工智能”“意识永生”“人类灭绝”等耸人听闻的观点,甚至开始引起包括史蒂夫·霍金、比尔·盖茨和埃隆·马斯克等在内的世界名人对人工智能发展的担忧。对人工智能的社会关注度,确已达到前所未有的程度。
在经历了60年“三起两落”的发展后,以深度学习为主要标志的人工智能正迎来第3次伟大的复兴。历史惊人的相似,30年前的1986年前后,社会对人工神经网络与人工智能,拥有与今天差不多相同的兴奋和憧憬。但不同的是,随着时代的进步,在“互联网+”时代,我们已有了真正的大数据,超级GPU服务器与类脑芯片正取得突飞猛进的发展。与此同时,谷歌(Deep⁃Mind,谷歌大脑)、Facebook(FAIR)、微软、IBM沃森与百度(百度大脑)等著名IT跨国企业,都在持续投入巨资并招聘领军人才,强力涉足该领域。产业与学术的距离逐步缩短,人工智能初创企业不断涌现。大多数投融资与产业界预测,未来2~5年,人工智能应用与产业发展,将迎来真正的爆发期。
作为中国政府实施制造强国战略第一个十年行动纲领,“中国制造2025”规划纲要已将智能制造作为其主攻方向,而智能制造的基础之一就是人工智能。《国务院关于积极推进“互联网+”行动的指导意见》中明确表示,要依托互联网平台提供人工智能公共创新服务,加快人工智能核心技术的突破。科技部部长万钢在今年的“两会”答记者问时,对我国在人工智能方面迄今取得的成就予以了肯定。在“两会”上,百度公司董事长李彦宏和科大讯飞董事长刘庆峰等,都在积极呼吁将人工智能上升为国家发展战略。
1 以深度卷积神经网络为核心,全面开展视觉识别、语音识别和文本理解等人工智能产品的开发与大规模产业化应用
人工智能是一个影响面极广的关键共性科学问题,也是一个战略前沿技术,其任何实质性的进展均可推动人类社会及其现代文明的整体进步,因此人工智能的研究意义与重要性可媲美人类迄今进行的任何一项伟大的科学工程。自2012年开始,以深度卷积神经网络为主要标志的(弱)人工智能的最新发展,已引起全球瞩目。相对于人工神经网络长达近60年的发展历程,监督学习的深度卷积神经网络在产业界的强力介入下,仅用了短短3年多的时间,就已在视觉物体识别、人脸识别、手写体数字识别、手写体汉字识别与交通标志识别等诸多方面,达到甚至超过人类的分类能力。例如,针对ImageNet 1000种物体的识别,深度卷积神经网络的top-5测试错误率已从2012年的15.3%(迄今传统机器视觉方法的最好结果为25.7%),快速降低至2016年2月的3.08%(谷歌),低于人类5.1%的错误率。又如,2014年以来深度卷积神经网络已成为人脸识别的主流方法;基于LFW(Labeled Faces in the Wild)数据集,人类的正确识别率为97.53%,但2015年6月谷歌的深度卷积神经网络FaceNet已达到99.63%,该网络使用了22个卷积层、1.4亿突触连接权和800万人的2亿张照片。同样也是在深度卷积神经网络的支撑下,通过应用监督与再励学习,谷歌DeepMind于2015年2月和2016年1月,在《Nature》上分别发表了关于深度Q-网络(DQN)和里程碑式的AlphaGo的文章,其中DQN在49种At⁃ari像素游戏中,29种达到乃至超过人类职业选手的水平,Al⁃phaGo更是完胜人类围棋顶级高手,引起轩然大波。特别需要注意的是,IBM沃森认知计算平台,结合深度卷积神经网络后获得了更强的数据分析与挖掘能力,在某些细分疾病领域已能提供顶级医生的医疗诊断水平;通过发展认知商业,2016年的IBM正在率先推动全球人工智能的第一次商业化浪潮与核心业务转型。目前,深度学习的研究热点正在迅速转向基于深度卷积神经网络的物体检测与定位/分割能力,其突破将推动人工智能的实际应用与产业发展。
总之,作为一种感知智能模型,深度卷积神经网络,迄今最好地模拟了生物视觉皮层中负责识别的腹侧通路,是一种生物启发的Hubel-Wiesel模型。目前的极深度(very deep)卷积神经网络,已经使用了数十万个神经元和多达数十亿个突触连接权参数,在数量上已经接近了生物系统(如皮层功能柱)。在大数据和GPU计算硬件的强力支撑下,通过直接面向原始真实数据的分层特征的自动提取等,使机器初步获得了媲美人类的“模式”识别能力,而这必将成为认知智能乃至整个人工智能发展的起点和基石。
2 围绕智能医疗、智能金融、智能保险、智能律师、智能写作和智能个人助理,加速认知智能的前沿研究
一般来说,感知智能是对感知(perception)或直觉行为的模拟,如视听觉、触觉等;而认知智能则是对人类深思熟虑(de-liberative)行为的模拟,包括推理、规划、记忆、决策与知识学习等高级智能行为。目前的前沿研究包括将前述深度卷积神经网络通过监督学习获得的表达,即所谓概念向量(thought vector)与推理、注意力、规划与记忆进行有机整合。例如,最近出现的工作涉及推理/规划、注意力、短期/长期记忆、知识学习、知识蒸馏和知识迁移等。同时也出现了类似于人类“举一反三”的小样本概念学习以及基于监督和再励学习的大数据病历或棋谱的自动阅读与自主知识学习等最新进展,认知智能出现了快速发展,并应用于包括面向智能医疗、智能金融、智能保险、智能律师、智能写作和智能个人助理在内的认知商业的端倪。
学习算法一般包括监督学习、再励学习和无监督学习。模拟人和动物行为学习的再励学习方法,其学习效率介于监督和无监督学习之间。无监督学习是人工智能的“黑物质”。事实上,动物与人类的大部分知识都是基于无监督学习获得的。预测性的无监督学习可用来构建并推断世界,“举一反三”地获得各种“常识”和知识规则。但不幸的是,无论是深度信念网络还是自动编码器等无监督预训练方法,均进展缓慢,且目前尚缺乏类似于Hubel-Wiesel模型的现代脑科学研究成果的支持,因此,认知智能的突破以及强人工智能或“奇点”的到来,仍然是“路漫漫其修远兮”。
3 面向若干细分垂直领域,布局私有大数据的采集、管理和交易
AlphaGo、DQN、ImageNet、IBM沃森、谷歌FaceNet、微软同声传译、百度DeepSpeech等,已见证深度卷积神经网络的强大能力。深度学习已取得空前成就,弱人工智能正进入所谓“大数据+深度学习”时代。利用概念向量,以嵌入的方式表达世界,对特定细分垂直领域是可行的,原因是我们更有可能获得相对应的大数据。在互联网时代,真实条件下具有标签的私有大数据,被认为是人工智能产业制胜的关键和法宝。鉴于大数据对人工智能技术与产业发展的极端重要性,面向资金与技术雄厚的跨国企业,为了弥补国内企业的不足,国家确有必要设立若干专门的国家或省市级大数据采集、清洗、存储和管理中心,例如针对智能医疗、智能金融、智能保险、智能律师、智能写作和智能个人助理等,采集与管理巨量患者病例、健康资料、医疗影像、药品信息、金融服务、保险数据、新闻报道、写作文档等,建立大数据源公共基础设施与垂直领域知识库,推动公共数据服务与大数据期货交易等。
4 强力开展超级GPU服务器和ConvNet芯片的研发
在神经形态工程或类脑芯片研发方面,代表性成果包括IBM的TrueNorth类脑芯片和高通的Zeroth类脑处理器,其中IBM于2014年推出的TrueNorth,集成了100万个发放神经元,具有2.56亿个突触连接,但功耗仅有63 mW。为了支撑我国人工智能技术与产业的发展,必须继续从软件优化的层面加强Ha-doop、Spark和Petuum等高性能分布式CPU/GPU服务器集群系统的研究,同时从硬件实现角度,颠覆性地攻克非冯·诺依曼新体制的类脑芯片,如深度卷积神经网络(ConvNet)芯片与其他神经网络芯片,以及进一步探索量子计算机等,以便提供国际一流的平台支持。此外,还须进一步面向移动互联网终端(包括智能手机)、智能驾驶、无人机和家庭/个人服务机器人等人工智能应用,积极开发类NVIDIA的GPU加速卡和基于FPGA的低功耗ConvNet芯片等。
5 呼唤中国的DARPA和中国的阿拉莫斯国家实验室
随着人工智能与大数据、云平台、机器人、移动互联网及物联网等的深度融合,人工智能技术与产业开始扮演着基础性、关键性和前沿性的核心角色。智能机器正逐步获得更多的感知与决策能力,变得更具自主性,环境适应能力更强;其应用范围也从制造业不断扩展到家庭、娱乐、教育、军事等专业服务领域。通过将大数据转化为商业直觉、智能化业务流程和差异化产品/服务,人工智能开始逐步占据医疗、金融、保险、律师、新闻、数字个人助理等现代服务业的核心地位,并且不断渗入人们的日常生活。
由于人工智能的学术与产业距离正逐渐缩短,国家之间的竞争在不断加剧。主导全球科技创新中心的美国,凭借谷歌、Facebook、微软、IBM等IT巨头,在这一轮新的人工智能大潮中,又一次占尽先机。尽管我国与发达国家同处产业起步阶段(大约从2013年开始),百度的深度实验室、科大讯飞的深度语音识别、香港中文大学的深度人脸识别等在研究基础与技术积累等方面与发达国家并不存在“代差”,甚至在市场规模与政府支持等方面还具有一定优势;但对中国而言,挑战与机遇并存。如果坚持“以我为主、创新驱动”的原则,经过努力,还确实存在“弯道超车”的短期机会窗口。从本质来说,创新的竞争首先体现在创新体制与机制的竞争。作为一项事关重大的战略前沿基础技术,我国应积极借鉴对美国超强科技创新体系做出巨大贡献的科研管理经验,例如美国国防高级研究计划局(DAPAR)、洛斯·阿拉莫斯国家实验室(Los Alamos National Lab)、具有创新性组织架构的Facebook人工智能研究院(FAIR)等,以发展“两弹一星”的决心,以改革的精神积极创建中国的DAPAR、中国的人工智能“洛斯·阿斯莫斯”国家实验室与类似FAIR的产学研协同创新中心。面向国家重大战略需求与经济社会发展急需,通过体系的创新来保障技术与产业创新的实现,打通政产学研用各环节,解决国内普遍存在的研究层面低(分散封闭、简单重复、小而全且经费导向的碎片化研究)、研究深度浅(很少涉及核心技术,缺乏特色与自主创新)的问题,以及克服热衷于世界排名和个人“头衔”、单纯追求科研经费和论文的功利浮躁心理。
总之,目前中国人工智能的发展进入了一个重要的历史时刻,必须有一个顶层设计来决定其发展方向。建议在国家科技政策层面进行通篇谋局,通过创新驱动发展,发扬我国“集中力量办大事”的传统,以国际化视野,全链条布局、一体化实施“十三五”期间我国人工智能技术与产业的发展,使中国在第4次工业革命即将到来之际,占据有利战略地位,实现我们成为世界强国的伟大梦想。
文/邓志东
作者简介:清华大学计算机系智能技术与系统国家重点实验室/清华信息科学与技术国家实验室(筹),教授。
(责任编辑 王丽娜)
|