2016年信息科学热点回眸
万赟     
美国休斯敦大学维多利亚分校,德克萨斯州维多利亚 77901

2016年是信息科学突飞猛进的一年。AlphaGo 战胜人类围棋冠军的消息让普通大众第一次感觉到人工智能带来的挑战。通过深度学习的不断应用,人工智能在各种模式识别领域出现了众多突破,自动购物、自动驾驶等技术不断走向成熟,比以往任何时候更接近实现科幻世界里所描述的人与计算机的自然互动。中国超级计算机继续保持世界领先地位。人脑模拟取得了重要进展,通过植入芯片实现人脑与机器的耦合变为可能。微软首先将增强现实眼镜推向市场。以虚拟现实技术为代表的三维眼镜市场则出现了各大公司自由竞争的局面。区块链从比特币的核心技术演变为金融、保险、法律等行业的新一代关键技术。量子信息技术从理论逐渐变成现实,各大科技公司纷纷研发量子计算机,中国在量子通信领域保持世界领先水平。

1 深度学习

2016年最受大众关注的信息科学领域是人工智能。触发这一关注的事件是3月份谷歌 AlphaGo围棋程序4:1战胜职业围棋世界冠军李世乭(图 1)。在这之前,人工智能领域专家们的一致看法是围棋的分支因子远高于国际象棋等游戏,计算机无法分析如此多的情况分支。

图 1 AlphaGo对战李世乭(AlphaGo的研发公司是谷歌在此之前收购的一家英国创业公司DeepMind,该公司将深度学习方法成功应用到传统人工神经网络中)

与 AlphaGo 受媒体关注的火热程度相比,微软语音识别方面的历史性突破并没有引起媒体太多关注。根据微软研究院2016年10月份发布的一项实验结果报告提供的数据,微软语音识别系统在识别英语语言对话方面的错误率仅为5.9%,不仅超过其他同类语言识别系统,而且超过人类专业速记员的6.3%的错误率水平。语言识别的研究始于20世纪70年代,这次取得这一重大突破主要是利用了深度学习神经网络技术。微软是最早关注深度学习技术的公司,在10年前就发现其潜力,并将其广泛运用到模式识别领域,所以这次取得这一成绩也算名至实归。值得一提的是为这一成就做出重要贡献的主力是微软的几位华裔研究人员。同样运用深度学习神经网络技术,2016年11月下旬中国的搜狗,百度和科大讯飞以新闻发布的形式同时宣布自己的中文语音识别准确率达到97%,超过微软系统94%。

相对于语音识别,机器翻译更具挑战性。2016年谷歌更新后的神经网络机器翻译系统(GNMT)通过给每一个翻译单元加标签的方式实现了任意两组不同语言之间的直接翻译。该系统研发人员还发现,更新后系统在其神经网络内部将表同一含义的不同语言自动归纳到一起,这说明该系统通过逐层分析和提炼发现了这些不同语言的语义相同点,形成了代表语义的中介语言。目前谷歌翻译提供103种不同语言之间的翻译,每天处理1400亿单词。

2 智慧生活

语音识别和机器翻译技术的成熟意味着语音界面将很快成普通人和计算机互动的主要人机交互界面。亚马逊和谷歌分别在2015和2016年推出的家庭智能音箱就充分利用了语音识别技术的成熟(图 2)。它们可以接收和传送用户指令,通过网络与云端实时连接,响应用户通过自然语言提出的各种需求,方便了不同家庭成员使用这两家公司提供的数字化服务。

图 2 亚马逊智能家庭音箱

人工智能与物联网技术相结合的一个重大突破是12月初亚马逊在西雅图推出的第一家自助购物服务(Amazon Go)杂货店。消费者在这里购物时,只要进门扫一下二维码,选购完商品后可以直接出门,不用排队。这一看似简单的服务背后使用了人工智能、脸部识别、重量传感及射频识别(RFID)等多项前沿技术。随着这一整套技术通过实践而不断成熟,成本会进一步下降。伴随着类似商店数量的增加,智能化商店将会在不久的将来颠覆传统杂货店购物模式,收银员这一职业将消失,沃尔玛等传统零售连锁店如果不能很快跟进,可能面临倒闭。

智慧家庭和自助购物等智能化将不断增加对嵌入式低能耗芯片的需求。2016年华盛顿大学两位专家发明了环境反向散射(ambient backscatter)技术,该技术可以通过生活环境中早已经存在的各种无线电波,比如Wi-Fi,收音机和电视机信号等,为嵌入式芯片提供能源。这意味着可以将芯片植入到任何需要人工智能驱动的周围物体中,不必再考虑驱动能源问题。

3 无人驾驶

无人驾驶技术是人工智能的另一倍受关注的应用领域。特斯拉是最早将无人驾驶技术商业化的公司。该公司的 AutoPilot 半自动无人驾驶系统2014年进入市场。2016年10月份,特斯拉开始为所有新生产汽车配备全自动无人驾驶硬件系统(图 3)。该系统主要包括3部分,分别是8个可以观察360°,250 m范围内的空间的摄像头;12个可以探测和分辨500 m以内的各种软硬物体的超生波传感器;一个可以在恶劣天气或者前车阻挡情况下分析前方信息的前向雷达。用户可以选择启动该系统(价值4250美元)来体验全自动驾驶。

图 3 特斯拉的自动驾驶系统将被自动安装到所有新的特斯拉汽车中,这一举措为特斯拉收集和分析自动驾驶数据提供了绝对优势

目前特斯拉主要将该系统做为影子系统在车载计算机后端进行数据收集工作。估计等收集和分析足够多的驾驶数据后,特斯拉会通过系统软件自动升级的方式为未来车主提供做为标准配置的全自动驾驶功能。

2016年8月份优步在美国东部城市匹斯堡推出了无人驾驶出租车服务(图 4)。第一批出租车使用的是改装的福特汽车,每辆车配备了包括摄像头在内的价值高达10万美元的自动驾驶系统。优步的系统测试人员坐在车内监督无人驾驶汽车的运行。如果该项服务市场前景不错的话,优步将和沃尔沃汽车公司将合作推出专门的无人驾驶汽车。这两家公司年初签订了3亿美元的合作开发全自动无人驾驶汽车合同。目前预订的市场进入时间是2021年。

图 4 优步在匹斯堡推出的自动驾驶出租车实验性服务大大推动了无人驾驶技术商业化进度

无人驾驶汽车技术的成熟主要依靠真实的驾驶数据的收集和分析。特斯拉目前有15万台S型汽车配备Autopilot系统。2016年年初展示的T3型目前预订已经接近40万辆。这些源源不断的自动驾驶信息数据为特斯拉完善无人驾驶技术提供了宝贵的经验。优步也把目标聚焦到大规模市场化和数据收集上,负责优步无人驾驶出租车项目的前卡梅国家机器人工程中心主任贝尔斯表示优步将在最短的时间内用无人驾驶技术全面取代100万优步司机,实现公司的转型。

与特斯拉和优步相比较,谷歌,苹果,宝马和百度等公司也表示要进军无人驾驶市场。谷歌是最早进行无人驾驶汽车研究的公司,在这一领域已经探索十多年,可以由于试验规模太小,在数据收集方面远远落后于前者。

4 超级计算

人工智能的进一步发展离不开大规模并行计算能力的不断提升。超级计算和人脑模拟是当前大规模并行计算的主要竞争方向。2016年6月20日中国的“神威·太湖之光”超级计算机(图 5)在LINPACK性能测试中以93PFLOPS的结果超越天河二号,成为世界上最快的超级计算机。该系统上的一个重要应用,全球大气非静力云分辨模拟,首次实现了百万核规模、高分辨率的地球系统数值模拟,构建了25km 网格分辨率的地球系统模型(在海洋上可达到10 km分辨率)。这一应用为中国首次赢得一直为美日所垄断,有超级计算机领域诺贝尔奖之称的戈登贝尔奖。

图 5“神威·太湖之光”超级计算机和其核心部件申威26010众核处理器(因为美国政府在此之前限制英特尔等公司将高性能的处理器出口给具有军方背景的中国公司用于研制超级计算机,中国自行设计生产了申威26010众核处理器)

“神威·太湖之光”使用的4万多枚申威26010众核处理器是为该系统专门研制,这种个性化配置的趋势也延伸到了商业计算领域。早期各大科技巨企的云平台是通过使用配备英特尔微处理器的低端服务器甚至是个人电脑来实现。后来谷歌率先通过标准化集装箱计算机方式批量扩展云平台的计算能力。这一方式流行后,设计适合自身平台服务的微处理器,网络传输部件,各种芯片,主板等等成为目前各大主要云平台深度优化底层架构的主要趋势。

近期亚马逊,谷歌和微软分别开始设计自己的云计算服务器微处理器,用来优化其云平台的特殊需求。亚马逊设计和销售的是基于安谋架构的微处理器。谷歌自行设计了 TPU来专门配置其开源人工智能云平台Tensor-Flow。微软和亚马逊分别自行设计了FPGA来加速其 Azure云平台的虚拟网络传输,人工智能数据分析等功能的速度。

5 人脑模拟

与超级计算机相映成趣的是谷歌等互联网公司利用已有的云平台和深度学习等人工智能技术来模拟人脑功能的动向。谷歌的人脑研究目前已经开发出1000多个不同的深度学习算法来为 YouTube、谷歌翻译、谷歌相片等服务提供各种智能化服务。脸书和百度等公司也通过类似的方式来全面实现服务的智能化。

这一趋势将逐渐从这些高科技企业延伸到传统企业,对此《连线》杂志创始人凯文·凯利(Kevin Kelly)在最近的TED演讲中提出,下一个产业革命将是人工智能以模块化形式嵌入到日常生活中的各种服务和使用对象中。

外脑技术是上述趋势中最具科幻色彩的一个方向。美国洛杉矶的一家名为Kernel的创业公司目前正在研发制造人工智能算法驱动的记忆芯片来模仿,修复和改善人的大脑认知。如果把人脑看做是一台计算机的话,人脑中的海马体是将短期记忆(内存)转换成长期记忆(硬盘)的转换器。这家公司研制的芯片通过植入到人脑的海马体中,来截取,识别,并储存海马体转换出的短期记忆信息到芯片上,可以改善由于人脑神经退行性疾病引起的记忆功能障碍,图 6为《IEEE Spectrum》2016年8月对该技术的报道插图。目前该公司已经能够识别80%左右的此类信息。

图 6 Kernel的芯片植入技术(图片来源:《IEEE Spectrum》)

将人类的记忆存储到包括计算机在内的人脑以外的存储装置中是未来学家库兹韦尔(Ray Kurzweil)在他的《奇点来临》 一书中提出的实现人类永生的第一步,在该书中他预测实现这一技术的时间是2025年。

6 机器学习

机器人智能化研究最近也通过人脑研究取得了理论上的突破。人类从婴儿时期就通过与周围环境的互动而在大脑中形成了对成千上万种不同物体对象的处理方式,机器人则没有经历这样学习过程。所以很多人类希望机器人执行的简单任务,比如在仓库中包装物品,协助照顾病人,或在前线帮助士兵都很难训练机器人来实现。针对这一现象,布朗大学计算机科学家苔里克斯(Stefanie Tellex)将人类这一海量学习过程称为“大数据收集过程”,并将机器人面临的这一困难称为“百万物体挑战”(图 7)。

图 7 苔里克斯(Stefanie Tellex)指导机器人学习抓取动作,遍布世界各地的很多实验室也参与其中,进行类似的指导,这些信息被用来共享,帮助机器人迅速学习抓取不同物体的技能

为了帮助机器人在短期内掌握人类个体需要长期学习才能积累起来这些经验知识,比如抓取不同物体的技能,她提出了“百万挑战计划”,招募全世界的机器人实验室各自训练同一类机器人,然后所有实验室分享获得的经验数据,通过这一方式可以让机器人快速学习。

7 现实与科幻

增强现实(augmented reality)是一种计算机根据对周围环境的感知形成的动态人机交互界面叠加到用户的视野中,用户通过简单手势和声音就可以通过这一界面对周围环境的物体进行各种操作的技术。2016年微软推出了增强现实眼镜,将这一科幻场景初步变成现实。用户佩戴了微软的Hololens后可以使用视窗10中的所有二维应用,包括查看新闻,天气,听音乐和观看视频(图 8)。目前微软正在为该眼镜适配更多的包括游戏在内的三维应用。Hololens的研发使用的是双目立体视觉原理,曾经备受瞩目的另一家研发AR眼镜的公司Magic Leap使用的是则是光场(light field)技术,后者的成像更加逼真,但是却因为无法客服设备小型化问题而没能按计划推出竞争产品。阿里也参与了对后一家公司的投资。

图 8 微软的Hololens可以将所有视窗10的二维界面叠加到现实空间中,并理解用户的手势互动

比增强现实更容易实现的虚拟现实技术已经走向成熟,2016年里 Facebook、索尼、三星、HTC等公司纷纷推出或者升级其 VR眼镜和设备,未来一年将会出现包括游戏在内的越虚拟现实应用程序的大爆发。

8 区块链

去中心化的区块链技术在过去的一年里开始被不同领域所重视,并由此引发出很多新应用。做为比特币底层科技的区块链技术是一个公开的分布式簿记系统,具有自动加密和授权,参与者自动达成共识,以及加入信息不可更改等特点。因为这些特点,它可以被应用到合同契约,商业交易,保险理赔等领域。相对于目前这些领域所使用的技术,区块链可以提供更安全,简单和有效的支持(图 9)。

图 9 区块链技术已经形成遍布到不同领域的应用生态系统

美国纳斯达克股票交易所从2015年末开始实验性地推出Linq区块链股权交易系统,自愿参与的用户通过该系统进行股权交易。受区块链技术启发的 R3公司通过类似的开源分布式数据库系统为全球70多家金融公司提供相互之间的清算业务。保险行业通过充分利用区块链智能合约的特点实现按照预订条款的自动理赔。法律行业则准备通过区块链提供方便有效的公证服务。

9 量子信息技术

2016年最重要的信息技术发展动向应属量子信息技术的发展。如同100年前的汽车和40年前个人电脑,量子计算机的研发在2016年进入百花齐放的阶段。

2013年美国航空航天局和谷歌合作投资,加拿大创业公司D-Wave设计研制出世界上第一台量子计算机(图 10)。最近几年量子计算机的研制不断取得突破,计算能力不断增强。DWave并非通用量子计算机,因为它利用量子力学里的量子隧穿效应形成量子退火(quantum annealing)来寻找最优解,所以又被称为量子退火机。目前谷歌的D-Wave的量子数位提升到1000位。

图 10 D-Wave Systems公司研制的128量子位,用于量子退火机的超导绝热量子优化处理器

2016年几乎所有的科技巨头都投入到量子计算机的研发中,而且每一家公司的设计思路都不完全一样。谷歌和IBM采用的是超导回路方式,将微波信号注入到一束无电阻的在电路回路中来回震荡的电流中,使该电流进入量子叠加态。这一技术的特点是快速起效,但缺点是持续时间短,易塌缩,而且必须在低温环境下进行操作。

英特尔采用的是硅量子点技术,这一技术将一小片超纯硅附着在传统微电子工业标准晶圆上,然后向该超纯硅膜上加入电子,用微波控制形成电子的量子叠加态。这一技术的优势是可以充分利用现有的硅芯片生产设备,缺点是不太容易让电子进入纠缠态,而且需要在低温状态下进行操作。

微软和贝尔实验室采用的是拓扑量子比特技术,这一技术目前还没有全面验证,仍然处于理论阶段。

除了这些科技巨头外,也出现了很多量子计算机创业公司,比较有代表性的来自马里兰大学的创业公司ionQ,该公司采用的囚禁离子技术使用调谐激光冷却和囚禁带电原子,并将它们置于叠加态,形成量子计算能力。这一技术的最大优势是可以长时间维持量子纠缠状态。中国科技大学2016年8月也研制出在低温和有磁场的辅助设备中可以运行的半导体量子芯片。麻省理工的专家认为最终成形的量子计算机很可能是现有这些不同技术的结合(图 11)。

图 11 中国科技大学量子实验室的量子芯片外围电路,量子芯片为黑色部分

在量子通信领域,中国通过墨子号量子通信卫星的发射已经领先世界。量子叠加和纠缠原理保证了量子通信的绝对安全,一旦有黑客试图截取传输信息,通信双方可以立即察觉。而量子的超距效应使通讯双方无论距离多远都可以实现信息的瞬时传递。

除了量子计算机和量子通信,量子信息技术还可以在成像,传感和测量等领域获得应用。英国政府科学办公室2016年12月发布的量子技术报告《量子技术:时代机会》 意味着在未来10年量子信息技术将成为各个国家竞争的重要方向。

(责任编辑 刘志远)