人工智能经过数十年的发展,历经符号智能、感知智能两个时代,目前来到第三代人工智能,即认知智能的大门口。认知智能不仅要求基于大数据的深度学习及对应的感知识别,还要求机器具有认知和推理能力,要让机器具备与人接近的常识和逻辑,这就对数据与知识的融合提出了迫切需求。回顾人工智能的发展,1968年图灵奖获得者Edward Feigenbaum研发出世界首个专家系统DENDRAL; 1999年互联网发明人、图灵奖获得者Tim Berners-Lee爵士提出语义网的概念;2019年图灵奖获得者Yoshua Bengio在NeurIPS大会上的主题报告中指出“深度学习应该从感知为主向基于认知的逻辑推理和知识表达方向发展”,这个思想和清华大学张钹院士近期提出的第三代人工智能思路不谋而合。同期美国国防部高级研究计划局(DARPA) 发布AI NEXT计划,其核心思路是推进数据计算与知识推理融合的计算,还委托了伯克利等机构,开展SYMBOLICNEURAL NEWORK(符号加神经网络计算),其目的就是要加快这一进程。总的来说,研究数据与知识融合的双轮驱动AI时代已经到来,这个时代的核心是利用知识、数据、算法和算力4个要素,建立超越图灵测试的通用机器认知能力,让机器像人一样“思考”。
那么首先要回答的是“什么是机器认知能力”,这里笔者抛砖引玉给出一个机器认知的定义初稿(T9准则)。所谓机器认知,即当机器具备以下9种能力,则说机器具有人类的认知能力;如果只具备其中一种能力,则说明该机器具有T9-x能力。下面简要阐述一下这9种能力:
1) 适应与学习能力:机器具有一定的模仿能力,能够通过模仿和反馈学习人的语言和行为。
2) 定义与情境化能力:机器能够根据感知上下文场景做出反应(语言和行为反馈),并保证反应的一致性。
3) 自我系统的准入能力:机器具有一个稳定的人设(如稳定的心理大五人格),在生成对待事物的观点时,不会随意改变自己的观点和情感倾向。
4) 优先级与访问控制能力:机器具有能发现自我观点的矛盾和纠结,最终能做出一个选择,并在后续行为中保持一致。
5) 召集与控制能力:机器能主动搜索与自身人设一致或者符合自身利益的内容(新闻),并对其进行正面评论;反之,也能搜索与自身人设相违背的内容,并对其进行反驳。
6) 决策与执行能力:机器能主动搜索内容信息,统计其他机器与人的观点和倾向,根据自身人设做出对自己有利的决策并执行。
7) 错误探测与编辑能力:机器能自动对无法判断的事物进行假设,并进行追踪,如果发现假设错误或者假设不完备,能自动进行编辑修正。
8) 反思与自我监控能力:机器具有自动校验能力,如果发现执行的操作不正确,具有自我监控和修正的能力。
9) 条理与灵活性之间的能力:机器能够自动规划和保证执行操作之间的条理性;同时当发现条理不正确时,具有一定灵活性,可以修正自己的规划。
当然,要全面实现以上9条准则还有很长的路要走,实现的路径也是多种多样的。最值得期待的是数据与知识双轮驱动的AI技术,自OpenAI发布迄今为止全球规模最大的预训练模型GPT-3以来,超大规模预训练模型就成为了人工智能领域研究的热点,这是数据驱动研究的一大进展,但同时也需要注意到GPT-3还缺乏认知能力,无法正确回答如“脚上有多少只眼睛”的问题。认知智能不仅需要使用数据驱动的方法来建构超大预训练模型,还需要将用户行为、常识知识以及认知联系起来,主动“学习”与创造。我们坚信下一个人工智能浪潮的兴起必然伴随着认知智能的实现,机器将具有推理、解释、认知能力,在多项人类感知与认知任务中超越图灵测试。