Review of research on analogical reasoning in artificial intelligence
-
摘要: 类比推理(analogical reasoning, AR)是人的思维中的一种基本推理形式,是人工智能(artificial intelligence, AI)理论和技术研究中的一个重要领域。AI中的类比推理研究,旨在结合相关学科的研究进行计算建模,在计算机上模拟实现类比推理处理过程,以产生能推断出新知的智能推理和学习系统。自20世纪60年代开始的AI中的类比推理理论和技术研究,至今取得了丰富的研究成果,特别是近年来将类比推理与深度学习结合的研究更加显示了其在AI研究中的重要性。本文旨在对从过去到现在AI中的类比推理主要研究及其特点进行系统总结和述评。在对检索出的AI领域中的700余篇类比推理研究文献进行全面考察的基础上,对其中具有代表性的142篇研究文献进行了系统分析,认为AI中主要的类比推理研究在上世纪和本世纪2个时期呈现了不同的研究特点,将2个时期中的类比推理研究归纳为“类比问题求解”、“计算模型”和“AR学习”等8个研究主题,并对各研究主题及其代表性研究工作的基本研究思想、内容和特点以及存在的问题进行总结分析。最后,展望了AI中类比推理未来的研究方向以及发展趋势。Abstract: Analogical reasoning is a basic reasoning form in human thinking, and it is an important field in AI theory and technology research. The research of analogical reasoning in AI aims to carry out computational modeling in combination with the research of related disciplines, simulate and realize the the process of analogical reasoning on the computer, so as to generate an intelligent reasoning and learning system that can infer new knowledge. Since 1960s, the research on the theory and technology of analogical reasoning in AI has achieved a wealth of research results. Especially in recent years, the research combining analogical reasoning with deep learning has shown its importance in AI research. This paper aims to systematically summarize and review the main research and characteristics of analogical reasoning in AI from the past to the present. In this paper, based on a comprehensive survey of the retrieved more than 700 research documents related to analogical reasoning in AI, and a systematic analysis of 142 research documents, we believe that the analogical reasoning research in AI has shown different research characteristics in the last century and the present century, combined with our research, the analogical reasoning research in the two stages is summarized into 8 research topics such as “analogical problem solving”, “computational models” and “learning by analogy” and the basic research ideas, contents, characteristics and existing problems of these research topics and their representative research work are summarized and analysed. Finally, the future research direction and development trend of analogical reasoning in artificial intelligence are prospected.
-
Keywords:
- artificial intelligence /
- analogical reasoning /
- objiect /
- target /
- mapping /
- computational model /
- case-based reasoning /
- deep learning
-
推理是人类智能活动的重要组成部分,一直以来是人工智能研究的一个核心内容。 在人的思维中,类比推理(analogical reasoning, AR)是人们利用已有知识进行推理的最常见的一种思维形式,是人类智力的一个关键现象,从古希腊时代到20世纪一直属于哲学、逻辑学、心理学和认知科学研究的范畴。这些学科的类比推理研究旨在提供概念上的框架,阐明推理机制,找到这一思维形式存在的正当理由,从而建立其理论基础。由于类比推理通过熟悉的知识推出新知,在联想、学习和发现等认知行为中有着重要作用,因此,人工智能领域中的类比推理研究旨在结合心理学等认知科学的研究进行计算建模,在计算机上模拟实现类比推理处理过程,提高计算机系统的智能水平,产生能自动推出新知的推理和学习系统。为此,自20世纪60年代在人工智能领域对类比推理理论与技术开始进行研究,迄今取得了丰富的研究成果。
当前,因机器学习研究的快速进步,使得语音、文字、图像识别以及自动驾驶等技术取得突破,形成了广泛的智能化研究和应用热潮。然而,人工智能以及智能化技术要进一步发展,必须在人工智能(artificial intelligence, AI)基础理论研究上取得突破。其中,类比推理作为人的思维中的一种基本推理形式,类比推理研究将必然是人工智能理论和技术研究中的一个不可忽视的重要领域。
本文旨在对从过去到现在人工智能中的类比推理研究及其特点进行系统总结和述评。为此,本文以计算机、人工智能、逻辑、数学、信息处理以及多学科交叉等为学科类别,通过在Google-Schola、Elsevier ScienceDirect、SpringerLink、Web of Science、IEEE/IEE Electronic Library、Google、ACM、百度学术以及CNKI等中进行检索,并对检索到的论文进一步通过其中的参考文献列表识别出遗漏的论文。截止到2021年12月,在学术期刊、国际学术会议、学术著作中共检索出近700余篇(本)有关AI领域中的类比推理研究文献。我们在对这700余篇(本)类比推理研究文献进行全面考察的基础上,对其中具有代表性的142篇(本)研究文献(根据系列研究、引用情况等)进行了系统分析,认为AI中的类比推理研究在上世纪和本世纪2时期中呈现了不同的研究特点,结合本文的研究将2个时期中的类比推理研究归纳为8个研究主题:“类比问题求解APS”、“计算模型”、“AR学习”、“AR理论”、“AR应用”、“基于案例的推理CBR”、“AR和CBR理论”以及“CBR与深度学习和可解释人工智能”;并对各研究主题及其代表性研究工作的基本研究思想、内容和特点以及存在的问题进行总结分析。最后,展望了AI中类比推理未来的研究方向以及发展趋势。
需指出,国内类比推理研究主要集中在语言学、心理学等认知科学领域,AI中的类比推理研究在20世纪90年代有十几篇研究论文在国内期刊发表。其中,李波等[137-142]对类比推理计算模型和技术的研究较深入,在国内类比推理研究中具有代表性。
1. 类比推理基本概念
自古希腊时代,寻找生活在多个概念环境中的2个对象之间的共性的能力,似乎是所有科学学科中无所不在的认知过程,类比或类比推理一直被认为是人类这种认知过程中的一个关键现象。 所谓类比,在字典上描述为“由2个对象的某些相同或相似的性质,推断它们在其他性质上也有可能相同或相似的一种推理形式”。 对于类比在人类思维中的作用及其意义,1945年著名数学家Polya[1]认为:“类比贯穿于我们的思维、日常言谈、琐碎的结论、艺术的表达方式和最高的科学成就之中”。2013年类比研究著名学者Hofstadter等[2]在专著“Surfaces and essences-analogy as the fuel and fire of thinking”中甚至认为“类比是人类认知的核心”。Polya对数学问题求解中的启发式的研究是类比计算研究的主要思想来源,应该说他最早研究了类比推理这种推理模式的基本特征。本文可通过如下2例理解类比推理的含义:
1)原子和太阳系类比。人们为了理解有关原子的知识,根据行星围绕太阳旋转的重力与引起电子围绕原子核旋转的引力具有相似性,从而推知“电子围绕原子核旋转”这一新知识。
2)医生为了通过病人的医学影像诊断病人所患疾病,根据患者的医学影像与已有的医疗影像库中某个或某类影像数据在属性等方面具有相似性,从而判断该患者具有同类疾病。
类比推理作为一种判断推理,没有严格的科学定义。其一般的描述性定义为:“类比推理是由于认识到新情况与已知情况在某些方面相似,从而推出它们在其他相关方面也相似的过程”,或者“类比推理是一种从关于某个或某些对象的知识(或描述),推出另外一对象的某些知识(或描述)的推理”。类比推理具有如下基本特征:
1)涉及“目标”(研究对象)和“源”(类比对象)两者,“源”依据与“目标”的某些相似性从源域中选取。
2)推断出的结论(有关“目标”的知识)具有或然性,不具有唯一性。
类比推理的基本特征决定了类比推理的理论与技术研究具有多样性、困难性和复杂性。类比推理首先面临的是如何根据目标有效地找到合适的源,这涉及相似性求解和检索问题;然后要有保证类比结论有足够可靠性的推理机制,以及有效实现这种推理机制的计算模型;由于通过类比推理推断出的结论是关于目标的新知,具有或然性,因而还需验证结论的可靠性。
类比推理是一个多步骤推理过程,这种推理过程应该具有哪些子过程,研究者们[3-8]的认识不尽相同。对它们进行归纳至少应包括如下子过程:
1)检索(Retrieval):根据目标,在源域中找到一个与之相似的类比对象。这个过程注重目标与源在属性等方面的相似性及其计算,给定检索方法并能由此在源域中检索一个(或多个)与目标相似的源。
2)映射(Mapping):确定源与目标的“相似元素”(概念、属性、关系等)之间的对应关系,给定映射约束条件,将选定的相似元素从源映像到目标。
3)转换(Transfer):在建立的映射下,通过对映射进行进一步处理,从而得到结论(有关目标的新知识)。
4)正当性(Justification):验证结论(目标新知识)的可靠性。
类比推理基本过程如图1所示。
2. AI中早期类比推理主要研究和特点
AI领域中的类比推理研究,自1964年Evans[9-10] 的开创性工作到20世纪末,类比推理的理论与技术研究成果丰硕(约120余篇发表文献)。这一时期中的类比推理研究,可归纳为4个研究主题:类比问题求解APS、计算模型、类比推理学习和类比推理理论。图2为这一时期类比推理研究文献在各研究主题中的占比。
2.1 类比问题求解和计算模型研究
在日常生活中,人们通过类比用过去已解问题的知识来帮助解决新问题是一种普遍存在的推理形式。因此,如何在计算机上实现这样的问题解决,称为“类比问题求解(analogical problem-solving, APS)”。APS可描述如下:给定一个目标问题作为输入,输出该问题的一个解,该解由已知的其他问题的解导出。1964年Evans[9-10] 第1个从AI的角度出发,研究了几何类比问题求解及其计算模型。提出类比推理的一种多阶段计算模型(multi-stage computational model of AR, CMAR),以及机器已实现的几何类比问题求解系统(system to solve geometric-analogy problems, SSGA)。Evans开创了AI中类比推理的计算模型研究,通过CMAR详细说明了检索−映射−转换−正当性的类比推理基本处理过程。CMAR还捕获了类比推理的一个重要特征:源和目标之间的映射可以在某种抽象级别上执行[3]。
与Evans的研究目的相同,如何在计算机上实现人在数学定理证明中常用的类比推理,1971年Kling[11-12] 研究了定理证明中的类比问题求解及其计算模型。提出一种在解析定理证明中的类比问题求解方法:使用类比来减少解决新问题所需的数据库的大小,数据库将限于证明类似定理所需要的那些公理和事实,然后约束数据库将加快对新定理的搜索。基于该方法,Kling提出了一个已实现的系统ZORBA,这是一个通过详细说明用户提供的源证明来辅助目标定理的自动证明系统,系统使用其证明中提供的定理和从句(公理或证明定理)来选择一组接近最优的起始子句,以用于目标定理的证明。尤为重要的是,Kling对APS提出了一种一般性方法,即用求解源问题的方案来指导目标问题的求解。以该方法思想为基础,在随后的类比推理研究发展中形成了一个重要的研究领域即基于案例的推理(case-based reasoning, CBR)。
诸如上述各种具体APS及其计算模型的研究各有侧重,没有研究一般形式的APS计算模型。对此,Carbonell[13-17] 研究提出一种APS的统一计算模型:转换类比(transformational analogy, TA)。TA的核心思想是使用转换操作符、将目标问题的解转化为源问题来解决。转换过程被视为一个问题求解的过程,在一个空间(称为“转换空间”或“T-空间”)中寻找新问题的可能解决方案。然而TA存在如下问题:TA中使用T-算子将一个解转换成另一个解中没有限制这些运算符的应用,因此任何解都可以通过应用足够数量的这些运算符转换成任何其他解,模型并没有解决如何从一开始就找到一个可能相似的源解等。对此,Carbonell[16-17]进一步研究提出衍生类比(derivational analogy, DA)。 DA更能恰当地捕获潜在相似源问题的检索,并且能够将解决一个问题的大部分基本计划移植到解决另一个问题上,那么这2个问题将被视为潜在的相似问题。
除上述APS及其计算模型研究外,对于类比推理一般计算框架,Kedar[3] 研究提出类比推理的统一计算模型UCMAR(unifying computational model of analogical reasoning)。UCMAR明确了17个要求及5个组成成分(子过程),指出当前类比推理计算模型研究的局限性等。
2.2 类比推理学习研究
通过类比学习知识是人类学习的一种重要方式。 如何在计算机上通过类比推理进行学习,1978年Winston[18-21] 开创了类比推理学习的研究。Winston研究了如何从先例和练习、功能定义和示例中通过类比推理进行知识学习,类比推理学习的主要方案是引导学习,关注一个人在学习过程中如何在2个领域的知识之间建立对应,通过提出的一种迁移框架进行概念学习,强调计算和系统实现,并提出了一个描述性学习系统。
在通过类比推理学习的过程中,对一些知识只进行一次类比推理学习可能存在错误,需要多层次或重叠的类比学习。对此,自1983年Burstein[22-24]研究了通过教授式类比推理学习理解计算机程序设计语言BASIC中赋值语句的计算模型,提出一种通过多重类比推理进行概念学习的系统(concept learning by multiple analogical reasoning, CLAR)。CLAR的中心思想是通过对熟悉的对象和情景进行多重类比,模拟在BASIC中教授学生概念。CLAR提供了一个学习模型,通过使用多重、重叠的类比来建立目标领域的因果表示。给定一个教学类比及其用法的示例,系统将识别一个特定的关系抽象,以便在类比过程中使用。除上述研究外,研究者还提出了一种以理解的特定能力使用类比来进行某种学习和推理的方法[15],基于抽象的有用类比推理理解类比学习[25]等。
2.3 类比推理理论及其计算模型研究
人们已认识到类比推理的基本过程至少包括4个子过程(检索、映射、转换和正当性),其中如何从源到目标的映射在类比推理计算模型研究中是一核心问题。在这一时期中,对此研究产生的“结构映射理论 (structure mapping theory of analogy, SMT)及其计算模型”和“约束满足理论(constraint-satisfaction theory, CST)及其计算模型”,是迄今类比推理理论和计算模型研究中具有重大影响的成果。
2.3.1 结构映射理论SMT及其计算模型SME
如何建立从源到目标的映射,自1980年Gentner等[26-28] 研究提出结构映射理论。SMT关注类比对象的关系结构的共同性,这一共同性独立于这些关系所在的对象域(源域和目标域)。SMT中的知识表征只根据知识的句法而不依赖内容,源到目标的映射被抽象到与领域无关的层次上描述,并以系统性原则约束映射。由此,SMT具有如下特点:人类智能中的类比是将一种范围(即源域)知识映射到另一种范围(即目标域);源映射到目标是将源域对象具有的结构关系(低级关系)映射到目标域;类比对象的属性不发生映射;映射遵循所提出的系统性原则,映射低级关系的选择限制条件构成相互联系的关系系统,低级关系的映射受高级关系的限制;在不同情况下映射的内容完全取决于知识表示的句法属性,而与领域的具体内容或要实现的目标内容无关;其中,结构映射过程最主要的环节就是系统性原则。映射源域到目标域的低级关系(一阶谓词)受具有推理意义的高层次关系(高阶谓词)的支配而不受孤立的谓项支配,因而系统化原则可以约束任何类比的源和目标之间的映射。
Gentner等[29-30]进一步研究提出了SMT的一个计算模型结构映射引擎(structure-mapping engine, SME),SME是一个运用SMT并在计算机上已实现的类比推理系统。SME应用结构映射理论,更好地理解处理句法如何控制映射的方式。SME能匹配源描述与目标描述的组成部分(关系、属性和函数)之间的对应关系、一组根据映射得到的关于目标的候选推论,从句法上检测每一组整体匹配并予评分。
2.3.2 约束满足理论CST及其计算模型
在类比推理中,映射确定了源与目标的“相似元素”(概念、属性、关系等)之间的对应关系,所以这样的从源到目标的映射不具有唯一性。对于类比推理来说,哪些映射适合或不适合将正确的源知识转移到目标是至关重要的。因此,约束从源到目标的映射在类比推理研究中已形成主要共识。 在以往的研究中提出的约束方案有:强调结构约束的系统性约束映射[19, 23],将映射约束为属于源和目标共享的抽象的那些关系[10, 25, 31],或者仅通过目标中的一致性来限制映射[11, 30],以及从误差分析到使用多重类比的在目标域内证明和调试映射[15,28]。Hall[5]将类比映射的约束分为3类:保留源描述的关系结构,保留先验确定的语义类别以及保留推理上下文相关的材料。每种约束类都引入了首选项,这些首选项限制了类比映射的详细描述。Holyoak等[32-33]对类比推理中映射子过程的研究融合了以上3类类比映射约束思想,提出了一种新的基于同构性、语义相似性和语用中心性约束的源与目标之间的类比映射约束满足理论。对于CST,他们研究提出2个计算模型:类比约束映射引擎(analogical constraint mapping engine, ACME)[34-35] 和约束满足类比检索(analog retrieval by constraint satisfaction, ARCS) [36],并且ACME和ARCS(LISP程序)均在计算机上实现。
CST的基本思想是从记忆中提取类比应由同时满足语义相似性、结构一致性和语用中心性的约束共同决定,当目标类比以待解决的问题、要给出的解释或要得出的结论的形式呈现时,通过在记忆中搜索语义、结构和语用上的相似物,在记忆中找到潜在有用的源类比。
ACME在计算机上实现了CST关于映射的3种约束性,从而展示了这些约束的一般适用性。ACME的中心思想是通过一个支持和竞争的假设网络来表示以映射哪些元素的约束,一个并行约束满足的协作算法识别映射假设,这些假设共同表示了最适合交互约束的总体映射。ACME已经被应用到一系列的实例中,包括问题类比、解释性类比、故事类比、形式类比等,ACME应用结果与心理学实验获得较好的一致性。ARCS以知识图谱WordNet为基础,根据3种约束条件检索与目标结构最相似的源结构。当发现源域中潜在的相似结构时,通过使用标准的并行连接松弛算法(parallel connectionist relaxation algorithm, PCRA),表示出各种源结构与目标结构的相对对应关系。ARCS表明,语义、同构和语用3种约束在AR的检索、映射和转换3个不同子过程中的重要性,如表1所示。
类比推理子过程 语义 同构 语用 检索 非常重要 重要 重要 映射 重要 非常重要 重要 转换 重要 重要 非常重要 3. AI中早期类比推理研究的总结与分析
由于类比推理是智能的核心,人工智能应该尝试理解这种现象,并对其进行计算建模,这符合人工智能的科学目标。为此,在20世纪中,研究者们主要在类比问题求解和计算模型、类比推理学习、类比推理理论和计算模型以及计算机实现等方面做了不懈努力,取得了丰硕成果。本文从6个方面简要地总结分析了这一时期AI中类比推理研究的主要特点(表2)。这一时期人们已认识到AI中类比推理研究的思想、理论和方法应该具有可计算性[5],但由于AI中的类比推理研究涉及心理学等认知科学以及数学和计算机等相关学科,类比研究对象多样化(如:实体或概念、事物描述、系统结构等),以及类比推理的推断结果具有或然性而不具有唯一性,所以决定了类比推理的理论和技术研究比其他推理形式研究更具有复杂性和困难性。这样的复杂性和困难性致使类比推理至今仍未形成完整而系统的理论和技术,也影响了进入21世纪后AI中类比推理研究主题的变化、特点和发展趋势。
续表 2 文献
时间研究
主题计算模型/
机器实现主要研究 主要贡献 存在的主要问题 文献[13-17]
1981—1986类比问题
求解APSTA, DA/
未实现APS的统一计算模型 提出将一个解决方案转换为另一个解决方案的统一求解方法 一个系统如何知道一个问题的解的推导过程中需要保留哪些信息等 文献[3]
1988类比推理
计算模型UCMAR/
未实现类比推理统一计算模型 明确统一计算应包括5个子过程和17个要求 UCMAR只是描述性模型,没有研究其计算性、编程和计算机实现 文献[18-21]
1978—1983类比推理
学习DLS/
未实现基于先例的类比推理学习 提出从先例和练习、示例等中通过类比推理学习知识 通过结构特征的部分匹配检索相关先例,不能解释相似但不同的领域知识具有的特殊性 文献[22-24]
1983—1986类比推理
学习CLAR/
已实现多重类比推理概念学习 通过使用多重、重叠的类比学习概念知识等 学生理解类比需要提供关于box和variable相似的动作的提示等 文献[27-29]
1980—2000类比推理
理论— 结构映射理论SMT 建立源域中的关系结构到目标域中关系结构的映射理论 系统性原则没有给出如何选择源域对象的一些关系而忽略其他关系等 文献[30-31]
1989,1995类比推理
计算模型SME/
已实现SMT的结构映射引擎 运用SMT有效处理句法如何控制的映射方式和匹配方法等 未研究结构不同的知识在映射中的计算复杂度,结构相似的知识是否语义相似? 文献[32-36]
1985—1990类比推理
理论— 约束满足理论CST 建立源到目标的映射满足同构性等3种约束条件的理论 如何由目标到源的所有命题的映射,评估目标和源的任意2个命题之间映射的有效性 文献[34-35]
1989类比推理
计算模型ACME/
已实现类比约束映射引擎 提出从一组元素对应的组成映射单元中导出全局“最佳”映射等 没有考虑目标与源的任意2个命题之间在3种约束下的映射的计算复杂性等 文献[36]
1990类比推理
计算模型ARCS/
已实现约束满足类比检索 同时应用3种约束检索复杂的目标结构 不具有目标与源结构相似性弱但语义相似性强时的检索能力等 4. AI中近期类比推理主要研究和特点
进入21世纪,人工智能中的类比推理研究更加深入广泛,研究成果更加丰富(约500余篇发表文献)。在这一时期,类比推理研究呈现出如下主要特点:类比推理理论研究少;类比推理应用研究、基于案例的推理(case-based reasoning, CBR)研究多;CBR与深度学习(deep learning, DL)和可解释人工智能(explainable AI, XAI)的协同研究。可归纳为4个研究主题:类比推理理论和CBR的理论基础、类比推理应用、领域CBR、CBR与DL和XAI。图3表示了这一时期中发表文献所属研究主题的占比情况。
4.1 类比推理理论研究
在这一时期,类比推理理论研究虽然较少,但仍出现“启发式驱动理论投影 (heuristic driven theory projection, HDTP)”和“类比比例理论”2项深入系统的研究成果,在理论研究中具有代表性。
4.1.1 启发式驱动理论投影HDTP
如何建立从源到目标的映射,20世纪中研究产生了“结构映射理论SMT”和“约束满足理论CST”(见2.3节)。在21世纪中,Gust等[37-39]为深入研究源域和目标域的结构共性的认知机制,提出了启发式驱动理论投影。HDTP是继SMT和CST后又一个关于类比推理理论研究的具有代表性的成果。HDTP是一种基于一阶逻辑的形式化类比求解框架,其基本思想是将源域和目标域的知识表示为一阶逻辑理论,为了源域与目标域之间能够建立映射,将源域和目标域中的子项泛化(即一般化),并使得源域和目标域知识编码成的一阶语言的公式也泛化,将源域和目标域形式化为多类的一阶公式集。使用反统一(anti-unification)这一核心概念比较源域和目标域中公式的结构共性,并对各类公式进行结构映射运算,逐步计算可能的泛化公式以及由某种启发法控制的替换,尽可能多的源事实和规则具有一致性地被转换到目标。泛化和转换源事实和规则的过程即为理论投影过程。由于HDTP是一种用一阶逻辑理论描述源域和目标域的符号类比模型,所以HDTP与SMT一样比其他类比推理计算模型具有更强的表达能力,而且HDTP框架已在Prolog中实现。HDTP主要关注类比推理基本过程中的映射和转换,并未研究检索和正当性。在HDTP中,映射过程负责构建源域和目标域的泛化,类比映射的计算通过一个泛化过程,将源域和目标域的匹配项泛化为一个公共变量,从而建立源域和目标域项的对应关系。通过将源域公式与目标域公式对齐,逐步建立映射阶段中的结构匹配。源域公式与目标域公式的选择由启发式指导,对齐标准取决于2个公式在结构和语义上是否相同,对齐的合理性用一个映射度量方法来衡量,从而使用反统一概念对公式进行结构映射运算。在转换过程中,使用类比映射来翻译来自源域的知识,以其假定为有关目标域的新语句(推断结果),所传递知识的种类取决于建立类比的语境。
4.1.2 类比比例理论
类比比例(analogical proportion, AP)是类比的一种基本形式,是一个与类比推理密切相关的概念,它描述了4个同类对象之间的特定关系。例如:“牛犊之于公牛,犹如驹子之于种马”。AP涉及4个项,英文表述为“a is to b as c is to d”,通常形式表述为a : b :: c : d。它提供了一种众所周知的认知方法来表示(a, b)和(c, d)之间的比较判断,这种方法暗示了一对(a, b)中元素的比较与一对(c, d)中元素的比较产生的结果或许相同。
自2008年,Prade等[40-57]对类比比例理论进行了深入研究。他们认为,类比比例是形式化类比推理的一个关键概念,它依赖于以下原则:如果这种比例拥有用于描述4个项a、b、c和d的已知特征的一个显著子集,那么该比例也可能保留了其他特征,这可能有助于从这些其他特征的a、b和c上的值猜出这些特征上的d的未知值。他们的类比比例理论开创了类比比例的形式化研究,提出并深入研究了类比比例的布尔值模型和多值模型、布尔类比比例等,并表明了类比比例是逻辑比例的特例。他们提出的逻辑模型表明,当且仅当a与b不同,正如c与d不同,反之亦然,类比比例才成立。除此之外,他们研究给出了类比比例的逻辑表达式满足如下关键性质:a : b :: b : a(自反性),a : b :: c : d ⇒ c : d :: a : b(对称性),a : b :: c : d ⇒ a : c :: b : d(中央置换性);研究了布尔型逻辑比例的基于相似性和基于非相似性的多值扩展,齐次比例(包括类比比例)建模的主要结果,异质比例、异质比例与同质比例的联系及其性质,以及类比比例和比例分量之间的汉明距离之间的联系等。
近年来,Henri等[58]继续深入研究类比比例理 论。针对所有先前研究的类比比例四元组中涉及的对都是通过相似性的相等或不相似性的相等进行比较的特点,研究了相似性或不相似性的不相等,从而提出“类比不等式”的概念及其逻辑建模 和应用。Lim[59]从机器学习的视角将词视为多维空间中的向量,从传统的平行四边形类比观出发,采用纯粹的机器学习方法,提出了一种改进的词语类比分类方法和类比方程求解方法。为在形式概念分析(formal concept analysis, FCA)的框架中引入类比推理,研究了FCA中描述对象和属性之间的关系涉及的2个论域的联系,研究了FCA中一种非分配格中的类比比例,在形式概念之间定义一种类比比例并给出算法[60]。针对通过类比比例推导出布尔或数值模型时存在一个基本假设即通过排列中心元素b和c来保持比例的问题,提出了一个基于内反转的弱公设集,并由此导出了无假设的布尔值模型和数值模型[61]。
4.2 类比推理应用研究
在这一时期,类比推理在具体领域中的应用研究增多,研究题目更加广泛。对于这一时期中的类比推理应用研究,可集中归纳为“自然语言处理中的应用”“测试和预测中的应用”“视觉信息处理中的应用”“软件工程中的应用”和“数学中的应用”5个方面。
1) 自然语言处理中的应用。
在自然语言处理中,类比推理的作用是多方面的。识别词汇类比的方法或产生类比的方法被提出[62-64]。在一个领域内的语境中,可以使用类比匹配在给定的分类法或语义网络中创建新的类别[65-67]。对言语类比推理中语义和关系处理的时间过程的研究表明,语义信息对早期语义比较阶段和后期关系比较阶段都有影响,而关系属性对类比推理的后期影响更大[63]。在处理不同语言时,类比比例的使用在语言翻译中表现出良好的效果[68-71]。随着大量的自然语言语料库的出现,新的问题也随之产生,如经常出现对于一个给定的查询没有精确的匹配甚至根本没有匹配。这些问题不能仅通过标准的计算语言学技术来解决,类比推理可以用来给出近似的答案[72-74]。总的来说,在计算语言学中,类比推理用法是一个生动的研究领域,仍然可以引出具有挑战性的观点[66]。
2) 测试和预测中的应用。
自Evans[9-10]为解决几何类比智力测试问题创建了类比推理的LISP程序(见2.1节),表明类比推理是一种有效的与IQ测试的解决相关的启发式方法。进入21世纪后,基于类比的测试和预测方法在许多领域中得到应用。为了优化目前评价齿轮刀具与涂层的性能和磨损而常用的各种模拟切削试验方法,Stein等[75]提出一种简单的类比推理测试方法。该方法通过计算涂层−基体化合物在恒定接触温度下的温度变化,证实了该方法更加简便。Raven等[76-77]研究了更为复杂的智商测试:Raven (瑞文)渐近式矩阵智能测试;Lovett等[78]通过应用结构映射方法以及利用认知架构对人的行为做出预测;Klenk等[79]用类比模型公式和草图解决Bennett机械理解测试问题。
近年来,Brecher等[80]为了研究磨削液对边界层修正的影响,采用不同的流体和添加剂对不同地面试验部件的边界层特性进行了类比测试。Roberto等[81]运用简单言语类比测验(simple verbal analogies test, SVAT)方法,探究在正常对照样本中提供该测试的规范值以及原始分数和等效分数的修正,表明SVAT是一种评估执行功能、工作记忆、区分认知退化和正常衰老的有效测试方法。在考古界,存在采用或者拒绝比较数据重建过去人类社会的“人种学类比”(ethnography analogy) 2种不同观点,Currie[82]通过对这2种不同观点进行分析,认为人种学中的类比推理是利用人类学中的比较数据来重建过去人类社会的一种有效方法。并且,对弹丸点进行人种学和考古学形态计量的类比测试,测试了基于大小和形状变量比较的形态学类比[83]。
3) 视觉信息处理中的应用。
人的视觉是人类感知世界的重要组成部分。视觉类比推理被认为是解决人类视觉认知的一个重要手段,通过类比推理可以另一种方式表征视觉认知模型。对此,Croft等[84]研究了视觉类比中的动态成像,即一种基于场景图的视觉图像计算模型。该模型结合了一个语义网络记忆系统和基于场景图的计算程序,可以解释人们想象涉及运动的新情况的能力,以及使用视觉类比来比较2个运动物体系统的能力。Kunda等[85]提出一种求解Raven渐进式矩阵智能测试中使用图像表示问题的计算模型。Davies等[86]提出了一个类比问题求解中的视觉计算模型,该模型用一种表示和传输视觉信息的计算机程序语言编制,可部分解释麦克斯韦关于电磁的推理的认知历史分析。Casakin等[87]通过实证数据说明类比可以有效地促进设计问题的解决,研究了视觉类比推理在设计问题解决中的指导作用,表明类比推理在基于视觉表现的任务执行中的作用(如专家和新手设计师之间策略使用的比较,提高设计问题解决能力)。Hertzmann等[88]提出一种新的图像实例处理框架:图像类比法。该框架包括设计和应用2个阶段,设计阶段中由一对图像,其中一张图像是另一张图像的过滤版本,作为训练数据呈现;应用阶段中学习滤波器被应用于一些新的目标图像,以产生类似的滤波结果。Yaner等[89] 基于类比约束映射的理论CST(见2.3.2节),将类比检索和映射视为约束满足问题,提出一种基于回溯法的约束满足二维线形图检索与映射方法。对于视觉类比(基于视觉知识的类比)的计算模型少的状况,Davies等[90]提出一种在问题解决中可视化类比的认知计算模型。另外,对于客观物体的形体的认知和计算,一些研究[91-93]认为,人类认知几何图形并不是单独地感知图形中的元素,而是将图形的结构(立体、平面)、属性(颜色、关系)等作为一个整体,使用现有类比推理理论和计算模型(如Gentner结构映射理论和属性匹配过程的结构匹配算法、类比比例等)对这些几何问题进行了理论和实验研究。
4) 软件工程中的应用。
软件工程是研究和应用如何以系统性的、规范化的、可定量的过程化方法去开发和维护软件,以及如何把经过时间考验而证明正确的管理技术和当前能够得到的最好的技术方法进行结合。其中,软件项目管理的一个主要问题是很难准确预测开发应用程序所需的工作量。类比软件工作量估计似乎很适合这种性质的模型问题,这种模型的准确性取决于数据集的特征。Azzeh等[94]研究了利用模糊特征子集选择算法改进类比软件工作量估计,提出一种基于模糊逻辑的特征子集选择算法,这种计算方法比传统方法能提供更优的项目绩效估计指标。Li等[95]对基于类比的工作量估计中的5种属性权重启发式算法进行了比较研究及评价,并提出了另外4种使用粗糙集分析进行属性加权的启发式方法,结果表明其中3种启发式方法比同等权重的启发式方法效果更好。Paritosh等[96]基于相似性和类比在定量估计中的作用的认识,提出一个类比估计的计算模型。在开发和维护软件方面,Swan等[97]研究了基于遗传程序设计(genetic programming, GP)的程序合成与类比推理之间的双向联系,表明可以利用GP借助结构表示和正式的反统一机制来解决比例类比问题,并提出通过检测和适应性案例之间的类比来提高GP搜索过程效率的潜在方法。Schockaert等[98-99]提出一种接近类比推理的定性方法:概念空间的内插推理与外推推理,对于软件工作量可以推断出粗略的估计。
最近,Sotoudeh等[100]将类比视为软件工程的核心基元,展示了如何将复杂的软件工程问题(例如程序理解和源代码转换学习)简化为类比问题,并提出一种适用于对程序进行类比的类比推理算法Sifter等。
5) 数学中的应用。
著名数学家Polya[1]曾阐述了类比推理在数学科学中的重要性。简言之,类比推理是发展数学理论的一种有效试探方法,是提出数学猜想和假说的一条重要途径,在数学研究和数学教育中具有独到的作用。在21世纪,许多学者对数学中的类比推理应用进行了研究。Pease等[101-102]研究了几何中的类比制定和修正,并以笛卡尔−欧拉猜想中的类比为例,探讨了类比产生和修正的不同过程之间的复杂相互作用,强调了类比在概念、猜想、证明和相关领域的起源和发展中所起的作用。并且,为了论证类比推理可以揭示创造力产生和评估这2个关键过程,通过数学创造性阶段类比的3个历史个案,研究展示了数学类比如何帮助评价以及更明显地生成一个数学猜想,表明类比推理是数学中辅助生成和评价的一种工具。Whittle等[103]基于“证明即程序”的思想研究类比编程,针对专业的多国语言文本编辑软件MLEditor,提出一个基于类比的多语编辑器CYNTHIA。CYNTHIA表明“证明即程序”特别适合函数式编程语言,可用作实现复杂编辑器的框架。对于数学教学中类比推理方法的应用研究,Vamvakoussi[104]通过几何问题类比学习,研究说明类比的启示作用以及在数学教学中发挥作用的条件。
近年来,关于类比推理在数学科学中的作用和意义,2020年Gomez[105]新著“Artificial mathematical intelligence”以建立一个新的跨学科的元研究理论基础(简称认知元数学)为主要思想,寻求构建一个全局(理想的)人工智能体,它能够以一种人类风格的方式(协同)解决具有数学概念描述的交互式形式化问题,并提出具体数学研究中的形式类比推理。有可能在命题逻辑中为论证的有效性生成建设性证明时,以所涉及的命题之间的具体类型的类比匹配为模型。
4.3 基于案例的推理CBR研究
基于案例的推理是一种基于类比推理的方法,是一种问题求解的范式,或者说是类比推理的一种表现形式。CBR的基本思想源于1971年Kling[11-12]类比问题求解研究(见上述),基本原理是基于过去的经验或案例来解决新问题。即对于一个要解决的问题,从过去的案例(案例库)中找出与问题最相似的案例,并将有关案例的结论作为问题的解答。
一个典型的CBR问题求解过程的基本步骤可以归纳为4R[106]:案例检索(Retrieve)、案例重用(Reuse)、案例修正(Revise)以及案例保存(Retain)。在CBR中,通常把待解决的问题或工况称为目标案例(target case),把历史案例称为源案例(base case),源案例的集合称为案例库。图4显示了CBR问题求解基本流程[106]:一个待解决的新问题为目标案例;利用目标案例的描述信息查询过去相似的案例,即对案例库进行检索,得到与目标案例相似的源案例,重用该案例中的信息和知识解决新问题;如果这个解答方案不满足则对其修正;最后,如果修正后的解决方案可用于解决给定的问题,则将其作为案例保留在案例库,以便将来使用。
自进入21世纪,随着各领域数据的快速积累,各种专业数据库、案例库等知识库的逐渐建立,基于知识库中知识解决新问题的CBR研究备受人们重视,研究论文、研究专著以及专题学术会议增多。近年来,CBR研究还呈现出与现今人工智能中其他研究热点相结合的特点,如第26届ICCBR(2018年)和第27届ICCBR(2019年)均设立了“CBR与深度学习”、“CBR与智能系统的解释”、“CBR与机器学习的协同作用”等专题研讨会。对于这些数量多、研究范围广的CBR研究成果,我们将选择一些相对集中的研究或与人工智能前沿问题相结合的新的研究为代表予以综述。
4.3.1 CBR理论研究
由CBR的基本原理可知,CBR是一种近似推理。对于这种基于相似性的推理的理论基础予以研究较少的状况,专著(Case-based approximate reasoning)《基于案例的近似推理》[107] 试图弥补这一缺陷。该专著通过提供基于相似性推理的形式模型为CBR奠定坚实的形式化基础为目标,使用底层框架的形式语言,以显式模型的形式表达启发式相似性问题及其解决案例的原理,从而可利用该框架提供的推理机制。
在CBR问题求解过程中,案例修正的目的就是将检索的案例解进行适应性修正后作为问题的解,案例修正过程就是一个“适应过程”。适应知识为领域知识,如何获取是CBR中一个理论性和方法学的重要问题。对此, Craw等[108] 提出了一种将案例知识本身作为一个源,从该源可以组装适应任务的训练数据的自省学习方法。并通过一个基于成分的药物设计验证了学习适应的效果。D'aquin等[109]基于数据库知识发现和数据挖掘的原理和技术,提出了一种适应知识的挖掘方法。CBR通常利用正源案例,每个案例都包含一个问题和该问题的正确解决方案,而CBR系统事实上有时自然会产生不正确的解决方案的案例(负案例)。据此,Lieber等[110]提出使用正案例和负案例发现适应知识。
4.3.2 具体领域中的CBR研究
具体领域(如工业、医学、教育、法学等)中的CBR研究越来越多,可以说是目前CBR研究中的主流。因具体领域中的CBR研究广泛,我们以“医学中的CBR研究”(以肿瘤诊断治疗的CBR为例)、“新型领域(如社交媒体、信息检索等)中的CBR研究”为综述示例。
1) 医学中的CBR研究。
医学中的CBR研究是相对集中的一个领域, 2018—2020年ICCBR中连续3年专设“健康科学中的CBR”或“卫生领域的CBR应用”专题研讨会表明了这一点。
乳腺癌是威胁人类女性健康最主要的恶性肿瘤之一。如何对其诊断治疗,D'aquin等[111] 研究了如何从专家那里获取基于病例而给出治疗决策的方法,提出乳腺癌治疗的一个CBR决策支持系统。它显示了如何通过引入中间问题分解适应过程可以突出简单和概括的适应步骤,并从决策支持系统的适应知识单元中归纳出一些适应知识单元,这些知识可以在其他基于案例的决策支持系统中实例化,特别是在医学领域。Gu等[112] 对标准CBR应用于乳腺癌相关诊断存在大量不同类型的属性和难以从专家获得适宜属性权重的困难,提出一个比标准欧几里德距离可更好地同时处理连续属性和离散属性的加权异质值距离度量,并基于这种度量构建一个乳腺癌诊断案例的CBR系统。该系统使用一种遗传算法自动学习此距离度量中涉及的属性权重,并通过2个案例研究评估CBR系统。Lamy等[113] 针对医学领域中大多数CBR系统提供的解释仅限于相似案例显示的特点,提出一种基于视觉案例的推理CBR。其方法既可以作为一种算法自动执行,又可以在用户界面中可视化地呈现,具有充分的(定量和定性)可视化解释性,并将此方法应用于乳腺癌的治疗和乳腺癌的真实数据集。Bartlett等[114] 研究了通过DNA甲基化和基于临床协变量的检索对乳腺癌组织进行分类。为了使用临床协变量数据,使用一种新的基于置信度的程序进行分类。该程序自动检索每个测试样本的已解决案例,直到达到阈值,表明整合临床协变量可以提高构建的2阶段系统的准确性。
2) 新兴领域中的CBR研究。
Facebook和Twitter是近年来出现的2个新兴著名社交平台,是一种新出现的信息交流处理领域。随着这些社交媒体上的各种评论、调查回复、推特或帖子的快速增长,对情感进行分析(也称为意见挖掘)变得越来越流行,采用CBR对情感分析是一种新出现的方法。Ohana等[115]考虑了跨多个域的主观文本的情感分类任务,提出了一种可扩展的跨域情感的CBR分类方法。该方法利用情感词典和域外数据来构建基于案例的系统,在系统中过去案例的解决方案被重用于预测新文档的情感来自未知域。Zhou等[116]研究了从在线产品评论的情感分析中用CBR挖掘潜在客户需求,提出一种通过CBR来获取潜在客户需求的2层模型。第1层强调情感分析,开发了模糊支持向量机来构建基于情感词典列表的情感预测模型;第2层用CBR,通过类比推理普通案例和特殊案例之间的语义相似性和差异来识别潜在客户需求的隐含特征,CBR用于执行案例检索和案例适应。Berka[117-118]首次提出将基于规则的推理(rule-based reasoning, RBR)和CBR 2种推理方法结合对情感分析进行研究。以一个示例场景的RBR和CBR系统的应用研究为例,对该场景首先应用CBR尝试检索相似的案例来解决问题,并且在找不到此类案例或案例库中没有足够相似的案例的情况下应用RBR。表明采用这种互补的推理方式符合人类的决策过程,是适宜情感分析的一种有效方法。在服务设计行业中,为加速个性化创新服务设计,文献[119]研究了集成CBR和发明问题解决理论(teoriya resheniya izobreatatelskikh zadatch, TRIZ)的定制和以知识为中心的服务设计模型。将CBR与TRIZ相结合,提出一种以知识为中心的创新服务设计(knowledge-centric innovative service design, KISD)模型等。
4.4 CBR与深度学习和解释人工智能的协同研究
近年来,对于CBR与深度学习DL这2个在过去视为不相干的领域,随着它们的研究发展人们已认识到两者具有交叉性,相得益彰。在人工智能领域中,出现了一种新的探索即CBR与DL、CBR与可解释人工智能XAI的协同研究,这种研究使得CBR、DL和XAI研究相互受益,促进彼此更加深入地发展。
4.4.1 CBR与深度学习
关于CBR与深度学习DL,过去人们几乎都是研究如何在CBR研究中应用DL方法。2020年Leake等[120] 则对此提出反向的观点,认为除了专注于将DL方法应用于CBR之外,还应该将CBR研究引入DL,CBR方法可以促进DL、帮助解决DL中的挑战问题,有可能对未来的人工智能系统产生重大影响,并增加CBR的应用范围。在这种观点中,CBR被视为定义一组任务的一般高级流程,所需的功能可以使用各种技术来实现,包括神经灵感和符号技术,CBR还可以在自动机器学习(automated machine learning, AutoML)中发挥重要作用等。López-Sánchez等[121]提出了一种新的使用深度卷积神经网络(deep convolutional neural network, DCNN )作为案例表示生成器的基于图像的网页分类CBR系统。系统融合了DL技术,具有较高的准确率和最小化计算成本特点。实验结果表明,该方法在基于图像的网页分类方法优于其他替代案例表示技术。对此,文献[122]认为使用DCNN从图像中提取特征并在案例检索中使用这些特征,由此只能将图像分类为预定义的类,因而不执行新的对象发现。因此提出一种结合CBR和卷积神经网络的方法来检测图像中的新对象类型的系统。该系统利用了CNN提供的自动特征学习和提取,同时利用了CBR的能力,在相对较少的训练案例下执行增量学习。在航空服务行业中,需要大量的客户服务工程师处理解决复杂的航空票务技术支持问题。对此,Amin等[123]将DL和大数据与CBR相结合,提出一种能为工程师自动生成适宜方案的CBR应用程序DeepTMS。DeepTMS是一种混合的CBR系统,对客户机票需求信息使用深度神经网络来帮助从过去案例中自动提取特征并界定文本之间的相似度,自动地实时对新机票提出最相关的优先解决方案。展示了在解决需要快速、实时地处理大数据的复杂任务时,深度学习和CBR是一种有效的新方法。2020年Hoffmann等[124]为解决检索过程中复杂而耗时的图形相似度计算问题,将文献[30]中的MAC/FAC方法应用于面向过程的基于案例的推理 (process-oriented case-based reasoning, POCBR),提出了一种新的相似性度量方法,利用能学习评估图相似性的图嵌入模型 (graph embedding model, GEM)和图匹配网络 (graph matching network, GMN)生成的向量空间嵌入来逼近一个精确但计算复杂的图相似性度量等。
4.4.2 CBR与可解释人工智能
由于机器学习算法基于合适的训练数据计算导出结果,在大多数情况下因为缺乏透明度而成为难以解释的黑盒子,对于当今最流行的深度神经网络尤其如此。可解释人工智能(XAI)旨在改善机器学习算法、模型和预测的可解释性。近年来,XAI问题研究备受关注,成为许多著名AI和DL领域学术会议(AAAI、IJCAI/ECAI、IJCNN、ICCBR和FAT-ML等)的一个研究主题。从CBR的角度看,Hüllermeier[125]认为基于类比原理的方法是现有研究XAI方法中的一种可行的替代方法,基于类比推理的DL算法产生的预测解释可以有意义地补充基于相似性的解释。为证实这些主张,他概述了基于类比的解释的基本思想,并通过一些例子说明其潜在的有用性。Agudo[126]在以题为“对XAI绘制CBR的挑战和机遇”的ICCBR-2019大会报告中,认为CBR可以提供一种在交互式解释中重用经验的、基于记忆的技术来生成对不同AI技术和应用领域的解释,并且论述了与智能系统的解释相关的CBR研究面临的挑战和有前途的研究路线。Keane等[127]研究了CBR如何解释人工神经网络(artificial neural networks, ANN),探讨了一种基于案例解释的XAI问题的理论分析方法。该方法基于不透明的黑盒子AI系统由更易解释的白盒子AI系统来解释的思想,提出一种针对XAI问题的特定解决方案,即将ANN与CBR系统配对,对ANN的不透明输出用CBR的解释案例进行解释。并以此方法对以往的ANN-CBR双系统研究工作提出了新的理论解释,为CBR在XAI中的进一步作用确定了路线图,总结了该XAI解决方案的未来发展方向。Nadeem等[128]提出一种采用CBR方法的基于网络的DNN可解释性框架的设计和实现,利用相似的数据点和决策边界来帮助实现有效的解释等。Recio-garc'i等[129]为解决图像分类解释的LIME(local interpretable model-agnostic explanations)算法的配置问题,提出了一种基于CBR的解决方案CBR-LIME,并根据用户及其相关的“最佳”LIME配置收集了一个图像案例库,通过这个案例库实现了CBR-LIME方法。Li等[130]将DL的优点与CBR的可解释性相结合构建一个可解释的DNN,虽然模型不能完全解决一般DNN中决策过程的透明度问题,但它允许部分地追踪分类路径以便进行新的观察。Weber等[131]研究了基于文本案例的XAI,提出一种如何将CBR用于XAI的方法以证明由不透明学习方法(即目标方法)产生的解决方案的合理性。在其方法中案例问题是目标方法的输入输出对,案例解是解释。并为证明方法的有效性,通过使用多层神经网络结构的引文推荐系统Citeomatic进行了实验验证。Lawrence等[132]研究了当黑盒系统和CBR系统具有相同的训练数据时,CBR系统是否可以用来预测黑盒系统输出的置信度,并提出了用CBR置信度预测黑箱系统置信度的初步策略。
最近,使用反事实(Counterfactuals)解释作为XAI问题的解决方案是人们关注的一个研究途径。反事实可以帮助提供可解释的模型,使开发人员和用户能够理解难以理解的系统决策。然而,并非所有的反事实都同样有助于人类理解。对此,Keane等[133]从CBR的角度考虑反事实的解释,运用有关反事实潜力和案例库解释范围的思想,提出一种新的基于案例的方法来生成反事实,重复使用基于案例的好的反事实的模式,以生成可以解释新问题及其解决方案的类似反事实。气候变化给人类带来了重大挑战,尤其是对农牧业(如草场)的影响,使得领域案例在预测未来作物生长方面变得越来越没用。Temraz等[134] 使用反事实(破坏性气候事件)处理气候变化,在数据增强中使用反事实对未来不确定气候中的作物生长进行预测。该研究还表明,基于案例的反事实方法比基准、约束指导方法更好。
5. AI中近期类比推理研究的总结与分析
与20世纪AI中类比推理研究呈现的特点不同,在本世纪除了继续研究类比推理理论,研究者们更加重视类比推理的应用研究,尤其是本世纪中许多行业越来越多的数据储存,各种专业数据库、案例库等知识库的逐渐建立以及算力提高,促进了基于案例的推理CBR的研究,使得类比推理应用和CBR的研究范围更广、成果更多。我们从3个方面概要总结分析了这一时期AI中类比推理研究的主要特点,见表3。
主要文献 研究主题 主要研究和贡献 [37-39] 类比推理理论 启发式驱动理论投影 [40-61] 类比推理理论 类比比例理论 [107] CBR的理论基础 基于案例的近视推理,通过提供基于相似性推理的形式模型为CBR奠定形式化基础 [108-110] CBR的理论基础 适应知识获取方法:提出将案例知识作为一个源,从该源组装适应任务的训练数据的自省学习方法;提出基于数据库知识发现和数据挖掘原理与技术的一种挖掘方法;提出一种使用正案例和负案例的发现方法 [111-112] 具体领域中的CBR
(医学中的CBR)提出一种从专家获取病例治疗决策方法的CBR决策支持系统;提出一种基于处理连续属性和离散属性加权异质值距离度量,并基于这种度量构建的乳腺癌诊断案例的CBR系统 [113-114] 具体领域中的CBR
(医学中的CBR)针对医学领域中大多数CBR系统提供的解释仅限于相似案例显示的特点,提出一种基于视觉案例的推理系统,提出一种使用临床协变量数据的基于置信度的分类程序 [115] 新兴领域中的CBR 提出了一种可扩展的跨域情感的CBR分类方法 [116] 新兴领域中的CBR 从在线产品评论情感分析中用CBR挖掘潜在客户需求,提出一种通过CBR获取潜在客户需求的两层模型 [117-118] 新兴领域中的CBR 提出将基于规则的推理RBR方法与CBR结合对情感分析进行研究 续表 3 主要文献 研究主题 主要研究和贡献 [119] 新兴领域中的CBR 将CBR与TRIZ结合,提出一种以知识为中心的创新服务设计(KISD)模型等 [120] CBR与深度学习 提出将CBR研究引入深度学习的观点 [121] CBR与深度学习 提出一种使用深度卷积神经网络(DCNN)作为案例表示生成器的基于图像的网页分类CBR系统 [122] CBR与深度学习 提出一种结合CBR和DCNN的方法来检测图像中的新对象类型的系统 [123] CBR与深度学习 将DL和大数据与CBR相结合,提出一种能为航空票务技术工程师自动生成适宜方案的CBR应用程序 [124] CBR与深度学习 将MAC/FAC方法[36]应用于面向过程的CBR,提出一种利用图神经网络GNNs的相似性度量方法 [125] CBR与可解释XAI 提出基于类比推理的DL算法产生的预测解释可以有意义地补充基于相似性解释的思想 [126] CBR与可解释XAI 提出CBR可以提供一种在交互式解释中重用经验的、基于记忆的技术来生成对不同AI技术的解释的思想 [127] CBR与可解释XAI 研究了CBR如何解释人工神经网络ANN,提出一种基于案例解释的XAI问题的理论分析方法等 [128] CBR与可解释XAI 提出一个采用CBR方法的基于网络的DNN可解释性框架的设计和实现 [129] CBR与可解释XAI 为解决图像分类解释的LIME算法的配置问题,提出了一种基于CBR的解决方案 [130] CBR与可解释XAI 将DL的优点与CBR的可解释性相结合构建一个可解释的DNN [131] CBR与可解释XAI 研究基于文本案例的XAI,提出一种如何将CBR用于XAI的方法 [132] CBR与可解释XAI 研究当黑盒系统和CBR系统具有相同的训练数据时,CBR系统是否可以用来预测黑盒系统输出的置信度 [133] CBR与可解释XAI 运用反事实潜力和案例库解释范围的思想,提出一种基于案例的方法来生成反事实 [134] CBR与可解释XAI 使用反事实处理气候变化,在数据增强中使用反事实对未来不确定气候中的作物生长进行预测 [62-74] 类比推理应用 自然语言处理中的应用 [75-83] 类比推理应用 测试和预测中的应用 [84-93] 类比推理应用 视觉信息处理中的应用 [94-100] 类比推理应用 软件工程中的应用 [101-105] 类比推理应用 数学中的应用 总之,由于类比推理的本质是因认识到新情况与记忆中的已知情况在某些方面相似而推出它们在其他相关方面也相似,从而决定了类比推理应用研究和CBR研究将继续成为今后AI中类比推理研究的主题以及发展趋势。
6. AI中类比推理研究的发展趋势
在上述基础上,本文对AI领域中类比推理的研究工作进行归纳研究,认为AI领域中类比推理研究有如下几方面发展趋势:
1) 自1964年Evans开创类比推理研究以来,除了类比推理理论研究外,关于CBR出现了不少研究工作,特别是自进入21世纪,CBR的研究者、论文和研究专著以及专题学术会议(如4.3节)数量逐年增多。因而表明,CBR作为类比推理的一种应用形式仍将是一个主要研究发展方向。
2) 面对当今可解释人工智能XAI问题的挑战,CBR与深度学习的协同研究,特别是CBR与XAI结合、与反事实解释结合等研究,将形成类比推理理论与应用研究的一个新的发展方向。
3) 一个以知识为基础的系统的能力取决于它所拥有的知识来源。当今,知识图谱(knowledge graph, KG) 等大型知识库取得很大的发展,KG采用的知识表示方法可以有效地组织和表示知识,从而使知识在高级应用中得到有效利用。近年来,由于从大规模数据中挖掘有价值的隐藏知识需要推理技术的支持,使得从已有的数据中获得新的知识和结论,面向知识推理的KG成为研究热点[135-136]。随着KG的发展,尤其是各行各业(如工业、金融、医疗、法律和管理等)领域知识图谱(或案例库)的建设和发展,以这些知识库作为知识“源域”的类比推理应用研究,将会受到关注。因此,基于领域KG的类比推理及其CBR研究也将成为一个有前景的新的研究方向。
4) 类比推理在具体领域中的应用研究仍将受到重视。
5) AI中的类比推理研究与哲学、语言学、心理学和逻辑学等科学中的类比推理研究结合,将促进类比推理研究的发展,使得类比推理研究在理论上更加深入。这样的研究也将是AI领域中类比推理理论研究的一个发展方向。
7. 结束语
当前,在人工智能领域中由于深度学习技术的进步,促使语音、文字、图像识别以及自动驾驶等技术取得突破,形成了广泛的智能化研究和应用热潮。许多学者认为,这些基于多层神经网络的深度学习取得的成就,主要基于体量大的数据、算法的突破、算力的提高3个因素,人工智能及其智能化技术要进一步发展,必须在人工智能基础理论研究上取得突破。类比推理是人类智力的普遍现象,作为人类利用已有知识进行推理的最常见的一种思维形式,必然地在人工智能的研究中具有极其重要的研究价值及意义。本文的主要目的是使人们更加了解人工智能中从过去到现在类比推理研究全貌,对各研究主题及其代表性研究工作的基本研究思想、内容和研究特点以及存在的问题进行总结分析,企望促进我国人工智能中的类比推理研究。我们相信,随着人工智能理论与技术的深入研究,人工智能中的类比推理研究将被越来越多的人们重视,类比推理的理论和技术以及应用研究将得到更加深入广泛的发展。
-
表 1 3种约束在类比推理不同子过程中的重要性
Table 1 Importance of three constraints in different analogical reasoning subprocess
类比推理子过程 语义 同构 语用 检索 非常重要 重要 重要 映射 重要 非常重要 重要 转换 重要 重要 非常重要 表 2 AI中早期类比推理主要研究总结分析
Table 2 Summary and analysis of early main researches on analogical reasoning in AI
续表 2 文献
时间研究
主题计算模型/
机器实现主要研究 主要贡献 存在的主要问题 文献[13-17]
1981—1986类比问题
求解APSTA, DA/
未实现APS的统一计算模型 提出将一个解决方案转换为另一个解决方案的统一求解方法 一个系统如何知道一个问题的解的推导过程中需要保留哪些信息等 文献[3]
1988类比推理
计算模型UCMAR/
未实现类比推理统一计算模型 明确统一计算应包括5个子过程和17个要求 UCMAR只是描述性模型,没有研究其计算性、编程和计算机实现 文献[18-21]
1978—1983类比推理
学习DLS/
未实现基于先例的类比推理学习 提出从先例和练习、示例等中通过类比推理学习知识 通过结构特征的部分匹配检索相关先例,不能解释相似但不同的领域知识具有的特殊性 文献[22-24]
1983—1986类比推理
学习CLAR/
已实现多重类比推理概念学习 通过使用多重、重叠的类比学习概念知识等 学生理解类比需要提供关于box和variable相似的动作的提示等 文献[27-29]
1980—2000类比推理
理论— 结构映射理论SMT 建立源域中的关系结构到目标域中关系结构的映射理论 系统性原则没有给出如何选择源域对象的一些关系而忽略其他关系等 文献[30-31]
1989,1995类比推理
计算模型SME/
已实现SMT的结构映射引擎 运用SMT有效处理句法如何控制的映射方式和匹配方法等 未研究结构不同的知识在映射中的计算复杂度,结构相似的知识是否语义相似? 文献[32-36]
1985—1990类比推理
理论— 约束满足理论CST 建立源到目标的映射满足同构性等3种约束条件的理论 如何由目标到源的所有命题的映射,评估目标和源的任意2个命题之间映射的有效性 文献[34-35]
1989类比推理
计算模型ACME/
已实现类比约束映射引擎 提出从一组元素对应的组成映射单元中导出全局“最佳”映射等 没有考虑目标与源的任意2个命题之间在3种约束下的映射的计算复杂性等 文献[36]
1990类比推理
计算模型ARCS/
已实现约束满足类比检索 同时应用3种约束检索复杂的目标结构 不具有目标与源结构相似性弱但语义相似性强时的检索能力等 表 3 AI中近期类比推理主要研究总结分析
Table 3 Summary and analysis of recent main researches on analogical reasoning in AI
主要文献 研究主题 主要研究和贡献 [37-39] 类比推理理论 启发式驱动理论投影 [40-61] 类比推理理论 类比比例理论 [107] CBR的理论基础 基于案例的近视推理,通过提供基于相似性推理的形式模型为CBR奠定形式化基础 [108-110] CBR的理论基础 适应知识获取方法:提出将案例知识作为一个源,从该源组装适应任务的训练数据的自省学习方法;提出基于数据库知识发现和数据挖掘原理与技术的一种挖掘方法;提出一种使用正案例和负案例的发现方法 [111-112] 具体领域中的CBR
(医学中的CBR)提出一种从专家获取病例治疗决策方法的CBR决策支持系统;提出一种基于处理连续属性和离散属性加权异质值距离度量,并基于这种度量构建的乳腺癌诊断案例的CBR系统 [113-114] 具体领域中的CBR
(医学中的CBR)针对医学领域中大多数CBR系统提供的解释仅限于相似案例显示的特点,提出一种基于视觉案例的推理系统,提出一种使用临床协变量数据的基于置信度的分类程序 [115] 新兴领域中的CBR 提出了一种可扩展的跨域情感的CBR分类方法 [116] 新兴领域中的CBR 从在线产品评论情感分析中用CBR挖掘潜在客户需求,提出一种通过CBR获取潜在客户需求的两层模型 [117-118] 新兴领域中的CBR 提出将基于规则的推理RBR方法与CBR结合对情感分析进行研究 续表 3 主要文献 研究主题 主要研究和贡献 [119] 新兴领域中的CBR 将CBR与TRIZ结合,提出一种以知识为中心的创新服务设计(KISD)模型等 [120] CBR与深度学习 提出将CBR研究引入深度学习的观点 [121] CBR与深度学习 提出一种使用深度卷积神经网络(DCNN)作为案例表示生成器的基于图像的网页分类CBR系统 [122] CBR与深度学习 提出一种结合CBR和DCNN的方法来检测图像中的新对象类型的系统 [123] CBR与深度学习 将DL和大数据与CBR相结合,提出一种能为航空票务技术工程师自动生成适宜方案的CBR应用程序 [124] CBR与深度学习 将MAC/FAC方法[36]应用于面向过程的CBR,提出一种利用图神经网络GNNs的相似性度量方法 [125] CBR与可解释XAI 提出基于类比推理的DL算法产生的预测解释可以有意义地补充基于相似性解释的思想 [126] CBR与可解释XAI 提出CBR可以提供一种在交互式解释中重用经验的、基于记忆的技术来生成对不同AI技术的解释的思想 [127] CBR与可解释XAI 研究了CBR如何解释人工神经网络ANN,提出一种基于案例解释的XAI问题的理论分析方法等 [128] CBR与可解释XAI 提出一个采用CBR方法的基于网络的DNN可解释性框架的设计和实现 [129] CBR与可解释XAI 为解决图像分类解释的LIME算法的配置问题,提出了一种基于CBR的解决方案 [130] CBR与可解释XAI 将DL的优点与CBR的可解释性相结合构建一个可解释的DNN [131] CBR与可解释XAI 研究基于文本案例的XAI,提出一种如何将CBR用于XAI的方法 [132] CBR与可解释XAI 研究当黑盒系统和CBR系统具有相同的训练数据时,CBR系统是否可以用来预测黑盒系统输出的置信度 [133] CBR与可解释XAI 运用反事实潜力和案例库解释范围的思想,提出一种基于案例的方法来生成反事实 [134] CBR与可解释XAI 使用反事实处理气候变化,在数据增强中使用反事实对未来不确定气候中的作物生长进行预测 [62-74] 类比推理应用 自然语言处理中的应用 [75-83] 类比推理应用 测试和预测中的应用 [84-93] 类比推理应用 视觉信息处理中的应用 [94-100] 类比推理应用 软件工程中的应用 [101-105] 类比推理应用 数学中的应用 -
[1] POLYA G. How to solve it: A new aspect of mathematical method[M]. Princeton: Princeton University Press, 2004. [2] HOFSTADTER D R, SANDER E. Surfaces and essences: analogy as the fuel and fire of thinking[M]. New York: Basic Books, 2013. [3] KEDAR-CABELLI S T. Analogy-from a unified perspective. analogical reasoning[M]. Netherlands: Kluwer Academic Publishers. 1988: 65−103. [4] GENTNER D, FORBUS K D. Computational models of analogy[J]. WIREs cognitive science, 2011, 2(3): 266–276. doi: 10.1002/wcs.105 [5] HALL R P. Computational approaches to analogical reasoning: a comparative analysis[J]. Artificial intelligence, 1989, 39(1): 39–120. doi: 10.1016/0004-3702(89)90003-9 [6] STERNBERG R J. Component processes in analogical reasoning[J]. Psychological review, 1977, 84(4): 353–378. doi: 10.1037/0033-295X.84.4.353 [7] HOLYOAK K J, MORRISON R G. The Cambridge handbook of thinking and reasoning[M]. New York: Cambridge University Press, 2005. [8] GENTNER D, MARAVILLA F. International handbook of thinking & reasoning[M]. New York: Psychology Press, 2018: 186−203. [9] EVANS T G. A heuristic program to solve geometric-analogy problems[C]//Proceedings of Spring Joint Computer Conference. New York: ACM, 1964: 327−338. [10] EVANS T G. A program for the solution of a class of geometric analogy intelligence test questions[M]. Semantic Information Processing. Cambridge: MIT Press, 1968: 271−353. [11] KLING R E. Reasoning by analogy with applications to heuristic problem solving: a case study[R]. Tech. Rept. (CS-216). Palo Alto: Stanford University, 1971. [12] KLING R E. A paradigm for reasoning by analogy[J]. Artificial intelligence, 1971, 2(2): 147–178. doi: 10.1016/0004-3702(71)90008-7 [13] CARBONELL J G. A computational model of analogical problem solving[C]//The 7th International Joint Conference on Artificial Intelligence. Vancouver: International Joint Conferences on Artificial Intelligence Organization, 1981: 147−152 [14] CARBONELL J G. Experiential learning in analogical problem solving[C]//Proceedings of the Second AAAI Conference on Artificial Intelligence. New York: ACM, 1982: 168−171. [15] CARBONELL J G. Learning by analogy: formulating and generalizing plans from past experience[M]. Machine Learning. Amsterdam: Elsevier, 1983: 137−161. [16] CARBONELL J G. Derivational analogy and its role in problem solving[C]//The Third National Conference on Artificial Intelligence. Washington: AAAI Press, 1983: 64−69. [17] CARBONELL J G. Derivational analogy: a theory of reconstructive problem solving and expertise acquisition[J]. Machine learning, 1986, 2: 371–392. [18] WINSTON P H. Learning and reasoning by analogy[J]. Communications of the ACM, 1980, 23(12): 689–702. doi: 10.1145/359038.359042 [19] WINSTON P H. Learning new principles from precedents and exercises[J]. Artificial intelligence, 1982, 19(3): 321–350. doi: 10.1016/0004-3702(82)90004-2 [20] WINSTON P H. Learning by augmenting rules and accumulating censors[J]. Machine learning: an artificial intelligence approach, 1986, 2: 45–61. [21] WINSTON P H, BINFORD T O, KATZ B, et al. Learning physical descriptions from functional definitions, examples, and precedents[C]//Proceedings of the Third AAAI Conference on Artificial Intelligence. New York: ACM, 1983: 433−439. [22] BURSTEIN M H. A model of learning in analogical problem solving[C]//The Third National Conference on Artificial Intelligence. Washington: AAAI Prese, 1983: 45−48. [23] BURSTEIN M H. Concept formation by incremental analogical reasoning and debugging[J]. Machine learning:an artificial intelligence approach, 1986, 2: 351–369. [24] BURSTEIN M H. Analogical learning with multiple models[J]. Machine learning, 1986, 2: 25–28. [25] GREINER R. Learning by understanding analogies[J]. Artificial intelligence, 1988, 35(1): 81–125. doi: 10.1016/0004-3702(88)90032-X [26] GENTNER D. The structure of analogical models in science[R]. Tech. Rept. (No. 4451). Cambridge: [s.n.], 1980: 1. [27] GENTNER D. Structure-mapping: a theoretical framework for analogy[J]. Cognitive science, 1983, 7(2): 155–170. doi: 10.1207/s15516709cog0702_3 [28] MARKMAN A B, GENTNER D. Structure mapping in the comparison process[J]. The American journal of psychology, 2000, 113(4): 501. doi: 10.2307/1423470 [29] FALKENHAINER B, FORBUS K D, GENTNER D. The structure-mapping engine: algorithm and examples[J]. Artificial intelligence, 1989, 41(1): 1–63. doi: 10.1016/0004-3702(89)90077-5 [30] FORBUS K D, GENTNER D, LAW K. MAC/FAC: a model of similarity-based retrieval[J]. Cognitive science, 1995, 19(2): 141–205. doi: 10.1207/s15516709cog1902_1 [31] GICK M L, HOLYOAK K J. Schema induction and analogical transfer[J]. Cognitive psychology, 1983, 15(1): 1–38. doi: 10.1016/0010-0285(83)90002-6 [32] KEITH J, HOLYOAK. The pragmatics of analogical transfer[J]. Psychology of learning and motivation, 1985, 19: 59–87. [33] HOLYOAK K J, KOH K. Surface and structural similarity in analogical transfer[J]. Memory & cognition, 1987, 15(4): 332–340. [34] KEITH J, HOLYOAK. Analogical mapping by constraint satisfaction[J]. Cognitive science, 1989, 13(3): 295–355. doi: 10.1207/s15516709cog1303_1 [35] HOLYOAK K J, THAGARD P R. A computational model of analogical problem solving[M]. Similarity and Analogical Reasoning. Cambridge: Cambridge University Press, 1989: 242−266. [36] THAGARD P, HOLYOAK K J, NELSON G, et al. Analog retrieval by constraint satisfaction[J]. Artificial intelligence, 1990, 46(3): 259–310. doi: 10.1016/0004-3702(90)90018-U [37] HELMAR, GUST. Metaphors and heuristic-driven theory projection (HDTP)[J]. Theoretical computer science, 2006, 354(1): 98–117. doi: 10.1016/j.tcs.2005.11.009 [38] SCHWERING A, KRUMNACK U, KÜHNBERGER K U, et al. Syntactic principles of heuristic-driven theory projection[J]. Cognitive systems research, 2009, 10(3): 251–269. doi: 10.1016/j.cogsys.2008.09.002 [39] SCHMIDT M, KRUMNACK U, GUST H, et al. Heuristic-driven theory projection: an overview[M]. Berlin: Springer Berlin Heidelberg, 2014: 163−194. [40] MICLET L, PRADE H. Logical definition of analogical proportion and its fuzzy extensions[C]//2008 Annual Meeting of the North American Fuzzy Information Processing Society. Piscataway: IEEE, 2008: 1−6. [41] MICLET L, PRADE H. Handling analogical proportions in classical logic and fuzzy logics settings[M].Berlin: Springer Berlin Heidelberg, 2009: 638−650. [42] PRADE H, RICHARD G. Analogy, paralogy and reverse analogy: postulates and inferences[C]//Lecture Notes in Artificial Intelligence. Berlin: Springer, 2009: 306−314. [43] PRADE H, RICHARD G. Analogical proportions: another logical view[C]//Research and Development in Intelligent Systems XXVI. London: Springer, 2009: 121−134. [44] PRADE H, RICHARD G. Logical proportions - typology and roadmap[M]. Berlin: Springer Berlin Heidelberg, 2010: 757−767. [45] PRADE H, RICHARD G. Multiple-valued logic interpretations of analogical, reverse analogical, and paralogical proportions[C]//2010 40th IEEE International Symposium on Multiple-Valued Logic. Piscataway: IEEE, 2010: 258−263. [46] PRADE H, RICHARD G. Nonmonotonic features and uncertainty in reasoning with analogical proportions[C]//The 13th International Workshop on Non-Monotonic Reasoning. Toronto: IEEE, 2010: 14−16. [47] PRADE H, RICHARD G. Reasoning with logical proportions[C]//The 12th International Conference on Principles of Knowledge Representation and Reasoning. Toronto: AAAI press, 2010: 545−555. [48] MICLET L, PRADE H, GUENNEC D. Looking for analogical proportions in a formal concept analysis setting[C]//The 8th International Conference on Concept Lattices and their Applications. Nancy: IEEE, 2011: 295−307. [49] PRADE H, RICHARD G. Analogy-making for solving IQ tests: a logical view[M]. Berlin: Springer Berlin Heidelberg, 2011: 241−257. [50] PRADE H, SCHOCKAERT S. Completing rule bases in symbolic domains by analogy making[C]//Proceedings of the 7th conference of the European Society for Fuzzy Logic and Technology. Paris: Atlantis Press, 2011: 928−934. [51] PRADE H, RICHARD G. Analogical proportions and multiple-valued logics[M]. Berlin: Springer Berlin Heidelberg, 2013: 497−509. [52] PRADE H, RICHARD G. Homogeneous logical proportions: their uniqueness and their role in similarity-based prediction[C]//The 13th International Conference on Principles of Knowledge Representation and Reasoning. Rome: AAAI press, 2012. 402−412. [53] PRADE H, RICHARD G, YAO Bing. Enforcing regularity by means of analogy-related proportions-a new approach to classification[J]. International journal of computer information systems and industrial management applications, 2012, 4: 648–658. [54] PRADE H, RICHARD G. Picking the one that does not fit-A matter of logical proportions[C]//Proceedings of the 8th Conference of the European Society for Fuzzy Logic and Technology. Paris: Atlantis Press, 2013: 392−399. [55] SCHOCKAERT S, PRADE H. Completing symbolic rule bases using betweenness and analogical proportion[C]//Studies in Computational Intelligence. Berlin: Springer, 2014: 195−215. [56] PRADE H, RICHARD G. From analogical proportion to logical proportions: a survey[M]. Computational Approaches to Analogical Reasoning: Current Trends. Berlin, Heidelberg: Springer Berlin Heidelberg, 2014: 217−244. [57] PRADE H, RICHARD G. Analogical proportions and analogical reasoning - an introduction[M]. Case-Based Reasoning Research and Development. Cham: Springer International Publishing, 2017: 16−32. [58] PRADE H. Analogical proportions: from equality to inequality[J]. International journal of approximate reasoning, 2018, 101: 234–254. doi: 10.1016/j.ijar.2018.07.005 [59] LIM S, PRADE H, RICHARD G. Solving word analogies: a machine learning perspective[M]. Cham: Springer International Publishing, 2019: 238−250. [60] BARBOT N, MICLET L, PRADE H. Analogy between concepts[J]. Artificial intelligence, 2019, 275(C): 487–539. [61] AFANTENOS S, KUNZE T, LIM S, et al. Analogies between sentences: theoretical aspects-preliminary experiments[M]. Cham: Springer International Publishing, 2021: 3−18. [62] CHIU A, POUPART P, DIMARCO C. Generating lexical analogies using dependency relations[J]. Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. Prague: Association for Computational Linguistics, 2007: 561−570. [63] TURNEY P D. A uniform approach to analogies, synonyms, antonyms, and associations[C]//Proceedings of the 22nd International Conference on Computational Linguistics - Volume 1. New York: ACM, 2008: 905−912. [64] TURNEY P D, LITTMAN M L. Corpus-based learning of analogies and semantic relations[J]. Machine learning, 2005, 60(1): 251–278. [65] SPEER R, HAVASI C, LIEBERMAN H. Analogy space: reducing the dimensionality of common sense knowledge[C]//The 23rd National Conference on Artificial Intelligence. Chicago: AAAI Press, 2008: 548−553. [66] VEALE T. An analogy-oriented type hierarchy for linguistic creativity[J]. Knowledge-based systems, 2006, 19(7): 471–479. doi: 10.1016/j.knosys.2006.04.007 [67] VEALE T. Re-representation and creative analogy: a lexico-semantic perspective[J]. New generation computing, 2006, 24(3): 223–240. doi: 10.1007/BF03037333 [68] LANGLAIS P, PATRY A. Translating unknown words by analogical learning[C]//Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. Prague: Association for Computational Linguistics, 2007: 877−886. [69] BENAMARA F, TABOADA M, MATHIEU Y. Evaluative language beyond bags of words: linguistic insights and computational applications[J]. Computational linguistics, 2017, 43(1): 201–264. doi: 10.1162/COLI_a_00278 [70] LEPAGE Y, DENOUAL E. Purest ever example-based machine translation: detailed presentation and assessment[J]. Machine translation, 2005, 19(3): 251–282. [71] TURNEY P D. Similarity of semantic relations[J]. Computational linguistics, 2006, 32(3): 379–416. doi: 10.1162/coli.2006.32.3.379 [72] LIBERMAN H, KUMAR A. Providing expert advice by analogy for on-line help[C]//The 2005 IEEE/WIC/ACM International Conference on Web Intelligence. Piscataway: IEEE, 2005: 26−32. [73] WANG S L, HONG T P, LIN Wenyang. Answering null queries by analogical reasoning on similarity-based fuzzy relational databases[J]. Journal of advanced computational intelligence and intelligent informatics, 2001, 5(3): 163–171. doi: 10.20965/jaciii.2001.p0163 [74] SIMOFF S, SIERRA C, LÓPEZ DE MÀNTARAS R. Mediation = information revelation + analogical reasoning[M]. Berlin: Springer Berlin Heidelberg, 2009: 145−160. [75] STEIN S, LECHTHALER M, KRASSNITZER S, et al. Gear hobbing: a contribution to analogy testing and its wear mechanisms[J]. Procedia cirp, 2012, 1: 220–225. doi: 10.1016/j.procir.2012.04.039 [76] RAVEN J. The raven’s progressive matrices: change and stability over culture and time[J]. Cognitive psychology, 2000, 41(1): 1–48. doi: 10.1006/cogp.1999.0735 [77] RAGIN M, NEUBERT S. Solving Raven’s IQ-tests: an AI and cognitive modeling approach[C]//The 20th European Conference on Artificial Intelligence. Montpellier: IOS Press, 2012: 666−671. [78] LOVETT A, FORBUS K D, USHER J. A structure- mapping model of Raven’s progressive matrices[C]//The 32nd Annual Conference of the Cognitive Science Society. Portland: Cognitive Science Society, 2010: 2761−2766. [79] KLENK M, FORBUS K, TOMAI E, et al. Using analogical model formulation with sketches to solve bennett mechanical comprehension test problems[J]. Journal of experimental & theoretical artificial intelligence, 2011, 23(3): 299–327. [80] BRECHER C, LÖPENHAUS C, GRESCHERT R. Influence of the metalworking fluid on the running behavior of gear analogy test parts[J]. Production engineering, 2015, 9(3): 425–431. doi: 10.1007/s11740-015-0612-0 [81] GALLASSI R, SAMBATI L, MASERATI M S, et al. Simple verbal analogies test: normative data on a short task exploring abstract thinking[J]. Aging clinical and experimental research, 2014, 26(1): 67–71. doi: 10.1007/s40520-013-0180-0 [82] CURRIE A. Ethnographic analogy, the comparative method, and archaeological special pleading[J]. Studies in history and philosophy of science part A, 2016, 55: 84–94. doi: 10.1016/j.shpsa.2015.08.010 [83] JUDITH, CHARLIN. Testing an ethnographic analogy through geometric morphometrics: a comparison between ethnographic arrows and archaeological projectile points from Late Holocene Fuego-Patagonia[J]. Journal of anthropological archaeology, 2018, 51: 159–172. doi: 10.1016/j.jaa.2018.06.008 [84] CROFT D, THAGARD P. Dynamic imagery: a computational model of motion and visual analogy[M]. Model-Based Reasoning. New York: Springer, 2002: 259−274. [85] KUNDA M, MCGREGGOR K. A computational model for solving problems from the Raven’s Progressive Matrices intelligence test using iconic visual representations[J]. Cognitive systems research, 2013, 22/23: 47–66. doi: 10.1016/j.cogsys.2012.08.001 [86] DAVIES J, NERSESSIAN N J, GOEL A K. Visual models in analogical problem solving[J]. Foundations of science, 2005, 10(1): 133–152. doi: 10.1007/s10699-005-3009-2 [87] CASAKIN H P, GOLDSCHMIDT G. Reasoning by visual analogy in design problem-solving: the role of guidance[J]. Environment and planning B:planning and design, 2000, 27(1): 105–119. doi: 10.1068/b2565 [88] HERTZMANN A, JACOBS C E, OLIVER N, et al. Image analogies[C]//Proceedings of the 28th Annual Conference on Computer Graphics and Interactive Techniques. New York: ACM, 2001: 327−340. [89] YANER P W, GOEL A K. Visual analogy: viewing analogical retrieval and mapping as constraint satisfaction problems[J]. Applied intelligence, 2006, 25(1): 91–105. doi: 10.1007/s10489-006-8868-x [90] DAVIES J, GOEL A K, NERSESSIAN N J. A cognitive model of visual analogical problem-solving transfer[C]//The Nineteenth International Joint Conference on Artificial Intelligence. Edinburgh: International Joint Conferences on Artificial Intelligence Organization, 2005: 1556−1557. [91] O’DONOGHUE D P, BOHAN A, KEANE M T. Seeing things: inventive reasoning with geometric analogies and topographic maps[J]. New generation computing, 2006, 24(3): 267–288. doi: 10.1007/BF03037335 [92] PEDONE R, HUMMEL J E, HOLYOAK K J. The use of diagrams in analogical problem solving[J]. Memory & cognition, 2001, 29(2): 214–221. [93] SCHWERING A, KÜHNBERGER K U, KRUMNACK U, et al. Spatial cognition of geometric figures in the context of proportional analogies[M]. Berlin: Springer Berlin Heidelberg, 2009: 18−35. [94] AZZEH M, NEAGU D, COWLING P. Improving analogy software effort estimation using fuzzy feature subset selection algorithm[C]//Proceedings of the 4th international workshop on Predictor models in software engineering. New York: ACM, 2008: 71−78. [95] LI Jingzhou, RUHE G. A comparative study of attribute weighting heuristics for effort estimation by analogy[C]//Proceedings of the 2006 ACM/IEEE International Symposium on Empirical Software Engineering. New York: ACM, 2006: 66−74. [96] PARITOSH P K, KLENK M E. Cognitive processes in quantitative estimation: analogical anchors and causal adjustment[C]//the 28th Annual Conference of the Cognitive Science Society. Hillsdale: Lawrence Erlbaum Associates, 2006: 1926–1931. [97] SWAN J, KRAWIEC K. Discovering relational structure in program synthesis problems with analogical reasoning[M]. Genetic and Evolutionary Computation. Cham: Springer International Publishing, 2018: 149−164. [98] SCHOCKAERT S, PRADE H. Interpolation and extrapolation in conceptual spaces: a case study in the music domain[M]. Berlin: Springer Berlin Heidelberg, 2011: 217−231. [99] SCHOCKAERT S, PRADE H. Interpolative and extrapolative reasoning in propositional theories using qualitative knowledge about conceptual spaces[J]. Artificial intelligence, 2013, 202: 86–131. doi: 10.1016/j.artint.2013.07.001 [100] SOTOUDEH M, THAKUR A V. Analogy-making as a core primitive in the software engineering toolbox[C]//Proceedings of the 2020 ACM SIGPLAN International Symposium on New Ideas, New Paradigms, and Reflections on Programming and Software. New York: ACM, 2020: 101−121. [101] PEASE A, GUHE M, SMAILL A. Analogy formulation and modification in geometry[C]//The Second International Conference on Analogy. Sofia: NBU Press, 2009: 358−364. [102] PEASE A, GUHE M, SMAILL A. Using analogies to find and evaluate mathematical conjectures[C]//The 1st International Conference on Computational Creativity. Lisbon, IEEE, 2010: 60−64. [103] WHITTLE J, BUNDY A, BOULTON R. Proofs-as-programs as a framework for the design of an analogy-based ML editor[J]. Formal aspects of computing, 2002, 13(3/4/5): 403–421. [104] VAMVAKOUSSI X. The use of analogies in mathematics instruction: affordances and challenges[M]//Cognitive Foundations for Improving Mathematical Learning. Amsterdam: Elsevier, 2019: 247−268. [105] DANNY A J. GóMEZ R. Artificial mathematical intelligence: cognitive, (Meta)mathematical, Physical and Philosophical Foundations[M]. Cham: Springer International Publishing, 2020. [106] AAMODT A, PLAZA E. Case-based reasoning: foundational issues, methodological variations, and system approaches[J]. AI communications, 1994, 7(1): 39–59. doi: 10.3233/AIC-1994-7104 [107] HÜLLERMEIER E. Case-based approximate reasoning[M]. Dordrecht: Springer, 2007. [108] CRAW S, WIRATUNGA N, ROWE R. Learning adaptation knowledge to improve case-based reasoning[J]. Artificial intelligence, 2006, 170(16/17): 1175–1192. [109] D'AQUIN M, BADRA F, LAFROGNE S, et al. Case base mining for adaptation knowledge acquisition[C]//Proceedings of the 20th International Joint Conference on Artifical Intelligence. New York: ACM, 2007: 750−755. [110] LIEBER J, NAUER E. Adaptation knowledge discovery using positive and negative cases[M]. Cham: Springer International Publishing, 2021: 140−155. [111] D'AQUIN M, LIEBER J, NAPOLI A. Adaptation knowledge acquisition: a case study for case-based decision support in oncology[J]. Computational intelligence, 2006, 22(3/4): 161–176. [112] GU Dongxiao. A case-based reasoning system based on weighted heterogeneous value distance metric for breast cancer diagnosis[J]. Artificial intelligence in medicine, 2017, 77: 31–47. doi: 10.1016/j.artmed.2017.02.003 [113] LAMY J B, SEKAR B, GUEZENNEC G, et al. Explainable artificial intelligence for breast cancer: a visual case-based reasoning approach[J]. Artificial intelligence in medicine, 2019, 94: 42–53. doi: 10.1016/j.artmed.2019.01.001 [114] BARTLETT C L, LIU Guanghui, BICHINDARITZ I. Classifying breast cancer tissue through DNA methylation and clinical covariate based retrieval[M]. Cham: Springer International Publishing, 2020: 82−96. [115] OHANA B, DELANY S J, TIERNEY B. A case-based approach to cross domain sentiment classification[M]. Berlin: Springer Berlin Heidelberg, 2012: 284−296. [116] ZHOU Feng, JIAO Jianxin, LINSEY J S. Latent customer needs elicitation by use case analogical reasoning from sentiment analysis of online product reviews[J]. Journal of mechanical design, 2015, 137(7): 071401. doi: 10.1115/1.4030159 [117] BERKA P. NEST: a compositional approach to rule-based and case-based reasoning[J]. Advances in artificial intelligence, 2011, 2011: 1–15. [118] BERKA P. Sentiment analysis using rule-based and case-based reasoning[J]. Journal of intelligent information systems, 2020, 55(1): 51–66. doi: 10.1007/s10844-019-00591-8 [119] LEE C H, CHEN C H, LI F, et al. Customized and knowledge-centric service design model integrating case-based reasoning and TRIZ[J]. Expert systems with applications, 2020, 143: 113062. doi: 10.1016/j.eswa.2019.113062 [120] LEAKE D, CRANDALL D. On bringing case-based reasoning methodology to deep learning[M]. Cham: Springer International Publishing, 2020: 343−348. [121] LÓPEZ-SÁNCHEZ D, CORCHADO J M. A CBR system for image-based webpage classification: case representation with convolutional neural networks[C]// The Thirtieth International Florida Artificial Intelligence Research Society Conference. Marco Island: AAAI Press, 2017: 483−488. [122] TURNER J T, FLOYD M W, GUPTA K M, et al. Novel object discovery using case-based reasoning and convolutional neural networks[M]. Cham: Springer International Publishing, 2018: 399−414. [123] AMIN K, KAPETANAKIS S, ALTHOFF K D, et al. Answering with cases: a CBR approach to deep learning[M]. Cham: Springer International Publishing, 2018: 15−27. [124] HOFFMANN M, MALBURG L, KLEIN P, et al. Using Siamese graph neural networks for similarity-based retrieval in process-oriented case-based reasoning[M]. Cham: Springer International Publishing, 2020: 229−244. [125] HÜLLERMEIER E. Towards analogy-based explanations in machine learning[M]. Cham: Springer International Publishing, 2020: 205−217. [126] AGUDO B D. Mapping the challenges and opportunities of CBR for eXplainable AI[C]//Lecture Notes in Artificial Intelligence. Cham: Springe, 2019: I−II [127] KEANE M T, KENNY E M. How case-based reasoning explains neural networks: a theoretical analysis of XAI using Post-Hoc explanation-by-example from a survey of ANN-CBR twin-systems[C]//Case-Based Reasoning Research and Development: 27th International Conference. New York: ACM, 2019: 155−171. [128] NADEEM R, WU Huijun, PAIK H Y, et al. A case based deep neural network interpretability framework and its user study[M]. Cham: Springer International Publishing, 2019: 147−161. [129] RECIO-GARCÍA J A, DÍAZ-AGUDO B, PINO-CASTILLA V. CBR-LIME: a case-based reasoning approach to provide specific local interpretable model-agnostic explanations[M]. Cham: Springer International Publishing, 2020: 179−194. [130] LI O, LIU Hao, CHEN Chaofan, et al. Deep learning for case-based reasoning through prototypes: a neural network that explains its predictions[C]//the Thirty-Second AAAI Conference on Artificial Intelligence. New Orleans: AAAI Press, 2018: 3530–3537. [131] WEBER R O, JOHS A J, LI Jianfei, et al. Investigating textual case-based XAI[M]. Case-Based Reasoning Research and Development. Cham: Springer International Publishing, 2018: 431−447. [132] LAWRENCE G, CALEB K, DAVID L. CBR confidence as a basis for confidence in black box systems[M].Cham: Springe, 2019: 95−109. [133] KEANE M T, SMYTH B. Good counterfactuals and where to find them: a case-based technique for generating counterfactuals for explainable AI (XAI)[EB/OL]. (2020-05-26)[2022-09-01]. https://arxiv.org/abs/2005.13997. [134] TEMRAZ M, KENNY E M, RUELLE E, et al. Handling climate change using counterfactuals: using counterfactuals in data augmentation to predict crop growth in an uncertain climate future[M]. Cham: Springer International Publishing, 2021: 216−231. [135] CHEN X J, JIA S B, YANG X. A review: knowledge reasoning over knowledge graph[J]. Expert systems with applications, 2020, 141: 112948. doi: 10.1016/j.eswa.2019.112948 [136] 官赛萍, 靳小龙, 贾岩涛, 等. 面向知识图谱的知识推理研究进展[J]. 软件学报, 2018, 29(10): 2966–2994. doi: 10.13328/j.cnki.jos.005551 [137] 李波, 赵沁平. 基于突出特征的类比联想[J]. 计算机学报, 1994, 17(9): 690–696. LI Bo, ZHAO Qinpin. Salient feature-based analogical reminding[J]. Chinese journal of computers, 1994, 17(9): 690–696. [138] 李波, 赵沁平. 基于相关性的类比求精[J]. 计算机学报, 1995, 18(3): 231–235. LI Bo, ZHAO Qinping. Relevance-directed analogical elaboration[J]. Chinese journal of computers, 1995, 18(3): 231–235. [139] 李波. 类比推理系统[J]. 计算机学报, 1995, 18(3): 231–235. LI Bo. BHARS: an analogical reasoning system[J]. Chinese journal of computers, 1995, 18(3): 231–235. [140] 赵沁平, 李波. 类比推理研究中的几个问题[J]. 模式识别与人工智能, 1995, 8(S1): 48–58. ZHAO Qinping, LI Bo. Discussion about several problems of analogical reasoning[J]. Pattern recognition and artificial intelligence, 1995, 8(S1): 48–58. [141] 李波, 罗玉龙, 赵沁平. 一种类比匹配原理及其实现[J]. 软件学报, 1996, 6(1): 8–16. LI Bo, LUO Yulong, ZHAO Qinping. An theory of analogical match and its implementation[J]. Journal of software, 1996, 6(1): 8–16. [142] 赵沁平, 李波. 类比推理的计算模型[J]. 软件学报, 1996, 7(3): 156–162. ZHAO Qinping, LI Bo. A computational model of analogical reasoning[J]. Journal of software, 1996, 7(3): 156–162.