﻿ 基于基元和知网的问题相关度计算
Calculation of correlation problem based on basic element and HowNet
CAO Liyuan , LI Weihua
College of Computer, Guangdong University of Technology, Guangzhou 510006, China
Abstract: Based on the basic-element and composite elements of extenics and HowNet research, the words similarity computing method in HowNet is used to improve the calculation method for the relationship of words. The basic-element correlation calculation method is built to establish a method for basic-element target correlation and basic-element conditions correlation. This is used to derive the method to calculate correlation of problem. There is improvement with the correlation algorithm, but the traditional method calculates the correlation of words only by hyponymy. In this paper, an additional fifteen relationships described in HowNet is taken into account. The concept of negative correlation is put forward and the range of correlation is in set[-1,1], which corresponds to the range of the correlation function. Through the corresponding relationship between the features in the basic element, the correlation between basic elements is calculated and the correlation of problems can be calculated. Based on the test of thousands of contradictory problems in the database, the results showed that this method can effectively increase the amount of strategy generating approaches and the probability of contradictory problems to be solved is greatly promoted.
Key words: extenics     HowNet     correlation     basicelement     dependent function

1 传统的可拓策略生成系统分析问题的不足

2 词语相关度计算模型 2.1 词语相关概念

1)rele(B1,B2)∈[-1, 1]。相关度的计算值为[-1, 1]中的一个实数。

2) 相关关系具有自反性，rele(B1B2) = rele(B2B1)。

3)rele(B1,B2)=1,当且仅当B1= B2，即如果2个词汇是词语等价，则相关度为1。

4)rele(B1,B2)=-1,当且仅当即存在对义或反义关系，相关度为-1。

5)rele(B1,B2)=0。如果2个基元没有任何共同特征，那么其相关度为0。

2.2 词语相关度计算

2.2.1 相似度部分Sim(W1,W2)

2个词语相似度计算，直接采用文献[5]中方法计算。

2.2.2 基本相关度部分Rele_prim(W1,W2)

S1S2的知网形式化表示为

 直接关系 关系符 间接关系挖掘规则 部分-整体 % 以下位义原为主要特征的概念与原概念也构成部分与整体关系。 相关关系 # 1)以相关义原为主要特性或第二特性的概念与原概念相关； 2)具体相同相关元素的概念是相关的。 材料-成品关系 ？ 成品的解释义原与材料概念相关。 施事/经验者/关系主体-事件或工作-时间关系 * 1)以相同事件义原为施事，经验者的概念相互关联；2)以事件为角色的概念与原概念相关；3)与事件构成时间/地点－事件关系的概念与原概念；4)以事件义原为主要特征的概念与原概念。 时间地点－事件关系 @ 1)与事件存在施事、受事关系的概念与原概念相关；2)以事件为角色的概念与原概念相关；3)以事件义原为主要特征的概念与原概念相关。 受事/内容/领属物－事件 1)与事件存在施事、受事关系的概念与原概念相关；2)以事件为角色的概念与原概念相关；3)以事件构成时间/地点－事件关系的概念与原概念相关；4)以事件义原为主要特征的概念与原概念相关。 宿主－属性 & 1)以宿主为主要特征的概念与原概念之间同样存在宿主－属性关系；2)以该属性所对应属性值概念与原概念具有属性－值关系。

wiS1S2对应的关系的权值，wjS2S1对应的关系的权值，都是可调节的参数。

“国庆”和“烟花炮竹”通过事件“祝贺”相关，计算如下：

2.2.3 词语相关度Rele(W1,W2)计算

β1β2是相似度Sim(S1,S2)和基本相关度Rele_prim(S1,S2)在总体相关度所占的比例。

3 基元及问题相关度计算 3.1 基元概念以及基元与基元的对应关系 3.1.1 基元的概念

3.1.2 基元与基元之间的对应关系

1)首先计算2个基元的所有特征两两之间的相关度；

2)从所有的相关度值中选择最大的一个，将这个相关度值对应的2个特征对应起来；

3)从所有的相关度值中删去那些已经建立对应关系的特征的相关度值；

4)重复上述2)和3)，直到所有的相关度值都被删除；

5)没有建立起对应关系的特征与空特征对应。

3.2 基元相关度计算

Ri是一个比例系数，等于1/k

3.3 问题相关度计算

4 案例分析

P1  曹冲称象；

P2  用直尺测量一张纸的厚度；

P3  把一根长为2m、宽为1.2m、高为0.5m的桌子抬进高为2m、宽为1m的门；

P4  把一根长为3m、半径为0.2m的竹杆抬进高为2.5m、宽为2m的城门；

5 实验及结果

 方法数量 无问题相关度方法 基于问题相关度计算 解决的问题数量 1390 1539 未解决的问题数量 392 241

6 结束语

