﻿ 基于基元和知网的问题相关度计算
 文章快速检索 高级检索

Calculation of correlation problem based on basic element and HowNet
CAO Liyuan , LI Weihua
College of Computer, Guangdong University of Technology, Guangzhou 510006, China
Abstract: Based on the basic-element and composite elements of extenics and HowNet research, the words similarity computing method in HowNet is used to improve the calculation method for the relationship of words. The basic-element correlation calculation method is built to establish a method for basic-element target correlation and basic-element conditions correlation. This is used to derive the method to calculate correlation of problem. There is improvement with the correlation algorithm, but the traditional method calculates the correlation of words only by hyponymy. In this paper, an additional fifteen relationships described in HowNet is taken into account. The concept of negative correlation is put forward and the range of correlation is in set[-1,1], which corresponds to the range of the correlation function. Through the corresponding relationship between the features in the basic element, the correlation between basic elements is calculated and the correlation of problems can be calculated. Based on the test of thousands of contradictory problems in the database, the results showed that this method can effectively increase the amount of strategy generating approaches and the probability of contradictory problems to be solved is greatly promoted.
Key words: extenics     HowNet     correlation     basicelement     dependent function

1 传统的可拓策略生成系统分析问题的不足

2 词语相关度计算模型 2.1 词语相关概念

1)rele(B1,B2)∈[-1, 1]。相关度的计算值为[-1, 1]中的一个实数。

2) 相关关系具有自反性，rele(B1B2) = rele(B2B1)。

3)rele(B1,B2)=1,当且仅当B1= B2，即如果2个词汇是词语等价，则相关度为1。

4)rele(B1,B2)=-1,当且仅当即存在对义或反义关系，相关度为-1。

5)rele(B1,B2)=0。如果2个基元没有任何共同特征，那么其相关度为0。

2.2 词语相关度计算

2.2.1 相似度部分Sim(W1,W2)

2个词语相似度计算，直接采用文献[5]中方法计算。

2.2.2 基本相关度部分Rele_prim(W1,W2)

S1S2的知网形式化表示为

 直接关系 关系符 间接关系挖掘规则 部分-整体 % 以下位义原为主要特征的概念与原概念也构成部分与整体关系。 相关关系 # 1)以相关义原为主要特性或第二特性的概念与原概念相关； 2)具体相同相关元素的概念是相关的。 材料-成品关系 ？ 成品的解释义原与材料概念相关。 施事/经验者/关系主体-事件或工作-时间关系 * 1)以相同事件义原为施事，经验者的概念相互关联；2)以事件为角色的概念与原概念相关；3)与事件构成时间/地点－事件关系的概念与原概念；4)以事件义原为主要特征的概念与原概念。 时间地点－事件关系 @ 1)与事件存在施事、受事关系的概念与原概念相关；2)以事件为角色的概念与原概念相关；3)以事件义原为主要特征的概念与原概念相关。 受事/内容/领属物－事件 1)与事件存在施事、受事关系的概念与原概念相关；2)以事件为角色的概念与原概念相关；3)以事件构成时间/地点－事件关系的概念与原概念相关；4)以事件义原为主要特征的概念与原概念相关。 宿主－属性 & 1)以宿主为主要特征的概念与原概念之间同样存在宿主－属性关系；2)以该属性所对应属性值概念与原概念具有属性－值关系。

wiS1S2对应的关系的权值，wjS2S1对应的关系的权值，都是可调节的参数。

“国庆”和“烟花炮竹”通过事件“祝贺”相关，计算如下：

2.2.3 词语相关度Rele(W1,W2)计算

β1β2是相似度Sim(S1,S2)和基本相关度Rele_prim(S1,S2)在总体相关度所占的比例。

3 基元及问题相关度计算 3.1 基元概念以及基元与基元的对应关系 3.1.1 基元的概念

3.1.2 基元与基元之间的对应关系

1)首先计算2个基元的所有特征两两之间的相关度；

2)从所有的相关度值中选择最大的一个，将这个相关度值对应的2个特征对应起来；

3)从所有的相关度值中删去那些已经建立对应关系的特征的相关度值；

4)重复上述2)和3)，直到所有的相关度值都被删除；

5)没有建立起对应关系的特征与空特征对应。

3.2 基元相关度计算

Ri是一个比例系数，等于1/k

3.3 问题相关度计算

4 案例分析

P1  曹冲称象；

P2  用直尺测量一张纸的厚度；

P3  把一根长为2m、宽为1.2m、高为0.5m的桌子抬进高为2m、宽为1m的门；

P4  把一根长为3m、半径为0.2m的竹杆抬进高为2.5m、宽为2m的城门；

5 实验及结果

 方法数量 无问题相关度方法 基于问题相关度计算 解决的问题数量 1390 1539 未解决的问题数量 392 241

6 结束语

 [1] 杨春燕,蔡文. 可拓工程[M]. 北京:科学出版社, 2007: 1-344. [2] 董振东.HowNet[EB/OL] .[2013-05-12]. http://www.keenage.com. [3] 蔡文. 可拓集合和不相容问题[J]. 科学探索报,1983(1): 83-97CAI Wen. Extension set and non compatible problems [J]. Science Journal, 1983 (1): 83-97 [4] 李桥兴,刘思峰. 基于区间距和区间侧距的初等关联函数构造[J]. 哈尔滨工业大学学报, 2006, 38(7) :1097-1100.LI Qiaoxing, LIU Sifeng. Elementary dependent function is constructed based on the interval distance and lateral distance[J]. Journal of Harbin Institute of Technology, 2006, 38 (7): 1097-1100. [5] 刘群,李素建.基于《知网》的词汇语义相似度计算[J]. 计算语言学及中文信息处理, 2002(7): 59-76.LIU Qun, LI Sujian. based on HowNet semantic similarity calculation[J]. Computational Linguistics and Chinese Information Processing, 2002(7): 59-76. [6] 赵应秋, 罗军, 张君艳. 基于知网的词语语义相关度计算[J]. 信息技术, 2010 (3): 90-93.ZHAO Yingqiu, LUO Jun, ZHANG Junyan. The word semantic relevancy computation based on HowNet[J]. Information Technology, 2010 (3): 90-93. [7] 许云, 樊效忠, 张锋. 基于知网的语义相关度计算[J]. 北京理工大学学报, 2005, 25(5): 411-414.XU Yun, FAN Xiaozhong, ZHANG Feng. Semantic relevancy computing based on HowNet[J]. Journal of Beijing Institute of Technology, 2005, 25 (5): 411-414. [8] 江敏,肖诗斌,王弘蔚,等. 一种改进的基于《知网》的词语语义形似度计算[J]. 中文信息学报, 2008, 22( 5) : 84-89.JIANG Min, XIAO Shibin, WANG Hongwei, et al. An improved word similarity computing method based on HowNet[J]. Journal of Chinese Information Processing, 2008, 22 (5): 84-89. [9] 王红玲,吕强,徐瑞. 中文语义相关度计算模型研究[J]. 计算机工程与应用, 2009, 45(7): 22-26WANG Hongling, LV Qiang, XU Rui. Chinese semantic relativity calculation of model [J] Computer Engineering and Applications, 2009, 45 (7): 22-26. [10] 刘宗妹. 本体可拓模型的复合元实现及应用研究[D]. 广州: 广东工业大学, 2010: 1-48.LIU Zongmei. Meta ontology extension model research and application of the[D]. Guangzhou: Guangdong University of Technology, 2010: 1-48. [11] 李立希,杨春燕,李铧汶.可拓策略生成系统[M]. 北京: 科学出版社, 2006: 1-231. [12] 方卓君,李卫华,李承晓.自助游可拓策略生成系统的研究与实现[J]. 广东工业大学学报, 2009, 26(2): 83-89.FANG Zhuojun, LI Weihua, LI Chengxiao. The self-help travel extension and implementation[J]. Journal of Guangdong University of Technology, 2009, 26 (2): 83-89. [13] 李承晓,李卫华. 租房可拓策略生成系统[J]. 智能系统学报, 2011, 6(3): 272-278.LI Chengxiao, LI Weihua. The extension strategy generating system for rental of intelligent[J]. CAAI Transactions on Intelligent Systems, 2011, 6 (3): 272-278.
DOI: 10.3969/j.issn.1673-4785

0

#### 文章信息

CAO Liyuan, LI Weihua

Calculation of correlation problem based on basic element and HowNet

CAAI Transactions on Intelligent Systems, 2015, 10(02): 234-239.
DOI: 10.3969/j.issn.1673-4785