2. 西安交通大学 机械工程学院, 陕西 西安 710049
2. School of Mechanical Engineering, Xi'an Jiaotong University, Xi'an 710049, China
以特高压电气装备、智能电力装备等为代表的高端装备制造业是我国装备制造业的高端领域,是典型的知识密集、技术密集和多学科交叉集成的高科技产业。随着技术的进步,当前高端装备制造业正从以产品为中心的制造环节转向以知识为中心的产品创新设计环节,以知识为中心的产品创新设计正成为企业价值增值的核心因素。在高端装备制造企业历史知识库中,有大量成功的设计案例和设计经验可供设计人员参考。因而有效的设计知识重用服务能大幅度缩短产品设计周期、提高产品质量。尽管如此,高端装备企业由于缺乏合适的知识服务工具,导致企业知识库中的知识无法适时、准确地传递给需要的设计人员,从而制约了新产品的设计开发效率。
为克服上述问题,近几年来已在知识工程领域涌现出了一批知识服务通用解决方案。这些通用解决方案可分为知识检索和知识推送两大类。知识检索作为知识应用的一种最基本的方法,是实现知识推送及知识资源集成的基础,目前知识检索技术主要有语义网[1]、语境检索[2-3]、知识可视化[4]、本体检索[5-7]等。知识检索往往需要设计人员对当前所需要的知识有明确的认识才能获得较好的检索结果。而当设计人员只有模糊的知识需求,或者甚至不知道自己的知识需求时,则很难通过被动检索得到合适的知识。为解决这个问题,出现了以知识推送为核心的知识主动服务方法。在知识推送方面,Zhang等[8]建立了多层次和多粒度的知识模型,利用语义检索方法来实现设计过程中的知识服务。Christ等[9]通过建立产品结构特征信息模板,并以此为基础根据当前产品的设计特征进行知识主动服务。Wang等[10]建立了形式化的包含目标功能、约束条件和用户兴趣领域的设计意图模型,并根据机械概念设计阶段的各类相关知识的特点对其进行了规范化的组织管理,提出了一种基于机械设计意图建模的知识主动推送服务方法。Xu等[11]针对产品概念设计阶段提出了基于设计意图的协同设计知识主动推送服务模型。徐荣振等[12]利用频繁序列模式挖掘技术分析知识的历史使用数据,识别设计任务所对应的频繁知识序列;在产品设计过程中,结合设计师的知识使用行为、频繁知识序列的支持度和当前任务知识序列与频繁知识序列的相似度实现知识的推送。余绅达等[13]提出了一种根据用户兴趣特征进行筛选实现设计知识推送的方法,以弥补产品设计过程中知识检索方式的不足和因需求不明确导致知识推送的盲目性。
上述知识服务通用解决方案对高端装备设计知识服务具有一定的参考价值。但几乎所有的现有方案都是从信息检索的角度出发,利用信息检索的技术来实现知识检索,或针对较为通用的知识资源研究相应的知识推送方法,未充分考虑知识产生及应用的场景、设计人员的兴趣和高端装备产品知识资源自身的特点。为更好地服务于高端装备产品的设计阶段,本文提出将产品设计过程与知识产生及利用的情景信息集成到知识服务技术中,并根据设计人员不同的知识需求,提供灵活的多模式知识服务方法。
1 高端装备设计过程知识服务需求分析在高端装备产品设计过程中,因为设计人员自身知识掌握程度及从事设计任务上的差异,会形成不同的知识需求层次。基于对国内某典型高端装备企业的调研和已有的相关研究,本文将设计人员的知识需求分为如图 1所示的3个层次,其中各知识需求层次的详细解释如下。
Download:
|
|
1) 知识服务需求明确
该层次通常适用于设计人员在执行设计任务时,因对任务较为熟悉,非常明确完成该任务时需要用到的知识。处于该知识需求层次的设计人员可以通过关键词检索得到所需的知识资源。
2) 知识服务需求模糊
该层次通常指刚接触产品设计工作的设计人员或在完成某一具体设计任务之初,由于任务信息相对较少,而造成设计人员不清楚应该利用哪些知识来完成设计任务。处于该知识服务需求层次的设计人员需结合其执行的任务的情景进行知识推送。
3) 知识服务需求呈现兴趣偏好
该层次通常指高端装备设计人员在执行设计任务时,由于在一定时间通常从事着相对固定的设计任务,解决着相同或者相似的设计问题,在知识需求上有一定的个性倾向和主题聚集性。处于该知识服务需求层次的设计人员需通过获取设计人员的兴趣为其推送相关知识。
针对高端装备设计过程中不同的知识服务需求,本文研究建立了知识检索、基于设计任务知识需求情境推理和基于用户兴趣的知识主动推送3种不同知识服务方法,满足了高端装备产品设计过程中不同需求层次的设计人员的知识服务需求。鉴于知识检索可以通过成熟的Lucene全文检索工具[14]实现,本文不再赘述。
2 设计任务情境建模及知识库建立本章节针对知识服务需求模糊这一层次,对高端装备产品设计过程中的设计任务进行了分析,建立了设计任务情境模型。并结合课题组已有研究实现了高端装备设计知识的有效获取、存储、表达,形成了相应的高端装备产品设计知识库。
2.1 设计任务情境建模 2.1.1 设计任务情境模型设计任务情境是指在完成产品设计过程及执行具体设计任务中需要的设计人员、使用工具、使用知识资源等要素。通常相似的设计任务拥有相似的情境,设计任务情境随着设计过程不断的向前推进而变化,通过情境可理清不同设计任务之间的区别与联系,分析知识资源和设计任务之间的关系。故本文提出了利用情境来对设计任务进行建模,为基于设计任务情境的知识服务提供指导。
高端装备产品设计过程中的设计任务通常都是围绕某一具体的产品或零部件而展开。每一项任务有明确的任务内容和任务完成人员,为此本文从任务对象、任务内容和任务人员3个维度对设计任务的情境进行分析。
任务对象:任务对象主要是以高端装备产品结构树为基础,从产品、部件和零件3个层次对任务对象进行描述。
任务内容:从任务的输入、输出、完成任务所需要的工具及相关的知识实现对任务内容的描述。
任务人员:是根据企业现有的组织结构,从部门、车间和个人3个层次对执行任务的人员进行描述。
基于以上分析,建立设计任务情景模型,该模型将任务情景分为3个层次。第1层任务情景层:用于表示某一任务的情境;第2层情景要素层,包括了任务对象、任务内容和设计人员3个情景要素;第3层为情景要素的属性。
建立的设计任务情境模型可形式化的表示为
$ \begin{array}{c} {\rm{Context}} = \{ {E_1}, {E_2}, {E_3}\} \\ {E_i} = \{ {P_{{i_1}}}, {P_{{i_2}}}, \ldots , {P_{{i_n}}}\} (i = 1, 2, 3) \end{array} $ |
式中:Context表示设计任务情境,Ei表示第i个情境要素,Pij表示第i个情境要素的第j个属性,ni为第i个情境要素的属性个数。
情境要素及其属性定义如表 1所示。
任务情境相似度是不同任务情境间相似程度的度量,为研究相似度的计算方法,首先作以下定义。
定义1 任务情境相似度指给定的任务情境SContext与情境库中的任务情境TContext的相似程度,用函数Sim(SContext, TContext)表示;其中,SContext为当前任务情境,对应的任务情境要素SEi(i=1, 2, 3)和属性spij(j=1, 2, …, n)为当前任务情境要素和当前属性,TContext为目标任务情境,对应的任务情境要素TEi(i=1, 2, 3)和属性tpij(j=1, 2, …, n)为目标任务情境要素和目标属性;函数Sim(SEi, TEi)和Sim(spij, tpij)分别表示SContext与TContext的任务情境要素相似度和属性相似度。
定义2 任务情境结构树由任务情境、任务情境要素、任务情境要素属性构成的树状层次结构(如图 2所示)。其中,根结点为任务情境,除根结点外的非叶节点为要素节点,叶节点为属性节点。
Download:
|
|
因此,任务情境相似度可看作是当前任务情境结构树与目标任务情境结构树的相似程度。对于当前任务情境和目标任务情境来说,总相似度依赖于各个任务情境要素的相似度,而任务情境要素的相似度依赖于要素包含的各个属性的相似度。文中将总任务情境相似度的计算视为一个多层多指标决策问题,其算法流程如图 3所示。
Download:
|
|
该算法采用深度遍历算法实现,遍历任务情境结构树中每一个任务情境要素及其属性节点。对于某个任务情境要素,分别计算出该任务情境要素所包含的各个属性相似度后,得到加权后的任务情境要素相似度,再由所有任务情境要素相似度计算得到加权后的任务情境相似度。
2.2 知识库建立根据课题组已有研究[14]结合高端装备产品设计知识的特点,利用建立的知识资源分类、获取、存储体系,对收集到的知识进行逐条获取,然后按照设计的知识存储模板进行存储,形成了具有1 500余条知识的知识库,其中部分知识条目如图 4所示。
Download:
|
|
在实际的高端装备产品设计过程中,对于刚接触设计工作的设计人员或因设计之初诸多设计信息未确定,设计人员往往并不明确自己需要检索的内容,纵然有知识库,依然无法有效地获取到相关知识来完成设计任务。针对该问题,结合企业调研,考虑到高端装备产品的设计工作总是按照一定的流程进行,知识资源也在具体的设计任务中不断地被利用,历史的设计任务会积累大量的知识利用情境。因此本文提出了将知识被利用的设计情境信息应用于知识服务方法研究中,利用当前设计人员执行的设计任务与历史设计任务的相似性和设计任务与知识产生的设计情境的相似性为设计人员推送相关的知识,以解决设计人员在设计过程中存在的知识服务需求模糊的问题。
3.1 基于设计任务知识需求情境的知识服务流程针对高端装备产品设计过程中设计人员存在的知识服务需求模糊的问题,设计了如图 5所示的基于知识需求情境的知识服务方案。该知识服务流程主要包含2方面,一是对当前知识需求情境的获取,以建立设计人员的设计任务知识需求情境;二是根据建立的知识需求情境与历史设计任务情境和知识库中的知识情境进行匹配,从而为设计人员提供知识服务。
Download:
|
|
在基于知识需求情境的知识服务流程中,其关键在于知识需求情境的建模和知识需求情境与历史设计任务及知识的情境相似度计算,并设计相应的推荐策略。
3.2 设计任务知识需求情境建模针对高端装备设计知识总在具体设计任务中被产生和利用这一特点,结合高端装备产品的任务执行特点和已建立的基于框架的知识表达模型及设计任务情境表达模型,建立包含设计任务对象、任务内容及任务人员等情境要素的设计任务情境模型,用于表达历史设计任务和知识需求任务情境,通过该模型可以清晰地表示设计人员执行当前任务的产品对象、任务输入、任务输出等信息,实现对当前设计任务知识需求的详细描述。
为完成知识需求情境的建模,首先应获取建立情境的相关信息。在情境信息获取方面,本文采用了半自动获取的方式,具体如下:知识需求情境模型中的设计人员信息根据用户在企业中的角色进行自动获取,设计对象及完成该任务需要的输入和输出信息采用用户输入的获取模式。完成情境信息获取后,进一步利用建立的知识需求情境表达模型对其进行表达,从而形成知识需求情境结构树。
设计任务知识需求情境建模实例如图 6、7所示。针对图 6所示的弹簧操动机构在方案设计的任务,根据设计任务情境模型及情境信息的获取步骤,建立了弹簧操动机构方案设计任务知识需求情境结构树如图 7所示。弹簧操动机构由机构支架、分闸组件、合闸组件、储能组件和指示组件5部分组成。弹簧操动机构采用弹簧储能过程中快速释放原理,通过齿轮/凸轮联合传动带动输出轴转动,完成分、合闸动作。其结构简单、适用范围广、动作可靠。
Download:
|
|
Download:
|
|
基于建立的设计任务知识需求情境与规划的如图 5所示的设计知识服务方案,分别阐述了知识需求情境与设计知识匹配,以及知识需求情境和历史设计任务情境匹配2种知识服务方式。
3.3.1 基于知识需求情境与设计知识匹配的知识服务基于知识需求情境与设计知识匹配的知识服务主要包括如下步骤:首先,知识服务系统采用Luence全文检索引擎计算任务需求情境中相关节点与知识库中知识的相似度;然后,系统根据计算的相似度为设计人员推荐相关的知识;最后由设计人员根据任务的特点选择需要的知识进行查阅以获得任务的解决思路。
利用上述知识推荐方法,基于构建的高端装备设计知识库,通过获取弹簧操动机构方案设计、断路器需求分析的知识需求情境,得到了如表 2所示的知识推荐结果。
由推荐结果可知,推荐的知识可为任务的执行提供很好的参考。由此可见,该推荐策略可较好地为设计人员执行时任务提供需要的知识。
3.3.2 基于知识需求情境与历史设计任务情境匹配的知识服务在产品设计过程中,同类产品在完成相似设计任务时,在知识的利用上具有一定的相似性。为此,本文提出基于知识需求情境与历史设计任务情境匹配的知识服务。其核心是通过本文提出的情景相似度计算方法完成当前的设计任务知识需求情境与历史任务情境的匹配,从而获得相似的历史设计任务情境的知识标签,然后利用知识标签触发知识检索,得到当前设计任务情境下的知识资源。
通过将弹簧操动机构方案设计这一设计任务知识需求情境与历史任务情景进行匹配,可得到如表 3所示的结果。
通过对推荐结果的分析可知,该方法因利用了设计任务情境中的知识标签这一预定义属性来获取相关知识,提高了推荐知识与当知识需求情境的相关性。同时设计人员在获取需要知识的同时还能从中获知更多的相近设计任务,为今后的设计积累经验。
4 基于用户兴趣的知识服务方法不同高端装备设计人员在执行设计任务时,由于在一定时间通常从事着相对固定的设计任务,解决着相同或者相似的设计问题,在知识需求上有一定的个性倾向和主题聚集性。为更好地提供个性化的知识服务,本文提出根据设计人员自定义的兴趣标签与近期浏览的知识提取出的兴趣主题作为用户兴趣层面的知识需求,利用兴趣需求为设计人员主动推荐相关的知识,帮助设计人员更方便、快捷地获得自己感兴趣的知识,从而更加高效地完成设计工作。
4.1 用户兴趣的含义及LDA兴趣主题建模用户兴趣是指高端装备设计人员在进行产品设计过程中主要关心的知识主题,其可分为设计人员根据从事的设计任务特点及专长的自定义兴趣和在完成设计工作时根据近期的知识浏览记录进行数据挖掘分析而提取出的兴趣。用户兴趣主要用知识标签或主题词表示。
自定义用户兴趣主要通过设计人员手动添加或修改。由近期的知识浏览记录分析提取的用户兴趣主要通过数据挖掘算法完成。用户知识浏览记录兴趣的提取,从自然语言处理的角度来看和文章摘要或关键词的概括非常相似。摘要及关键词概括方面的研究很多,但却很少有学者将其运用到产品设计知识服务中。在众多方法中文档主题生成模型(latent dirchlet alloction, LDA)非常具有代表性,该模型于2003年由Blei等[16]提出,是基于概率图的三层贝叶斯模型,其结构模型更为完整清晰,采用高效的概率推断算法处理大规模数据。LDA主题模型因其完备的数学模型和良好的语义挖掘性能,在新闻推荐、微博兴趣发现方面有较好的利用。根据该模型理论特征和应用现状,可知该方法能胜任与设计过程中用户兴趣的提取,因而本文在原始的LDA模型基础上进行了一定的改进,从而实现了基于用户知识浏览记录的用户兴趣主题词的提取。
本文建立的LDA主题模型的逻辑结构如图 8所示,即认为每条知识文本内容(文档)的每个词都是通过以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语,其中主要包含了以下3个矩阵。
Download:
|
|
文档—词语矩阵表示每条知识文本内容中每个单词的词频,即出现的概率;
主题—词语矩阵表示每个主题中每个单词的出现概率;
文档—主题矩阵表示每条知识中每个主题出现的概率。
基于上述思想,要完成用户兴趣的LDA主题模型建立,需要解决以下2个问题:一是对知识的文本内容进行分词,计算各条知识文本内容中每个单词的词频就可以得到左边“文档-词语”矩阵;二是通过一定的方法得到“主题-词语”和“文档-主题”2个矩阵。建立用户兴趣LDA主题模型的关键就是解决如何由“文档-词语”矩阵进行训练,学习出右边2个矩阵。
LDA模型的数学推导非常严密而复杂,涉及了Gamma函数、Dirichlet分布、Dirichlet-Multinomial共轭、Gibbs Sampling、贝叶斯文本建模等内容[16],由于其理论已经非常成熟,这里不再赘述,只对其中最为关键的主题模型训练过程进行简要叙述。
用户兴趣LDA主题模型一般用如图 9所示的概率图模型进行表示,模型中相关内容的解释及训练过程如下。
Download:
|
|
θ是一条知识的主题分布,φk表示第k个主题的词分布。
共有m篇文章,一共涉及了K个主题。
每条知识文本内容(长度为Nm)都有各自的主题分布,主题分布是多项分布,该多项分布的参数服从Dirichlet分布,该Dirichlet分布的参数为α。
每个主题都有各自的词分布,词分布为多项分布,该多项分布的参数服从Dirichlet分布,该Dirichlet分布的参数为β。
对于某条知识文本内容中的第n个词,首先从该知识的主题分布中采样一个主题,然后在这个主题对应的词分布中采样一个词。不断重复这个随机生成过程,直到m条知识全部完成上述过程。
4.2 语料生成及用户兴趣主题提取在上述对用户知识浏览记录兴趣定义及兴趣LDA主题模型分析的基础上,研究了用户兴趣的挖掘和用户兴趣预测。
为完成语料生成及用户兴趣主题提取,首先需生成用于建立兴趣主题模型的语料文档和用于进行兴趣预测的兴趣文档。在语料文档生成方面,由于知识名称、摘要及主体内容包含知识语义信息,首先需对知识库中所有知识的名称、摘要和主体内容进行抽取,再进行中文分词,进而得到语料文档;而兴趣文档生成方面,则根据用户近期浏览的知识按照相似的方法进行生成。
在完成了语料文档和兴趣文档生成之后,进一步按照主题模型的训练过程对语料文档进行训练,并利用兴趣文档对用户的兴趣进行预测。在训练和预测方面,本文在开源代码“LDA4j”[17]的基础上,根据本文在用户兴趣提取和预测上的需求,在兴趣主题生成模型及主题显示等功能上进行了扩展,实现了用户的兴趣主题预测。如图 10所示为对用户“baiquandong”的兴趣主题预测主要过程及结果。
Download:
|
|
由图 10可以看出预测的主题词很好地反映了用户的兴趣,为基于用户兴趣的知识主动服务奠定基础。
4.3 基于用户兴趣的知识服务方法及案例根据用户的兴趣主题,进一步利用全文检索引擎推荐用户关心的知识。在具体实现上,结合了基于Luence的全文检索方法,利用得到的主题词及用户自定义的兴趣标签作为关键词进行知识的检索和过滤,从而完成知识推荐,其中针对用户“baiquandong”的兴趣进行知识推荐的过程及结果如图 11所示。
Download:
|
|
用户兴趣知识推荐结果包括了2方面:一是由用户自定义的“断路器”、“高端装备”和“结构设计”等兴趣标签为用户推荐了“高压断路器的结构与种类”、“铆接结构设计的原则”等知识;二是由用户近期浏览记录—弹簧操动机构,由LDA主题模型训练得到了“弹簧”、“操动机构”、“介绍”等主题词,并通过上述主题词为用户推荐了“弹簧操动机构的组成”、“液压弹簧操动机构的总体结构”等知识。同时,用户还可以根据主题词检索得到更多的知识信息。
5 结论本文在充分分析高端装备设计人员三层次知识服务需求的基础上,依托Lucene全文检索引擎,建立了包括基于设计任务知识需求情境的知识服务方法和基于用户兴趣的知识服务方法的多模式融合的知识服务方法,并开发了相应的知识服务系统。得出以下结论:
1) 在基于设计任务知识需求情境的知识服务方面,以产品设计过程任务为导向,通过建立当前设计任务的知识需求情境模型,利用提出的情境匹配算法,通过匹配历史设计知识或历史设计任务情境2种方式为设计人员实时提供相关的知识资源。
2) 在用户兴趣知识服务方面,利用用户自定义兴趣的方法和基于LDA的用户兴趣实时提取与预测的方法建立用户兴趣词汇,触发基于Lucene的全文检索引擎,从而为用户推荐潜在的兴趣知识。
3) 本文阐述的知识服务案例验证了提出的多模式知识服务方法及开发的知识服务系统在高端装备产品设计过程中的有效性与实用性,具有一定的理论与应用价值。
[1] | 马绪凯, 丁晟春. 基于本体的产品设计知识检索研究[J]. 情报理论与实践, 2014, 37(6): 112-116, 106. (0) |
[2] | 郝佳.产品设计知识管理与重用关键技术研究[D].北京: 北京理工大学, 2014. http://cdmd.cnki.com.cn/article/cdmd-10007-1014086795.htm (0) |
[3] | 李录, 毛汉颖, 吴振勇, 等. 机械零件设计的知识服务方法及系统实现[J]. 计算机应用与软件, 2016, 33(6): 68-72. DOI:10.3969/j.issn.1000-386X.2016.06.017 (0) |
[4] | 郭树行, 兰雨晴, 金茂忠, 等. 基于情境树相似性的知识检索技术[J]. 计算机集成制造系统, 2008, 14(12): 2476-2483, 2491. (0) |
[5] | 万立, 侯添元, 熊体凡. 面向重用的产品设计过程知识建模与检索[J]. 计算机工程与设计, 2012, 33(8): 3176-3183. DOI:10.3969/j.issn.1000-7024.2012.08.053 (0) |
[6] | OTEGI A, ARREGI X, ANSA O, et al. Using knowledge-based relatedness for information retrieval[J]. Knowledge and information systems, 2015, 44(3): 689-718. (0) |
[7] | PARK M, LEE K W, LEE H S, et al. Ontology-based construction knowledge retrieval system[J]. KSCE journal of civil engineering, 2013, 17(7): 1654-1663. DOI:10.1007/s12205-013-1155-6 (0) |
[8] | ZHANG Chao, ZHOU Guanghui, LU Qi, et al. Graph-based knowledge reuse for supporting knowledge-driven decision-making in new product development[J]. International journal of production research, 2017, 55(23): 7187-7203. DOI:10.1080/00207543.2017.1351643 (0) |
[9] | CHRIST A, WENZEL V, FAATH A, et al. Integration of feature templates in product structures improves knowledge reuse[C]//Proceedings of the World Congress on Engineering and Computer Science 2013 Vol Ⅱ. San Francisco, USA, 2013: 23-25. (0) |
[10] | WANG Zhansong, TIAN Ling, WU Yuanhao, et al. Personalized knowledge push system based on design intent and user interest[J]. Proceedings of the institution of mechanical engineers, part C:journal of mechanical engineering science, 2016, 230(11): 1757-1772. DOI:10.1177/0954406215584395 (0) |
[11] | XU Yuanhao, YIN Guofu, NIE Yong, et al. Research on an active knowledge push service based on collaborative intent capture[J]. Journal of network and computer applications, 2013, 36(6): 1418-1430. DOI:10.1016/j.jnca.2013.04.010 (0) |
[12] | 徐荣振, 高琦, 王昊, 等. 基于序列模式挖掘的变型设计知识推送[J]. 计算机集成制造系统, 2016, 22(5): 1179-1186. (0) |
[13] | 余绅达, 盛步云, 付高财, 等. 基于用户兴趣特征的知识推送[J]. 计算机系统应用, 2016, 25(9): 254-259. (0) |
[14] | 成龙. Lucene搜索引擎开发进阶实战[M]. 北京: 机械工业出版社, 2015. (0) |
[15] | 张超, 白权栋, 鲁麒, 等. 面向高端装备的知识分类与元知识建模技术[J]. 应用科技, 2017, 44(2): 44-50. (0) |
[16] | BLEI D M, NG A Y, JORDAN M I. Latent dirichlet allocation[J]. The Journal of Machine Learning Research, 2003, 3: 993-1022. (0) |
[17] | Hankcs. LDA4j.[EB/OL]. (2018-08-15). https://github.com/hankcs/LDA4j. (0) |