2. 河北师范大学 计算机与网络空间安全学院,河北 石家庄 050024
2. College of Computer and Cyber Security, Hebei Normal University, Shijiazhuang 050024, China
形式概念分析(FCA)[1]于1982年由Wille教授提出,它是在形式背景中进行数据分析与规则提取的一个重要工具,通过分析形式背景中概念的结构提出了概念格,从本质上对对象和属性的内在联系进行了描述。Ganter[2]在其专著中进一步总结了概念格相关知识。目前该理论已在信息检索[3]、数据挖掘[4-5],软件工程[6]等多个领域取得了广泛应用。
属性约简与规则提取是粗糙集理论中关键的研究方向,同样也是FCA中的重要问题。一个决策形式背景生成的全部形式概念,包括概念之间的关系都会储存在概念格中,这使得概念格的分析过程变得极为困难。因此,决策形式背景研究的重要课题之一就是保持决策不变进行属性约简,从而使形式背景中的隐藏知识更容易被发掘,即更易获取决策规则。越来越多的学者开始深入研究决策形式背景的属性约简与规则提取问题。
2009年,Wu[6]研究了保持概念格的粒结构不变的属性约简与规则提取,并给出具体算法。Li等[7-9]提出了一种新的决策形式背景知识约简框架,给出约简算法,且在决策形式背景研究了保持决策规则不变的属性约简。Li等[10]研究了基于同余关系的不协调决策形式背景的属性约简。Li等[11]提出了基于最大规则的决策形式背景中的新型属性约简。Chen[12-13]提出了一种大数据模型下的快速属性约简模型,并结合实例分析其算法复杂度。Yang[14]基于蕴涵映射对实数集决策形式背景中的属性约简和规则提取问题进行研究。Qi[15]从多角度讨论了两类三支概念格与传统概念格之间的联系, 并给出了在经典概念格基础上构造三支概念格的算法。Zhang等[16]利用概念格提出了一种基于案例的层次化分类器。Zhang等[17]研究了模糊决策格值信息系统上的近似约简与规则提取。张[18-19]叙述了信息系统上的知识发现与知识约简, 提出了协调近似表示空间上的规则融合方法。
目前在概念格领域已取得诸多成果,但仍存在众多问题有待解决。比如基于等价关系的粒协调决策形式背景的属性约简问题,利用确定性规则获取全部规则的具体途径,本文将进一步讨论这些问题。
1 预备知识定义1[6] 设三元组
$ {{{X}}^*} = \{ a \in {{A}}: \forall x \in {{X}}, (x,a) \in {{I}}\} $ | (1) |
$ {{{B}}^ \triangleleft } = \{ x \in {{U}}: \forall a \in {{B}}, (x,a) \in {{I}}\} $ | (2) |
定义2[6] 对于形式背景
定义3[6] 对于形式背景
则对
$ {x^{{\rm{*\{ a\} }}}} = \left\{ {\begin{array}{*{20}{c}} {\{ a\} ,\quad (x,a) \in {{I}} }\\ { \text{Ø} , \quad (x,a) \notin {{I}} } \end{array}} \right. $ | (3) |
定义4[19] 设
$ \begin{array}{l} {{P}}{\rm{ = \{ }}{{E}}{\rm{ = (}}{{{E}}_{\rm{1}}}{\rm{,}}{{{E}}_{\rm{2}}}{\rm{,}} \cdots {\rm{ ,}}{{{E}}_m}{\rm{) }}:{{{E}}_l} \leqslant {{{V}}_l}{\rm{(}}l \leqslant m{\rm{)\} }}\subseteq \\ \;\;\;{{P}}({{{E}}_{\rm{1}}}{\rm{)}} \times {{P}}({{{E}}_{\rm{2}}}{\rm{)}} \times \cdots \times ({{{E}}_m}{\rm{)}} \end{array} $ |
称
定义5[19] 设
1)
2)
3)
以往对决策形式背景进行讨论时通常会分别构造条件概念格与决策概念格,利用两者的序关系来定义形式背景的协调性。本节利用等价关系对对象集进行划分,从而得到对应的决策类,可以在保持对象的决策不变的前提下删除冗余属性。
设
${{U}}/{{{R}}_{{D}}} = \{ {[x]_{{D}}}: x \in {{U}}\} {\rm{ = \{ }}{{{D}}_1}{\rm{,}}{{{D}}_2}, \cdots ,{{{D}}_r}{\rm{\} }}$ |
其中
${[x]_D}{\rm{ = \{ }}y \in {{U}}: (x,y) \in {{{R}}_D}\} $ |
如果
定义6 设
注:1)对粒协调决策形式背景
2)对于
设
$ {{{R}}_{{B}}} = \{ ({x_i},{x_j}) \in {{U}} \times {{U}}:x_i^{*\{ a\} } \subseteq x_j^{*\{ a\} },\forall a \in {{B}}\} $ | (4) |
则容易证明:
1)
2)
定义7 设
$ {{{D}}_d}(x,y){\rm{ = }}\left\{ {\begin{array}{*{20}{c}} {\{ a \in {{A}}:x_{}^{*\{ a\} }\not \subseteq y_{}^{*\{ a\} }\} ,}& {{d_l}(x) \ne {d_l}(y)}\\ {\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\text{Ø} ,}& {\text{其他}} \end{array}} \right. $ | (5) |
且
由定义7可知,以下性质显然成立:
1)
2)
定理1 设
证明
定理2 设
证明
定义8 设
$ {{M}}{\rm{ = }} \wedge ( \vee {{{D}}_d}(x,y)) = \wedge ( \vee \{ {a_l}:{a_l} \in {{{D}}_d}(x,y)\} ) $ | (6) |
基于文献[18]可知,如果
$ {{M}} = \vee _{k = 1}^p( \wedge _{t = 1}^{{q_k}}{a_{{i_t}}}) $ | (7) |
称为
算法 1 粒协调决策形式背景的属性约简算法
输入 粒协调决策形式背景F=(U,A,I,D,G)
输出 B (粒约简集)
1) for 1≤i≤|U| and 1≤s≤|A|
2) if
3) else
4) initialize
5) for 1≤s≤|A| and 1≤l≤|D| do
6) if
7)
8) end if
9) end for
10) initialize
11) for 1≤i≤|U|, 1≤j≤|U| do
12)
13) end for
14) compute
15) return B
例1 表1给出了一个决策形式背景,其中对象集
计算可知:
$ \qquad\begin{aligned} & x_1^{* \triangleleft } = \{ {x_1},{x_2},{x_3}\} = {[{x_1}]_D}, x_2^{* \triangleleft } = \{ {x_2},{x_3}\} \subseteq {[{x_2}]_D} = {[{x_1}]_D}\\ & x_3^{* \triangleleft } = \{ {x_3}\} \subseteq {[{x_3}]_D} = {[{x_1}]_D}, x_4^{* \triangleleft } = \{ {x_4}\} \subseteq \{ {x_4},{x_7}\} = {[{x_4}]_D}\\ & x_5^{* \triangleleft } = \{ {x_5},{x_6}\} \subseteq \{ {x_5},{x_6}\} = {[{x_5}]_D}\\ & x_6^{* \triangleleft } = \{ {x_6}\} \subseteq {[{x_6}]_D} = {[{x_5}]_D},x_7^{* \triangleleft } = \{ {x_7}\} \subseteq {[{x_7}]_D} = {[{x_4}]_D} \end{aligned} $ |
可知
$ \begin{array}{l} {{M}} = \wedge ( \vee {D_d}(x,y)) \\ \;\;\;\;{\rm{ = }}{a_1} \wedge {a_4} \wedge {a_6} \wedge {a_8} \wedge ({a_3} \vee {a_5}) \\ \;\;\;\;{\rm{ = }}({a_1} \wedge {a_4} \wedge {a_6} \wedge {a_8} \wedge {a_3}) \vee ({a_1} \wedge {a_4} \wedge {a_6} \wedge {a_8} \wedge {a_5})\\ \end{array} $ |
故该形式背景存在两个粒约简,即B1= {a1,
本节给出粒协调决策形式背景中决策规则及最优决策规则的定义,进一步讨论粒协调决策形式背景上规则融合算法,并给出相关实例。
定义9 设
对于粒协调决策形式背景来说,必有
设
${f_l}({x_i}) = \left\{ {\begin{array}{*{20}{c}} {1,\quad ({x_i},{a_l}) \in {{I}}} \\ { 0,\quad ({x_i},{a_l}) \notin {{I}}} \end{array}} \right.$ |
定义10 设
$ {{D}}({{S}}/{{E}}) = \sum\limits_{i = 1}^m {\frac{{\left| {{{{S}}_l}} \right|}}{{\sum\limits_{i = 1}^m {\left| {{{{S}}_i}} \right|} }}} {\chi _{{{{F}}_l}}}({{{E}}_l}) $ | (8) |
其中
1)由
${{U}}/{{{R}}_{{D}}} = \{ {{{D}}_1},{{{D}}_2}, \cdots ,{{{D}}_r}\} $ |
2)对于决策类
${{{M}}_j} = \{ (\{ {f_1}({x_i})\} ,\{ {f_2}({x_i})\} , \cdots ,\{ {f_m}({x_i})\} )\left| {x_i^{* \triangleleft } \subseteq {{{D}}_j}} \right.\} (j \leqslant r)$ |
3)将
4)对于概念
${{E}} = (\{ {v_1}\} ,\{ {v_2}\} , \cdots ,\{ {v_m}\} )$ |
计算
${\rm{If}}\;{{B}}, {\rm{then}} \;{{{T}}_{{j_o}}} \;\;\;({{D}}({{{S}}_{{j_o}}}/{{E}}))$ |
算法 2 粒协调决策形式背景中乐观规则融合算法
输入
输出 R(决策规则)
1) for 1≤t≤|D| do
2)
3) end for
4) for
5)
6) compute
7) for
8)
9) end for
10) compute D(Sj/E)
11) if D(Sjo/E)=maxD(Sj/E) ,then
12)
13) end if
14) return R
例2 接例1,
$\!\!\!\!\begin{array}{l} ({\rm{\{ }}{x_1},{x_2},{x_3}\},\!\{ {a_1},{a_6}{\rm{\} }});({\rm{\{ }}{x_2},\!{x_3}\} ,\!\{ {a_1},\!{a_6},{a_7}\} );(\{ {x_3}\} ,\{ {a_1},\!{a_2},\!{a_6},\!{a_7}\} )\\ ({\rm{\{ }}{x_4}{\rm{\} }},\{ {a_2},{a_6},{a_7},{a_8}\} );(\{ {x_5},{x_6}\} ,\{ {a_1},{a_3},{a_5}\} )\\ ({\rm{\{ }}{x_6}{\rm{\} }},{\rm{\{ }}{a_1}{\rm{,}}{a_2},{a_3},{a_5}{\rm{\} }});(\{ {x_7}\} ,\{ {a_2},{a_3},{a_4}\} )\\ (\{ {x_1},{x_2},{x_3},{x_4}\} ,\{ {a_6}\} );(\{ {x_1},{x_2},{x_3},{x_5},{x_6}\} ,\{ a { _1}\} )\\ \{ {x_2},{x_3},{x_4}\} ,\{ {a_6},{a_7}\} );(\{ {x_3},{x_4}\} ,{\rm{\{ }}{a_2},{a_6},{a_7}{\rm{\} }})\\ (\{ {x_3},{x_6}\} ,{\rm{\{ }}{a_1},{a_2}{\rm{\} }});(\{ {x_3},{x_4},{x_6},{x_7}\} ,{\rm{\{ }}{a_2}{\rm{\} }});({x_{567}},\{ {a_3}\} )\\ (\{ {x_6},{x_7}\} ,{\rm{\{ }}{a_2},{a_3}{\rm{\} }});(U,\text{Ø} );(\text{Ø} ,{{A}}) \end{array} $ |
为使讨论更具实际意义,在下列讨论中我们忽略
计算可知:
${{U}}/{{{R}}_{{D}}} = \{ \{ {x_1},{x_2},{x_3}\} ,\{ {x_4},{x_7}\} ,\{ {x_5},{x_6}\} \} $ |
则所有决策概念计算如下:
$ ({\rm{\{ }}{x_1},{x_2},{x_3}{\rm{\} }},{\rm{\{ }}1{\rm{\} }});({\rm{\{ }}{x_4},{x_7}{\rm{\} }},{\rm{\{ }}3{\rm{\} }});({\rm{\{ }}{x_5},{x_6}{\rm{\} }},{\rm{\{ }}2{\rm{\} }}) $ |
记
$ {{{D}}_1} = \{ {x_1},{x_2},{x_3}\} ,\;{{{D}}_2} = \{ {x_4},{x_7}\} ,\;{{{D}}_3} = \{ {x_5},{x_6}\} $ |
则有
$\begin{array}{l}{{{M}}_1} = \{ ({\rm{\{ }}1{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }}),\\[-1pt] \;\;\;\;\;\;\;\;\;({\rm{\{ }}1{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}0{\rm{\} }}),\\[-1pt] \;\;\;\;\;\;\;\;\;({\rm{\{ }}1{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}0{\rm{\} }}){\rm{\} }} \end{array}$ |
$\begin{array}{l} {{{M}}_2} = \{ ({\rm{\{ }}0{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}1{\rm{\} }}),\\[-1pt] \;\;\;\;\;\;\;\;\;({\rm{\{ }}0{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }})\} \end{array}$ |
$\begin{array}{l} {{{M}}_3} = \{ ({\rm{\{ }}1{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }}),\\[-1pt] \;\;\;\;\;\;\;\;\;({\rm{\{ }}1{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}1{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }},{\rm{\{ }}0{\rm{\} }})\} \end{array}$ |
故
${{{S}}_1} = (\{ 1\} ,\{ 0,1\} ,\{ 0\} ,\{ 0\} ,\{ 0\} ,\{ 1\} ,\{ 0,1\} ,\{ 0\} )$ |
${{{S}}_2} = (\{ 0\} ,\{ 1\} ,\{ 0,1\} ,\{ 0,1\} ,\{ 0\} ,\{ 0 ,1\} ,\{ 0 ,1\} ,\{ 0 ,1\} )$ |
${{{S}}_3} = (\{ 1\} ,\{ 0,1\} ,\{ 1\} ,\{ 0\} ,\{ 1\} ,\{ 0\} ,\{ 0{\rm{\} }},\{ 0\} )$ |
对于条件概念
计算可知:
$\begin{array}{l} \;\;{{D}}({{{S}}_1}/{{E}}) = 0.9\\ {{D}}({{{S}}_2}/{{E}}) \approx 0.92\\ \;{{D}}({{{S}}_3}/{{E}}) \approx 0.56 \end{array}$ |
综上可得规则“
由定义9可知,粒决策规则如下:
显然粒决策规则在乐观规则融合方法中同样为确定性规则。
3.2 悲观规则融合1)由
${{U}}/{{{R}}_{{D}}} = \{ {{{D}}_1},{{{D}}_2}, \cdots ,{{{D}}_r}\} $ |
2)对于决策类
$ {{{M}}_j} = \{ (\{ {f_1}({x_i})\} ,\{ {f_2}({x_i})\} , \cdots ,\{ {f_m}({x_i})\} )\left| {x_i^{* \triangleleft } \subseteq {{{D}}_j}} \right.\} (j \leqslant r) $ |
3)将
4)对于概念
${{E}} = (\{ {v_1}\} ,\{ {v_2}\} , \cdots ,\{ {v_m}\} )$ |
计算
${\rm{If}} \;{{B}}, {\rm{then}} \;{{{T}}_{{j_o}}} ({{D}}({{{L}}_{{j_o}}}/{{E}}))$ |
粒决策规则在该方法中可信度并不一定为1,且两种规则融合方式获取的规则并不一致。下面给出具体算法。
算法 3 粒协调决策形式背景中悲观规则融合算法
输入
输出 R(决策规则)
1) for 1≤t≤|D|
2)
3) for
4)
5)
6) for
7)
8) compute D(Lj/E)
9) if D(Ljo/E)=maxD(Lj/E)
10) then
11) return R
12) end for
例3 通过悲观融合方法同样可以获取
首先计算可知:
${{{L}}_1} = (\{ 1\} ,\{ 1\} ,\{ 0\} ,\{ 0\} ,\{ 0\} ,\{ 1\} ,\{ 1\} ,\{ 0\} )$ |
${{{L}}_2} = (\{ 0\} ,\{ 1\} ,\{ 1\} ,\{ 1\} ,\{ 0\} ,\{ 1\} ,\{ 1\} ,\{ 1\} )$ |
${{{L}}_3} = (\{ 1\} ,\{ 1\} ,\{ 1\} ,\{ 0\} ,\{ 1\} ,\{ 0\} ,\{ 0{\rm{\} }},\{ 0\} )$ |
对条件概念
$\begin{array}{l} {{D}}({{{L}}_1}/{{E}}) = 0.625\\ {{D}}({{{L}}_2}/{{E}}){\rm{ = }}0.375\\ {{D}}({{{L}}_3}/{{E}}){\rm{ = }}0.375 \end{array}$ |
可得规则 “
形式概念分析中至关重要的两个研究问题就是属性约简问题与规则提取问题,而这两方面的研究都是为了更准确便捷地获取决策。本文用对象集与决策属性集之间的等价关系代替要求更为严格的伽罗瓦连接,使决策形式背景的模型更易获取决策。
本文利用集值向量包含度给出两种规则融合方法,获取了决策形式背景的全部规则,其中包括确定性规则与大量不确定性规则。在现实生活,这些不确定性规则可能具有重要意义,如何在部分不确定性规则不变的前提下进行属性约简,将是未来研究的重要方向。
[1] | WILLE R. Restructuring lattice theory: an approach based on hierarchies of concepts[M]//RIVAL I. Ordered Sets. Dordrecht: Springer, 1982: 445−470. (0) |
[2] | GANTER B, WILLE R. Formal concept analysis: Mathematical foundations[M]. Berlin: Springer, 1999. (0) |
[3] | SUTTON A, MALETIC J I. Recovering UML class models from C++: a detailed explanation[J]. Information and software technology, 2007, 49(3): 212-229. DOI:10.1016/j.infsof.2006.10.011 (0) |
[4] | MISSAOUI R, GODIN R, BOUJENOUI A. Extracting exact and approximate rules from databases[C]//Proceedings of the SOFTEKS Workshop on Incompleteness and Uncertainty in Information Systems. Berlin, Heidelberg: Springer, 1993: 209-222. (0) |
[5] | SHAO Mingwen, LEUNG Y, WU Weizhi. Rule acquisition and complexity reduction in formal decision contexts[J]. International journal of approximate reasoning, 2014, 55(1): 259-274. DOI:10.1016/j.ijar.2013.04.011 (0) |
[6] | WU Weizhi, LEUNG Y, MI Jusheng. Granular computing and knowledge reduction in formal contexts[J]. IEEE transactions on knowledge and data engineering, 2009, 21(10): 1461-1474. DOI:10.1109/TKDE.2008.223 (0) |
[7] | LI Jinhua, MEI Changlin, LV Yuejin. Knowledge reduction in decision formal contexts[J]. Knowledge-based systems, 2011, 24(5): 709-715. DOI:10.1016/j.knosys.2011.02.011 (0) |
[8] | LI Jinhua, MEI Changlin, LV Yuejin. Knowledge reduction in real decision formal contexts[J]. Information sciences, 2012, 189: 191-207. DOI:10.1016/j.ins.2011.11.041 (0) |
[9] | LI Jinhua, MEI Changlin, WANG Junhong, et al. Rule-preserved object compression in formal decision contexts using concept lattices[J]. Knowledge-based systems, 2014, 71: 435-445. DOI:10.1016/j.knosys.2014.08.020 (0) |
[10] | LI Junyu, WANG Xia, WU Weizhi, et al. Attribute reduction in inconsistent formal decision contexts based on congruence relations[J]. International journal of machine learning and cybernetics, 2017, 8(1): 81-94. DOI:10.1007/s13042-016-0586-z (0) |
[11] | LI Leijun, MI Jusheng, XIE Bin. Attribute reduction based on maximal rules in decision formal context[J]. International journal of computational intelligence systems, 2014, 7(6): 1044-1053. DOI:10.1080/18756891.2014.963972 (0) |
[12] | CHEN Jinkun, LI Jinjin. An application of rough sets to graph theory[J]. Information sciences, 2012, 201: 114-127. DOI:10.1016/j.ins.2012.03.009 (0) |
[13] | CHEN Jinkun, MI Jusheng, XIE Bin, et al. A fast attribute reduction method for large formal decision contexts[J]. International journal of approximate reasoning, 2019, 106: 1-17. DOI:10.1016/j.ijar.2018.12.002 (0) |
[14] | YANG Hongzhi, YEE L, SHAO Mingwen. Rule acquisition and attribute reduction in real decision formal contexts[J]. Soft computing, 2011, 15(6): 1115-1128. DOI:10.1007/s00500-010-0578-y (0) |
[15] | QI Jianjun, QIAN Ting, WEI Ling. The connections between three-way and classical concept lattices[J]. Knowledge-based systems, 2016, 91: 143-151. DOI:10.1016/j.knosys.2015.08.006 (0) |
[16] | ZHANG Qi, SHI Chongyang, NIU Zhendong, et al. HCBC: a hierarchical case-based classifier integrated with conceptual clustering[J]. Transactions on knowledge and data engineering, 2019, 31(1): 152-165. DOI:10.1109/TKDE.2018.2824317 (0) |
[17] | ZHANG Xiaoyan, WEI Ling, XU Weihua. Attributes reduction and rules acquisition in an lattice-valued information system with fuzzy decision[J]. International journal of machine learning and cybernetics, 2017, 8(1): 135-147. DOI:10.1007/s13042-015-0492-9 (0) |
[18] | 张文修, 梁怡, 吴志伟. 信息系统与知识发现[M]. 北京: 科学出版社, 2003. (0) |
[19] |
张文修, 仇国芳. 基于粗糙集的不确定决策[M]. 北京: 清华大学出版社, 2005. ZHANG Wenxiu, QIU Guofang. Uncertain decision making based on rough sets[M]. Beijing: Tsinghua University Press, 2005. (0) |