基于相关族方法的特征选择算法

引用本文

谢棚宇, 杨田, 代建华. 基于相关族方法的特征选择算法[J]. 郑州大学学报(理学版), 2020, 52(2): 77-82.

XIE Pengyu, YANG Tian, DAI Jianhua. A Feature Selection Algorithm Based on Related Family[J]. Journal of Zhengzhou University(Natural Science Edition), 2020, 52(2): 77-82.

基金项目

湖南省自然科学基金项目(2017JJ2408);中国博士后科学基金特别资助项目(2017T100795)

通信作者

杨田(1984—), 女, 湖北荆门人, 副教授, 主要从事粒计算与智能信息处理、粗糙集、模糊集理论和拓扑学研究, E-mail: math_yangtian@126.com

作者简介

谢棚宇(1993—), 女, 湖南张家界人, 硕士研究生, 主要从事粗糙集和数据挖掘研究, E-mail:386236692@qq.com

文章历史

收稿日期：2019-05-24

Contents Abstract Full text Figures/Tables PDF

基于相关族方法的特征选择算法

谢棚宇¹, 杨田^2,3, 代建华²

1. 中南林业科技大学物流与交通学院湖南长沙 410004;
2. 湖南师范大学智能计算与语言信息处理湖南省重点实验室湖南长沙 410081;
3. 国防科技大学系统工程学院湖南长沙 410073

收稿日期：2019-05-24

基金项目：湖南省自然科学基金项目(2017JJ2408);中国博士后科学基金特别资助项目(2017T100795)

作者简介：谢棚宇(1993—), 女, 湖南张家界人, 硕士研究生, 主要从事粗糙集和数据挖掘研究, E-mail:386236692@qq.com.

通信作者：杨田(1984—), 女, 湖北荆门人, 副教授, 主要从事粒计算与智能信息处理、粗糙集、模糊集理论和拓扑学研究, E-mail: math_yangtian@126.com.

摘要：针对突发事件数据的属性冗余、数据缺失等问题, 设计了一种基于相关族理论的快速属性约简方法。首先, 在第一型覆盖粗糙集模型上提出相关族属性约简方法, 并设计了相应的启发式算法。其次, 与其他属性约简算法进行对比, 验证了该算法的有效性和正确性。最后, 运用该算法对恐怖袭击事件数据集进行实例分析, 结果表明, 该方法显著降低了突发事件发生之后的数据收集难度, 从而可以减少应急反应的时间和成本。

关键词：粗糙集属性约简应急管理相关族

A Feature Selection Algorithm Based on Related Family

XIE Pengyu¹, YANG Tian^2,3, DAI Jianhua²

1. College of Logistics and Transportation, Central South University of Forestry and Technology, Changsha 410004, China;
2. Hunan Provincial Key Laboratory of Intelligent Computing and Language information Processing, Hunan Normal University, Changsha 410081, China;
3. College of Systems Engineering, National University of Defense Technology, Changsha 410073, China

Abstract: A fast attribute reduction method based on the related family method was proposed for data redundancy and data loss in emergencies. Firstly, the related family based on attribute reduction method was proposed on the first type of covering rough set model, and a corresponding heuristic algorithm was designed. Secondly, the validity and correctness of the algorithm were verified by comparing it with other attribute reduction algorithms. Finally, this method was applied to the analysis of terrorist attack data set. The results showed that the difficulty of data collection after emergencies was greatly reduced, thus the time and cost of emergency response were reduced.

Key words: rough set attribute reduction emergency management related family

0 引言

突发事件是指在短时间内突然发生、对社会和人民群众的生命财产安全产生严重影响的事件。一般而言, 突发事件数据的属性集中存在大量冗余信息, 可能会掩盖突发事件信息系统中各要素的关系, 影响应急决策的质量和效率。因此, 需要对突发事件信息系统进行有效的属性约简, 以达到删除冗余或不必要属性、减少突发事件响应时间和提高决策准确性的目的。文献[1-3]利用粗糙集理论^[4]对各类突发事件进行了属性约简, 提高了分类的质量。粗糙集的主要思想是在保持分类能力不变的情况下, 通过知识约简导出问题的决策或分类规则。利用粗糙集理论的属性约简一般采用区分矩阵^[5]、邻域粗糙集^[6]、信息熵^[7]等工具, 但利用这些方法提出的约简理论不能适用于所有的覆盖粗糙集模型的属性约简。针对这一难题, 文献[8]基于逼近空间提出相关族方法, 解决了$\mathscr{M}$逼近空间覆盖粗糙集模型的属性约简问题。此外, 突发事件积累了大量的数据, 而基于相关族方法设计的属性约简算法能快速地得到约简结果, 运行时间短。因此, 本文以粗糙集理论和相关族方法为基础, 针对突发事件的属性约简问题提出相应的约简理论和算法, 将决策表中一致和非一致两种情况整合为统一框架, 进而利用相关族理论对决策表进行属性约简, 在此基础上设计了启发式约简算法, 并对恐怖袭击事件数据集进行了实例分析。

1 相关概念 1.1 粗糙集

为避免在处理数值型数据过程中发生数据内部结构改变、数据挖掘性能下降和离散化产生误差等问题, 文献[9]提出了覆盖粗糙集模型。设U为一个非空有限论域, $\mathscr{C}$为U的一个非空子集族, 若∪$\mathscr{C}$=U, 则称$\mathscr{C}$为U上的一个覆盖, 序对(U, $\mathscr{C}$)称为覆盖逼近空间。

定义1(极小描述、邻域、逼近空间)^[10] 令$\mathscr{C}$为U上的一个覆盖, Md_{$\mathscr{C}$}(x)={K∈$\mathscr{C}$|x∈K∧(∀S∈$\mathscr{C}$∧x∈S∧S⊆K)⇒K=S}称为x的极小描述, $\mathscr{M_C}$=∪{Md_{$\mathscr{C}$}(x)|x∈$\mathscr{C}$}称为覆盖$\mathscr{C的M}$逼近空间。N_{$\mathscr{C}$}(x)=∩{C∈$\mathscr{C}$|x∈C}称为x的邻域, $\mathscr{N_C}$={N_{$\mathscr{C}$}(x)|x∈C}称为覆盖$\mathscr{C的N}$逼近空间。当不引起混淆时, 可以省略下标$\mathscr{C}$。

定义2(第一型逼近算子)^[10] 令$\mathscr{C}$为U上的一个覆盖, 对任意的X⊆U, 集合CL_{$\mathscr{C}$}(X)=∪{K∈$\mathscr{C}$|K⊆X}和FH_{$\mathscr{C}$}(X)=CL_{$\mathscr{C}$}(X)∪(∪{Md(x)|x∈X－CL_{$\mathscr{C}$}(X)})分别称为X的下近似和上近似。当不引起混淆时, 可以省略下标$\mathscr{C}$。

定义3(知识表达系统) 四元组S=(U, A, V, f)记为一个知识表达系统(也称为信息系统), 其中U={x₁, x₂, …, x_m}是对象的非空有限集合, 称为论域; A=C∪D且C∩D=Ø, 子集C和D分别表示条件属性和决策属性; $V = \bigcup\limits_{a \in A} {{V_a}} $是属性取值的集合, V_a是属性a的值域; f:U×A→V是一个信息函数, 为每个对象的每个属性赋予一个信息值, 即∀a∈A, x∈U, f(x, a)∈V_a。

具有条件属性和决策属性的知识表达系统称为决策表。若条件属性中对象的关系表现为覆盖$\mathscr{C}$, 则决策表为覆盖决策表, 记为S=(U, Δ, D), 其中Δ={$\mathscr{C}$₁, $\mathscr{C}$₂, …, $\mathscr{C}$_n}为论域U上的一个覆盖族。

1.2 覆盖粗糙集的属性约简

属性约简的目标就是寻找保持信息系统分类能力不变的属性极小子集, 但此时的逼近方式或空间却没有发生改变。本文的属性约简基于覆盖决策表, 即研究条件属性所产生的分类相对于决策属性所产生的分类之间的关系, 产生的属性约简记为相对属性约简。相对属性约简有两个重要概念:相对约简和相对核(简称为约简和核)。

定义4(约简、核) 设S=(U, Δ, D)是一个覆盖决策表, 其中Δ={$\mathscr{C}$₁, $\mathscr{C}$₂, …, $\mathscr{C}$_n}是论域U上的一个覆盖族。对任意的$\mathscr{C}$_i∈Δ, 若POS_Δ(D)⊆POS_{Δ－{$\mathscr{C}$_i}}(D), 则$\mathscr{C}$_i在Δ中关于D不必要; 否则, $\mathscr{C}$_i在Δ中关于D必要。对于每一个P⊆Δ, 若POS_Δ(D)⊆POS_P(D), 并且P的任意一个覆盖都是必要的, 称P是Δ相对于D的一个属性约简。Δ中所有必要关系组成的集合称为Δ的相对核, 记为CORE(Δ)。Δ中所有约简的集合记为RED(Δ)。

1.3 相关族

在粗糙集属性约简理论中, 区分矩阵是最经典的工具之一, 其被广泛地应用到$\mathscr{N}$逼近空间类型的覆盖粗糙集属性约简中。在对$\mathscr{M}$逼近空间类型的覆盖粗糙集进行属性约简时, 区分矩阵这一工具不再适用, 而相关族方法能对逼近空间为$\mathscr{M_C}$的覆盖粗糙集模型进行属性约简。因此, 本文基于第一型覆盖粗糙集模型和相关族方法对突发事件数据进行属性约简。下面基于覆盖决策表给出相关族的定义, 覆盖决策表分为一致和非一致两种情况, 为节省时间, 在属性约简之前不再区分数据是否一致, 并将一致和不一致覆盖决策表整合为统一框架, 在此框架上讨论相关族理论。

定义5 令(U, Δ, D)为一个覆盖决策表, 其中U={x₁, x₂, …, x_n}, $\mathscr{S}$(U, Δ, D)={$\mathscr{C}$_k∈∪Δ|∃X_i∈U/D s.t. $\mathscr{C}$_k⊆X_i}称为(U, Δ, D)的有效逼近集合, 有效逼近集合中的对象称为有效信息粒。

定义6 令(U, Δ, D)为一个覆盖决策表, $\mathscr{S}$(U, Δ, D)为有效逼近集合, 则对任意的x_i∈∪$\mathscr{S}$(U, Δ, D), 有

1) r(x_i)={$\mathscr{C}$∈Δ|∃$\mathscr{C}$_k∈$\mathscr{S}$(U, Δ, D) s.t. x_i∈$\mathscr{C}$_k∈$\mathscr{C}$}称为x_i的相关集合;

2) R(U, Δ, D)={r(x_i)|x_i∈Δ}称为决策表(U, Δ, D)的相关族。

定理1 令(U, Δ, D)为覆盖决策表, $\mathit{\mathbb{P}}$∈Δ, 则

1) 对任意的x_i∈$\mathscr{S}$(U, Δ, D), 当且仅当$\mathit{\mathbb{P}}$∩r(x_i)≠Ø, 有POS_∪Δ(D)=POS_{∪$\mathit{\mathbb{P}}$}(D);

2) 对于某些x_i∈U, 有CORE(Δ)={$\mathscr{C}$∈Δ|r(x_i)={$\mathscr{C}$}}。

证明 1)假设POS_∪Δ(D)=POS_{∪$\mathit{\mathbb{P}}$}(D), 对任意的x_i∈∪$\mathscr{S}$(U, Δ, D), 有∃K∈$\mathscr{S}$(U, $\mathit{\mathbb{P}}$, D)={K|K∈∪$\mathit{\mathbb{P}}$且∃X∈U/D}, 其中x_i∈K。即有$\mathscr{C}$∈$\mathit{\mathbb{P}}$使得x_i∈K∈$\mathscr{C}$。因为$\mathit{\mathbb{P}}$∈Δ, 很明显$\mathscr{C}$∈r(x_i), 所以($\mathscr{C}$∈r(x_i))∩$\mathit{\mathbb{P}}$≠Ø。假设对任意的x_i∈∪$\mathscr{S}$(U, Δ, D), 有$\mathit{\mathbb{P}}$∩r(x_i)≠Ø, 则存在$\mathscr{C}$∈$\mathit{\mathbb{P}}$使得$\mathscr{C}$∈r(x_i), 故∪$\mathscr{S}$(U, Δ, D)=∪$\mathscr{S}$(U, $\mathit{\mathbb{P}}$, D), 所以POS_∪Δ(D)=POS_{∪$\mathit{\mathbb{P}}$}(D)。

2) 假设$\mathscr{C}$∈CORE(Δ), 则说明$\mathscr{C}$在Δ是必要的, 即POS_∪Δ(D)≠POS_{∪(Δ－$\mathscr{C}$)}(D), 存在x_i∈U使得x_i∉∪{K|K∈∪(Δ－{$\mathscr{C}$})且∃X∈U/D s.t. K⊆X}。因此, r(x_i)={$\mathscr{C}$}。如果对那些x_i∈U有r(x_i)={$\mathscr{C}$}, 很明显有$\mathscr{C}$∈CORE(Δ)。

以上定义阐述了相关族方法的基本思想, 在求覆盖决策表的属性约简时, 相关族引入了布尔函数。

定义7 令Δ={$\mathscr{C}$₁, $\mathscr{C}$₂, …, $\mathscr{C}$_n}为U上的一族覆盖, R(U, Δ, D)={r(x_i)|x_i∈U}为覆盖决策表(U, Δ, D)的相关族。f(U, Δ, D)为关于n个布尔变量$\mathscr{\bar C}$₁, $\mathscr{\bar C}$₂, …, $\mathscr{\bar C}$_n的布尔方程, 令f(U, Δ, D)($\mathscr{\bar C}$₁, $\mathscr{\bar C}$₂, …, $\mathscr{\bar C}$_n)=∧{∨(r(x_i))|r(x_i)∈R(U, Δ, D)}, 则称f(U, Δ, D)为(U, Δ, D)的相关方程。

定理2 令(U, Δ, D)为覆盖决策表, f(U, Δ, D)为其相关方程。若g(U, Δ, D)为f(U, Δ, D)通过乘法律和吸收率得到的极小析取范式, 即g(U, Δ, D)=(∧P₁)∨…∨(∧P_m), P_k⊆P, k=1, 2, …, m且P_k中的任意元素至多出现一次, 则RED(Δ)={P₁, P₂, …, P_m}。

证明对任意的k=1, 2, …, m和r(K_i)∈R(U, Δ, D), 有∧P_k≤∨r(K_i), 所以若r(K_i)≠Ø, 则Δ∩r(K_i)≠Ø。令$\mathscr{C}$∈P_k且P′_k=P_k－$\mathscr{C}$, 则g(U, Δ, D)＜∨_t=1^k－1(∧P_t)∨(∧P′_k)∨(∨_t=k+1^m(∧P_t)), 若对任意的r(K_i)∈R(U, Δ, D), 有P′_k∩r(K_i)≠Ø, 则对任意的r(K_i)∈R(U, Δ, D), 有∧P′_k≤∨r(K_i), 即g(U, Δ, D)≥∨_t=1^k－1(∧P_t)∨(∧P′_k)∨(∨_t=k+1^m(∧P_t)), 矛盾。从而有r(K_i0)∈R(U, Δ, D)使得P′_k∩r(K_i0)≠Ø。因此, P_k为Δ的约简。

对任意的X∈RED(Δ)和任意的r(K_i)∈R(U, Δ, D), 有X∩r(K_i)≠Ø, 则f(U, Δ, D)∧(∧X)=∧(∨r(K_i))∧(∧X)=∧X, 从而∧X≤f(U, Δ, D)=g(U, Δ, D)。假设对任意k=1, 2, …, m, 有P_k－X≠Ø, 则对每一个k都有$\mathscr{C}$_k∈P_k－X。令g(U, Δ, D)=(∨_k=1^m$\mathscr{C}$_k)∧Φ, 则∧X≤∨_k=1^m$\mathscr{C}$_k, 从而存在$\mathscr{C}$_k₀使得∧≤$\mathscr{C}$_k₀, 即$\mathscr{C}$_k₀∈X, 矛盾。因此, 存在k₀使得P_k₀⊆X, 既然X和P_k₀均为约简, 显然X=P_k₀。所以, RED(Δ)={P₁, P₂, …, P_m}。

2 基于相关族的快速属性约简算法 2.1 数据预处理

本文进行属性约简的基础是覆盖决策表, 若数据集的数据类型表现为混合数据或连续型数据, 需对其进行预处理使之形成覆盖。对于连续型属性下的对象x_i(i=1, 2, …, m), 首先对其进行归一化处理, 使属性值取值区间为[0, 1], K(x_i)={x_j|d(x_i, x_j)≤δ}称为关于对象x_i形成的信息粒, 其中:d(x_i, x_j)=|a(x_i)－a(x_j)|; δ是区间为[0, 1]的可调节参数。若属性为符号型, 则K(x_i)={x_j|a(x_i)=a(x_j)}。单个属性下所有K(x_i)的集合形成了关于该属性的覆盖。

2.2 基于相关族的快速属性约简算法

本文提出的基于相关族的快速属性约简算法分为两步。首先求得覆盖决策表的相关族(Step 1), 再在相关族的基础上求得决策表的属性约简结果(Step 2)。a_t∈A(t=1, 2, …, n)表示属性, x_i∈U(i=1, 2, …, m)表示对象, [x_i]_{a_t}表示对象x_i在属性a_t中根据δ形成的信息粒, [x_i]_D表示对象x_i所在的决策类, |r(x_i)|表示该集合的势, ‖a_t‖表示属性a_t在R(U, Δ, D)中出现的频次, 算法的具体步骤如下。

Step 1 在覆盖决策表上生成相关族。

输入:决策表S(U, A, D), 参数δ;

输出:相关族R(U, Δ, D);

① 令R(U, Δ, D)=Ø, r(x_i)=Ø

② for a_t∈A, P_t=Ø

③ for x_i∈U, r(x_j)=Ø

④ if存在x_j∈U－[x_i]_D使得|a_t(x_i)－a_t(x_j)|≤δ

则[x_i]_{a_t}和[x_j]_{a_t}为无效粒子

⑤ else [x_i]_{a_t}为有效粒子

计算[x_i]_{a_t}, P_t=P_t∪[x_i]_{a_t}

⑥ end if

⑦ end for

⑧ if x_j∈P_t

⑨ r(x_j)=r(x_j)∪{a_t}

⑩ end if

⑪ end for

⑫ end for

⑬ R(U, Δ, D)={r(x_i)|x_i∈U}

Step 2 基于相关族得到属性约简。

输入:相关族R(U, Δ, D);

输出:约简RED;

① 令CORE=Ø, RED=Ø

② for r(x_i)∈R(U, Δ, D)

③ if |r(x_i)|=1

④ CORE=CORE∪r(x_i); 从R(U, Δ, D)中删去r(x_i)

⑤ end if

⑥ end for

⑦ RED=CORE

⑧ while R(U, Δ, D)≠Ø

⑨ if ‖a_t‖=max{‖a‖|a∈A}

⑩ RED=RED∪{a_t}

⑪ end if

⑫ for r(x_i)∈R(U, Δ, D)

⑬ if a_t∈r(x_i)

⑭ 从R(U, Δ, D)中删去r(x_i)

⑮ end if

⑯ end for

⑰ end while

记对象个数为m, 属性个数为n。在本文提出的属性约简算法中, Step 1计算相关族的时间复杂度为O(m²n/2), Step 2计算属性约简的时间复杂度为O(min{m, n}), 因此本算法的时间复杂度为O(m²n/2+min{m, n})。其中在计算相关族时, 考虑到2个对象之间的距离关系是对称的, 当x_i与x_j不在同一决策类, 而|d(x_i, x_j)|≤δ, 此时由x_i生成的信息粒视为无效信息粒, 根据对称性, x_j所在的信息粒也视为无效信息粒, 因此Step 1的时间复杂度为O(m²n/2)。当判断信息粒为无效粒子时, 运算中断, 此过程不会生成完整的信息粒。因此, 实际计算量会远小于复杂度中的计算量。

3 实验分析

所有实验均在同一设备、同一环境下进行。其中设备运行系统为macOS10.14.4, 处理器为2.7 GHz Intel Core I7, 内存为8 GB, 实验所用软件为Matlab R2018a。利用5个公开数据集来检验本文算法的有效性, 突发事件实例分析数据为环球恐怖主义数据集GTD。

3.1 算法有效性检验

为验证本文算法的有效性, 利用5个公开数据集与文献[6]中基于邻域粗糙集的NRS算法、文献[7]中基于信息熵的HANDI算法、文献[11]中基于区分矩阵的CDG算法进行属性约简对比实验, 对比项包括数据集的分类精度及约简时间。判断数据集分类精度的工具为支持向量机(SVM)和决策树ID3, 对比结果如表 1、表 2所示。在实验过程中, 除CDG算法在对数据集texture进行属性约简时, 由于超出设备内存而不能得到约简结果外, 其他算法对5个数据集均能计算出约简结果。经本文算法约简后的数据集分类精度与初始精度相比, 约简结果均能保持或提升分类精度; 与其他几种算法约简得到的分类精度进行对比, 也仅存在细微差别, 约简结果基本保持一致, 证明了本文算法的有效性。在约简时间对比上, 本文算法具有明显的时间优势, 特别是对对象个数较多的大型数据集, 时间差距更为明显。因此, 若将本文算法应用于突发事件数据的属性约简, 能极大地缩短得到关键因素的时间, 协助救援机构快速判断突发事件的危害等级, 以开展对应等级的救援活动。

表 1 不同算法的分类精度对比 Tab. 1 Comparisons of classification accuracy of different algorithms

表 2 不同算法的约简时间对比 Tab. 2 Comparisons of reduction time of different algorithms

3.2 恐怖袭击事件实例分析

恐怖袭击事件数据记录了大量的情景与袭击后果信息, 若能删除恐怖袭击事件中的冗余知识, 则可以明确属性因素与袭击后果的关系, 有利于决策者根据少量关键情景因素做出判断, 实施相应救援调度。环球恐怖主义数据集GTD获取了1998—2017年近20年的恐怖袭击的详尽内容, 包含了大量的文本属性和相似描述属性, 且很多对象属性值为缺失值, 不利于后续进行约简实验。因此, 对数据集GTD进行了处理, 并得到了关于环球恐怖主义事件危害程度的决策表, 该决策表有对象35 415个, 属性26个, 其中条件属性25个。用本文算法对决策表进行属性约简, 总约简时间约为2 160.704 s, 分类精度及属性个数在参数δ下的变化趋势如图 1所示。可以看出, 当邻域变量δ在区间[0, 1.0]变化时, 约简后的分类精度在区间[86.2%, 87.9%]变动。当δ=0.9时, SVM分类器下分类精度的最优值为87.84%;当δ=0.85时, ID3分类器下分类精度的最优值为87.83%。两种分类器最优精度对应的约简结果相同, 约简后均剩余3个属性, 分别为受伤总人数、人质总数、赎金支付总数。数据集GTD基于SVM和ID3分类器的原始分类精度分别为85.76%和85.57%。对比发现, 约简后的分类精度提升了2%左右, 而原决策表的条件属性个数由25个降至3个。

图 1 分类精度及属性个数在参数δ下的变化趋势 Fig. 1 Variation of classification accuracies and number of attributes with δ

同样地, 本文也利用3.1小节的对比算法对恐怖袭击事件数据进行属性约简, 数据集GTD的约简结果对比如表 3所示。CDG和HANDI算法由于所要求的计算空间超出设备内存而无法计算, NRS算法只有在参数δ=0时得到约简结果, 其单次约简时间约为1 853.54 s, 为本文算法单次约简时间(102.89 s)的18.01倍。NRS算法的分类精度均低于本文算法约简后的分类精度。因此, 根据算法的有效性检验和恐怖袭击事件实例分析可知, 本文算法对数据集进行属性约简后, 不仅能继续保持甚至提高分类精度, 且相较于其他高效的属性约简算法具有明显的时间优势。当突发事件发生时, 本文算法能帮助决策者或救援机构快速地找到关键影响因素, 减少数据收集的难度, 使得决策者能根据有限的属性判断突发事件的危害等级, 做出合理的救援决策。

表 3 数据集GTD的约简结果对比 Tab. 3 Comparisons of reduction results of GTD dataset

4 小结

本文在相关族理论的基础上提出了基于第一型覆盖粗糙集的属性约简理论, 设计了启发式属性约简算法, 并与现有的几种有效算法进行了比较。结果表明, 本文算法能快速地进行属性约简, 缩短知识发现的时间, 节省存储空间。对数据规模较大的恐怖袭击事件数据集进行了实例分析, 结果表明, 该算法能快速地删除数据库中大量的冗余属性, 提高了约简后数据分类的精度, 提取出恐怖袭击事件数据的关键属性, 降低了突发事件发生时数据收集的难度。此外, 在该数据集存在属性值缺失、信息不完备的情况下, 本文算法依旧可以得到满意的结果, 说明此方法能解决此类不完备信息系统的属性约简问题, 其实际应用性更加广泛。

参考文献

[1]	王铁, 蒲云. 车站应急保障体系属性约简研究[J]. 计算机工程与应用, 2015, 51(16): 219-222. WANG T, PU Y. Attribute reduction research of railway station emergency security system[J]. Computer engineering and applications, 2015, 51(16): 219-222. DOI:10.3778/j.issn.1002-8331.1410-0148 (0)
[2]	高田, 杜军平, 王肃. 基于粗糙集的旅游突发事件属性约简[J]. 东南大学学报(自然科学版), 2009, 39(S1): 163-167. GAO T, DU J P, WANG S. Tourism emergency attribute reduction based on rough set[J]. Journal of southeast university (natural science edition), 2009, 39(S1): 163-167. (0)
[3]	仲秋雁, 王然, 曲毅. 基于粗糙集的突发事件属性约简方法[J]. 运筹与管理, 2018, 27(1): 89-95. ZHONG Q Y, WANG R, QU Y. A method of attribute reduction for emergency based on rough set[J]. Operations research and management science, 2018, 27(1): 89-95. (0)
[4]	PAWLAK Z. Rough sets[J]. International journal of computer and information sciences, 1982, 11(5): 341-356. DOI:10.1007/BF01001956 (0)
[5]	SKOWRON A, RAUSZER C. The discernibility matrices and functions in information systems[M] //SLOWINSKI R. Intelligent decision support. Dordrecht: Springer, 1992: 331-362. (0)
[6]	HU Q H, YU D R, LIU J F, et al. Neighborhood rough set based heterogeneous feature subset selection[J]. Information sciences, 2008, 178(18): 3577-3594. DOI:10.1016/j.ins.2008.05.024 (0)
[7]	WANG C Z, HU Q H, WANG X Z, et al. Feature selection based on neighborhood discrimination index[J]. IEEE transactions on neural networks and learning systems, 2018, 29(7): 2986-2999. (0)
[8]	YANG T, LI Q G, ZHOU B L. Related family: a new method for attribute reduction of covering information systems[J]. Information sciences, 2013, 228: 175-191. DOI:10.1016/j.ins.2012.11.005 (0)
[9]	ZAKOWSKI W. Approximations in the space (U, π)[J]. Demonstratio mathematica, 1983, 16(3): 761-769. (0)
[10]	YANG T, LI Q G. Reduction about approximation spaces of covering generalized rough sets[J]. International journal of approximate reasoning, 2010, 51(3): 335-345. DOI:10.1016/j.ijar.2009.11.001 (0)
[11]	CHEN J K, LIN Y J, LIN G P, et al. Attribute reduction of covering decision systems by hypergraph model[J]. Knowledge-based systems, 2017, 118: 93-104. DOI:10.1016/j.knosys.2016.11.010 (0)