文章快速检索  
  高级检索
基于不完备信息系统的三角模糊数决策粗糙集
李亚鸽1,4, 杨宏志2, 徐久成3
1. 郑州大学 数学与统计学院, 河南 郑州 450001;
2. 河南财经政法大学, 河南 郑州 450046;
3. 河南师范大学 计算机与信息工程学院, 河南 新乡 453007;
4. 新乡学院 数学与信息科学学院, 河南 新乡 453007
基金项目: 国家自然科学基金项目(61370169,61402153);河南省科技攻关重点项目(142102210056,162102210261);河南省高等学校重点科研项目(16A520057)    
摘要: 在不完备信息系统中,针对用区间值表示一个未知参量时,整个区间内取值机会被认为是均等的,得到的结果可能会产生过大误差的问题,将三角模糊数引入到决策粗糙集中,提出了一种基于不完备信息系统的三角模糊数决策粗糙集。首先,定义了一种描述不完备信息的相似关系;然后,针对不完备信息系统中的缺失值,利用三角模糊数来获取损失函数,构建了三角模糊数决策粗糙集模型;实例表明,本文提出的方法不仅能够弥补用区间数表示的不足,而且可以突出可能性最大的主值,从而减少分类误差。
关键词: 不完备信息系统     区间值     三角模糊数     决策粗糙集    
Triangular fuzzy number decision-theoretic rough sets under incomplete information systems
LI Yage1,4, YANG Hongzhi2, XU Jiucheng3
1. School of Mathematics and Statistics, Zhengzhou University, Zhengzhou 450001, China ;
2. Henan University of Economics and Law, Zhengzhou, Zhengzhou 450046, China ;
3. College of Computer and Information Engineering, Henan Normal University, Xinxiang 453007, China ;
4. Department of Mathematics and Information Science, Xinxiang University, Xinxiang 453007, China
Abstract: Aiming at the problems that when using an interval value to represent an unknown parameter in an incomplete information system, the opportunity to obtain the value over the whole interval is considered to be equal, but the result may cause an over-large error. In order to solve this problem, a triangular fuzzy number was introduced into decision-theoretic rough sets, and a triangular fuzzy decision-theoretic rough set under incomplete information systems is proposed. Firstly, a new similarity relation was defined to describe incomplete information systems. Then, in view of the missing values, a model of triangular fuzzy number decision-theoretic rough sets was constructed to obtain the loss function. Finally, examples show that the proposed method not only makes up for deficiency in representation of the interval value, but also highlights the main value most likely to reduce the classification error.
Key words: incomplete information system     interval value     triangular fuzzy number     decision-theoretic rough sets    

在现实生活中,由于测量误差、数据获取能力不足等原因,使得大量的信息系统都是不完备的[1]。一般来说,不完备信息系统(incomplete information systems, IIS)中的未知属性值有3种不同的情况。一种是未知属性值是被遗漏的,但又确实存在的[2]。根据这样的解释,Kryszkiewicz构建满足自反性和对称性的容差关系[3],并研究了IIS中的知识约简问题;基于容差关系,王国胤等[1]提出了限制容差关系;杨习贝等[4]给出了一种可变精度分类关系,对限制容差关系进行了扩展;一种是未知属性值被认为是丢失的,不允许被比较[5],据此,Stefanowski等构建了非对称相似关系[6],并建立了近似集的概念;另外一种是未知属性值被认为是暂时性缺失。

决策粗糙集是20世纪90年代由Yao提出的一种重要的粗糙集模型[7],该理论的核心内容是通过分析比较各种决策的风险损失,找出最小风险损失决策,以此作为把对象划分到正域、负域和边界域的依据。贾修一等[8]提出了一种基于决策风险最最小化的属性约简定义,它要求在约简后的属性集合上所做出的决策风险小;王国胤等[9]对国内外有关决策粗糙集模型进行了综述和分析;Li等[10]根据决策者的不同风险偏好,给出了乐观决策、悲观决策与中性决策的多角度决策粗糙集模型;叶东毅等[11]提出了基于模糊数风险最小化的拓展决策粗糙集模型;此外,决策粗糙集已在邮件信息过滤系统、文本聚类和分类、石油开采中得到了较好应用[12-16]

然而,在已有对决策粗糙集的研究中,代价敏感损失函数大都由专家提供。考虑到人为判断的模糊性,单值损失函数存在很大误差,损失函数应具有一定的伸缩性,为此,刘盾等[17]提出区间决策粗糙集,讨论了用区间值来刻画损失函数;考虑到信息系统的不完备性,马兴斌等[18]讨论了不完备信息系统中的多重代价决策粗糙集;刘盾等[19]将不完备信息引入到区间决策粗糙集中,构建了一个混合信息知识表,用以处理IIS中的三支决策问题,但是这仍具有一定的误差,特别地,在IIS中,用区间数表示一个未知参量时,整个区间内取值机会被认为是均等的,得到的结果可能会产生过大误差。而在三角模糊数区间取值中,主值a的取值机会最大,由a靠近上限、下限取值可能性递减。因此,使用三角模糊数进行不确定性值的评判,不仅能够突出取可能性最大的主值,而且可以弥补用区间数表示的不足。基于此,本文在IIS的基础上提出了使用三角模糊数来改善只用上下限表示的区间数取值,构建了三角模糊数决策粗糙集模型。

1 基础知识 1.1 决策粗糙集

决策粗糙集[20-21]模型利用两个状态集和3个行动集描述决策过程。状态集Ω={X, ﹁X}分别表示某事件属于X和不属于X,行动集A={aP, aB, aN}分别表示接受某事件、延迟决策和拒绝某事件3种行动。考虑到采取不同行动会产生不同的损失,用λPPλBPλNP分别表示当x属于X时,采取行动aPaBaN下的损失;用λPNλBNλNN分别表示当x不属于X时,采取行动aPaBaN下的损失。因此采取aPaBaN3种行动下的期望损失可分别表示为

(1)

式中:[x]为样本在属性集下的等价类,P(X| [x])和P(﹁X| [x])分别表示将等价类[x]划分为X和﹁X的概率。根据贝叶斯决策准则,需要选择期望损失最小的行动集作为最佳行动方案,于是得到如下3条决策规则:

P) 若R(aP|[x])≤R(aB|[x])和R(aP|[x])≤R(aN|[x]同时成立,那么x∈POS(X);

B) 若R(aB|[x])≤R(aP|[x])和R(aB|[x])≤R(aN|[x])同时成立,那么x∈BND(X);

N) 若R(aN|[x])≤R(aP|[x])和R(aN|[x])≤R(aB|[x]同时成立,那么x∈NEG(X)。

由于P(X| [x])+P(﹁X| [x])=1,所以上述规则只与概率P(X| [x])和相关的损失函数λ有关。基于常识,做出正确决策产生的损失要小于做出错误决策产生的损失,故有0≤λPPλBP < λNP,0≤λNNλBN < λPN。基于这两个条件,从规则P)~N)可以获得以下3个阈值:

(2)

基于上述3个阈值,规则P)~N)可简明表示为

P′)若P(X|[x])≥αP(X|[x])≥γ,则x∈POS(X);

B′)若P(X|[x])≤αP(X|[x])≥β,则x∈BND(X);

N′)若P(X|[x])≤βP(X|[x])≤γ,则x∈NEG(X)。

1.2 三角模糊数

模糊集作为精确数值的一种扩展形式,被用于处理模糊、不精确和不确定性决策问题。在模糊集理论中,隶属函数是它的一个最基本元素。在隶属函数中,三角模糊数是其中具有代表性的一个。

定义2[22]  实数R上的模糊数a=(l, m, u)是一个三角模糊数,其中,lmu为实数,且lλmλum称为三角模糊数a的主值,lu分别称为a的下界和上界。

模糊数a的隶属函数的表达式可表示为

(3)

l=mm=u时,三角模糊数就转变为区间数,由此可见区间数是三角模糊数的一个特例。在区间数取值中,上下限的各个取值可以认为是机会均等的,而在三角模糊数区间取值中,主值a的取值机会最大,而由a靠近上限、下限的取值可能性递减。

对于任意两个模糊三角数a1=(l1, m1, u1),a2=(l2, m2, u2),根据扩展定理[24]相应的运算规则如下:

1) a1+a1=(l1+ l2, m1+m2, u1+u2);

2) a1-a2=(l1-l2, m1-m2, u1-u2);

3) a1 a2=(l1 l2, m1 m2, u1 u2);

4) a1/a2=(l1/u2, m1/m2, u1/l2);

5) λ a2=(λ l2, λ m2, λ u2), λRλ >0。

2 基于IIS的三角模糊数决策粗糙集 2.1 不完备信息系统

定义1[23]  不完备信息系统IIS=(U, AT, V, f)。其中,U是一个被称为论域的对象集合;AT是非空有限的属性集合;对于∀a∈AT,有a: UVa,其中Va是属性a的值域(包括遗漏型空值和缺失型空值)。属性值域集合V=Ua∈ATVaf为信息函数,对于∀ aAxU,有f(x, a)∈Va。在本文中,IIS中所有的未知值都被认为是被遗漏的。

2.2 相似度及相关知识

在IIS=(U, AT, V, f)中,V=Va∪{*},*表示未知的值。陈圣兵等[25]在不完备信息系统中,分析并讨论了空值相等的概率问题。基于文献[25],我们提出了在不完备信息系统中相似度的概念。

定义3  不完备信息系统IIS=(U, AT, V, f)。U={x1, x2, …, xn}为n个对象的集合,A={a1, a2, …, am}为m个属性的集合。∀xi, xj, 由ai确定的相似度关系Sai(xi, xj)为

(4)

式中:|Vai|表示在属性ai上值域元素的个数。

任意两个对象xixj的相似度S(xi, xj)为

(5)

定义4  不完备信息系统IIS=(U, AT, V, f)。∀L∈ [0, 1],相似关系SRAL为SRAL-截集,其中L称为阈值或置信水平,即

(6)

对于每一个xi的等价类[xi]SRL=Uxi{xj |S(xi, xj)≥L },其中SIAL是自反的、对称的,但不是传递的。其中,L的值可以看作决策偏好的粒度,一个较高的值代表了一个较强的不可分辨关系。特别地,如果L=1,即有,此时,ai(x)=ai(y) ≠*。在这种情况下,基于L-截集的相似关系转化为等价类。如果L=0,即有,此时,ai(x) ≠ ai(y), ai(x) ≠ *, ai(y) ≠*, xixj

根据相似度的定义(5),基于L-截集相似关系(6),我们定义在IIS中的两个近似和3个决策区域。

定义5  不完备信息系统IIS=(U, AT, V, f)。∀xU,令0 < βα≤1,基于L-截集相似关系的下、上近似为

(7)
(8)

相对应的3个决策区域分别为

(9)
2.3 整数值排序法

整数值排序法是通过把模糊数直接转化成单个实数,然后依据实数大小来判定模糊数的次序。这种排序方法,涉及到决策者的风险偏好。根据Kumar A[26]的研究结论,三角模糊数r(a)的排序函数为

(10)

式中:ρ是决策者的风险偏好指数,反映出决策者的乐观程度。在式(10)中ρ值越大意味着决策者越乐观,即悲观决策者会高估损失值,而乐观决策者则会低估损失值。特别地,当ρ=0和ρ=1时,r(a)的值分别代表了悲观决策者和乐观决策者的观点。

2.4 基于IIS的三角模糊数决策粗糙集的模型实现

根据贝叶斯决策过程,运用三角模糊数,不同状态对应的三角模糊数损失值如表 1所示。

表 1 不同状态下对应的三角模糊数损失值 Table 1 The triangular fuzzy numbers loss values of different states
X(P) ﹁X(P)
ap λPP=(lPPmPPuPP) λPN=(lPNmPNuPN)
aB λBP=(lBPmBPuBP) λBN=(lBNmBNuBN)
aN λNP=(lNPmNPuNP) λNN=(lNNmNNuNN)

表 1中,λPP=(lPP, mPP, uPP)、λBP=(lBP, mBP, uBP)、λNP=(lNP, mNP, uNP)分别表示当x属于X时,采取行动aPaBaN下的损失;用λPN=(lPN, mPN, uPN)、λBN=(lBN, mBN, uBN)、λNN=(lNN, mNN, uNN)分别表示当x不属于X时,采取行动aPaBaN下的损失。根据决策粗糙集的基本条件,假定损失值满足以下条件:

因此采取aPaBaN 3种行动下的期望损失可分别表示为

(11)

根据贝叶斯决策准则,需要选择期望损失最小的行动集作为最佳行动方案,于是可得到如下3条决策规则:

P1)若R(aP|[x])≤R(aB|[x])和R(aP|[x])≤R(aN|[x])同时成立,那么x∈POS(X);

B1)若R(aB|[x])≤R(aP|[x])和R(aB|[x])≤R(aN|[x])同时成立,那么x∈BND(X);

N1)若R(aN|[x])≤R(aP|[x])和R(aN|[x])≤R(aB|[x])同时成立,那么x∈NEG(X)。

在本文,我们选取整数值排序方法来研究三角模糊数决策粗糙集。基于式(10),各期望损失值可以分别计算得到

其中

故得到如下3条决策规则:

P2)若r(R(aP|[x]SRL))≤r(R(aB|[x]SRL))和r(R(aP|[x]SRL))≤r(R(aN|[x]SRL))同时成立,那么x∈POS(X);

B2)若r(R(aB|[x]SRL))≤r(R(aP|[x]SRL))和r(R(aB|[x]SRL))≤r(R(aN|[x]SRL))同时成立,那么x∈BND(X);

N2)若r(R(aN|[x]SRL))≤r(R(aP|[x]SRL))和r(R(aN|[x]SRL))≤r(R(aB|[x]SRL))同时成立,那么x∈NEG(X)。

由此,可推导出三角模糊数决策粗糙集的3个阈值,其结果为

(12)

考虑到决策者的风险态度,基于决策粗糙集依次提出乐观决策模型、中性决策模型和悲观决策模型。类似于Li、Zhou的思想[10],在整数值排序方法中决策者的风险态度指数是三角模糊数排序的重要要素,它会影响到阈值的取值。特别地,当ρ=1,对于乐观决策者,其阈值可以表达为

ρ=0,对于悲观决策者,其阈值可以表达为

鉴于Yao[27]的讨论结果,首先考虑决策规则(B)中存在α>β的情况,即

该条件蕴含着0≤β < α≤1,此时,通过权衡可以得到以下简化规则。

P′2)若Pr(X|[x]SRL)≥α,则x∈POS(X);

B′2)若β < Pr(X|[x]SRL) < α,则x∈BND(X);

N′2)若Pr(X|[x]SRL)≤β,则x∈NEG(X)。

对于乐观决策者,此时ρ=1,所对应的三支决策规则为

OP′2)若Pr(X|[x]SRL)≥α,则x∈POS(X);

OB′2)若β < Pr(X|[x]SRL) < α,则x∈BND(X);

ON′2)若Pr(X|[x]SRL)≤β,则x∈NEG(X)。

对于悲观决策者,此时ρ=0,所对应的三支决策规则为

PP′2)若Pr(X|[x]SRL)≥α,则x∈POS(X);

PB′2)若β < Pr(X|[x]SRL) < α,则x∈BND(X);

PN′2)若Pr(X|[x]SRL)≤β,则x∈NEG(X)。

此外,为了保证研究的完备性,决策规则(B)还有另一种情况,即:

该条件蕴含着0≤α < γ < β≤1,此时,通过权衡可以得到以下简化规则:

P3)若Pr(X|[x]SRL)≥γ,则x∈POS(X);

N3)若Pr(X|[x]SRL)≤γ,则x∈NEG(X)。

3 案例分析

医学诊断是一种根据病人现有症状来判断所得疾病类列的决策过程,在下面的讨论中,以医学流感诊断决策表S= < U, A=CD >为例[19],来说明基于IIS的三角模糊数决策粗糙集决策过程。U={x1, x2, x3, x4, x5, x6, x7, x8, x9, x10}分别是10位病人的编号,条件属性集C={a1, a2, a3, a4, a5, a6, a7}分别表示以上病人的7种症状:温度、咳嗽、流鼻涕、头疼、恶心、有痰、肌肉疼。决策属性集D={X, ﹁ X},其中X表示病人患有流感,﹁ X表示病人没有患有流感。病人患病的实际情况如表 2

表 2 病人患病的实际情况 Table 2 The status of the illness patients
U a1 a2 a3 a4 a5 a6 a7
x1 1 1 * 1 1 1 3
x2 3 2 2 3 2 2 *
x3 2 * 2 2 1 2 2
x4 2 1 2 * 1 1 3
x5 2 1 1 2 1 * 2
x6 2 2 2 * 2 2 *
x7 1 1 2 1 * 2 3
x8 1 1 * 1 1 * 3
x9 2 1 1 1 1 1 *
x10 3 2 * 2 2 2 3

为描述方便,在表 2中,根据医生的经验,对每个属性所对应值的大小有如下定义:

温度a1:1代表高,2代表较高,3代表正常;

咳嗽a2:1代表是,2代表不是;

流鼻涕a3:1代表是,2代表不是;

头疼a4:1代表很严重,2代表有点严重,3代表不严重;

恶心a5:1代表是,2代表不是;

有痰a6:1代表有,2代表没有;

肌肉疼a7:1代表很严重,2代表有点严重,3代表不严重,*代表缺失值。

首先,根据医生的经验给出三角模糊数的损失区间,如表 3所示。然后,根据式(4),计算对象U中任意两位患者xi, xj的相似度,结果如表 4所示。

表 3 病人的综合评估损失情况 Table 3 Comprehensive assessment of the patient's losses
U λPP λBP λNP λPN λBN λNN
x1 [0, u, 1.5u] [2u, 3u, 3.5u] [4u, 5u, 7u] [u1.5u, 2u] [2.5u, 3u, 4.5u] [5u, 7u, 8u]
x2 [3u, 3.2u, 3.5u] [4u, 5u, 5.5u] [6u, 6.5u, 7.5u] [0, u, 2u] [2u, 3u, 3.5u] [4u, 6u, 7u]
x3 [u, 2u, 3.5u] [3.5u, 4u, 4.5u] [4.5u, 5u, 6u] [0.5u, u, 2u] [2.5u, 3u, 4u] [4.5u, 5u, 7.5u]
x4 [u, 2u, 2.5u] [3u, 3.5u, 4u] [5u, 6u, 7.5u] [u, 2u, 3u] [3.5u, 4u, 5u] [5.5u, 6u, 7u]
x5 [0.5u, u, 1.5u] [2u, 3u, 4u] [4.5u, 5u, 6.5u] [1.5u, 2u, 3u] [3.5u, 3.8u, 4u] [4.5u, 5u, 7u]
x6 [u, 2u, 3.5u] [3.5u, 4u, 5u] [5u, 6u, 7.5u] [0.5u, u, 2u] [2.5u, 3u, 4u] [2.5u, 3u, 4u]
x7 [u, 1.5u, 2u] [3u, 3.2u, 3.5u] [4.5u, 5u, 7u] [u, 2u, 3.5u] [4u, 5u, 6u] [6.5u, 6.8u, 7u]
x8 [0.5u, u, 1.5u] [2u, 3u, 3.5u] [4u, 5u, 7.5u] [1.5u, 2u, 3u] [4u, 5u, 5.5u] [6u, 7u, 7.5u]
x9 [0, u, 1.5u] [2u, 3u, 4u] [5u, 6u, 7u] [u, 2u, 3.5u] [4u, 4.2u, 4.5u] [5u, 6u, 7.5u]
x10 [3u, 3.5u, 4u] [4.5u, 5u, 5.5u] [6u, 6.5u, 7u] [0.5u, u, 2u] [2.5u, 3u, 3.5u] [4u, 5u, 6u]

表 4 各个病人之间相似度表示 Table 4 The similarity between the individual patient
S(xi, xj) x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
x1 1.00 0.14 0.28 0.69 0.43 0.19 0.71 0.85 0.64 0.28
x2 0.14 1.00 0.42 0.26 0.14 0.69 0.42 0.21 0.14 0.64
x3 0.28 0.42 1.00 0.55 0.71 0.62 0.43 0.36 0.43 0.50
x4 0.69 0.26 0.55 1.00 0.55 0.40 0.55 0.62 0.62 0.33
x5 0.43 0.14 0.71 0.55 1.00 0.33 0.28 0.43 0.64 0.36
x6 0.19 0.69 0.62 0.40 0.33 1.00 0.79 0.26 0.19 0.55
x7 0.71 0.42 0.43 0.55 0.28 0.48 1.00 0.79 0.36 0.50
x8 0.85 0.21 0.36 0.32 0.43 0.26 0.79 1.00 0.57 0.36
x9 0.64 0.14 0.43 0.62 0.64 0.19 0.36 0.57 1.00 0.21
x10 0.28 0.64 0.50 0.36 0.36 0.55 0.50 0.36 0.21 1.00

表 3中,令L=0.5+ε(ε是正的无穷小数),基于相似度可得xi的等价类:

根据医生的经验,集合X={x1, x4, x5, x7, x8}时,这些患者得流感的概率相对较高。根据表 2,每位患者得流感的条件概率如下:

根据2.2节整数排序法的三角模糊数r(a)的排序函数式(10),当ρ=0和ρ=1时,r(a)的值分别代表悲观决策者和乐观决策者的观点。根据式(12)可得各个病人的三角模糊数决策粗糙集相关阈值,计算结果如表 5所示。

表 5 各个病人的相关阈值计算结果 Table 5 The associated threshold value of each patient's
U 乐观决策者 悲观决策者
α1 β1 γ1 α1 β1 γ1
x1 0.619 0 0.571 4 0.542 9 0.652 2 0.421 1 0.547 6
x2 0.428 6 0.428 6 0.588 2 0.631 1 0.500 0 0.578 0
x3 0.533 3 0.433 3 0.551 7 0.647 1 0.615 4 0.633 3
x4 0.666 7 0.666 7 0.515 2 0.571 4 0.400 0 0.470 6
x5 0.500 0 0.500 0 0.428 6 0.482 8 0.383 6 0.437 5
x6 0.457 8 0.457 8 0.500 0 0.631 6 0.470 6 0.555 6
x7 0.533 3 0.533 3 0.595 4 0.466 7 0.509 3 0.494 0
x8 0.645 2 0.645 2 0.558 8 0.500 0 0.478 3 0.487 2
x9 0.578 9 0.578 9 0.444 4 0.516 1 0.347 8 0.432 4
x10 0.464 3 0.464 3 0.555 6 0.600 0 0.538 5 0.571 4

表 5列出了每位病人在风险偏好者决策准则、风险厌恶者决策准则下,αβγ的取值情况。可以看出,α2α1取值普遍大,β2β1取值普遍小,这说明悲观主义者厌恶风险,它通过较大的α值和较小的β值避免生病被延误的概率;而乐观主义者偏好风险,它通过较小的α值和较大的β值获取无病的概率。

根据三角模糊数决策粗糙集中的决策规则,在决策判定过程中需要比较条件概率Pr(X|[xi]SRL)和阈值αiβi的大小。当L=0.5+ε时,乐观决策者和悲观决策者的决策结果如表 6所示。

表 6 决策结果 Table 6 the decision results
U 乐观决策者 悲观决策者
x1 POS(X) POS(X)
x2 NEG(X) NEG(X)
x3 BND(X) NEG(X)
x4 POS(X) POS(X)
x5 POS(X) POS(X)
x6 NEG(X) NEG(X)
x7 POS(X) POS(X)
x8 POS(X) POS(X)
x9 POS(X) POS(X)
x10 NEG(X) NEG(X)

表 6可以看出,在乐观决策者看来,{x1, x4, x5, x7, x8, x9}∈POS(X),{x2, x6, x10}∈NEG(X),{x3}∈ BND(X)。但在悲观决策者看来,{x1, x4, x5, x7, x8, x9∈POS(X),{x2, x3, x6, x10}∈NEG(X)。通过与X={x1, x4, x5, x7, x8}对比可以发现,x3不是诱发患者患病的主要因素,但对于乐观决策者来说,还需对它进行进一步的诊断。x9也不是诱发患者患病的主要因素,但乐观决策者和悲观决策者认为都需要进一步的诊断。因此,决策粗糙集能为现实的决策系统提供了一种修正误分类错误的方法。

在上述实例中,我们求得的相似关系及条件概率是在L=0.5+ε的基础上进行讨论的。下面我们将探讨L∈ [0.5, 1],步长0.1时,与之相对应的乐观决策者和悲观决策者的决策,结果如表 7所示。

表 7 L取不同的值所对应的决策结果 Table 7 The different decision results corresponding to L values
L 乐观决策者 悲观决策者
0.5 POS(X) x1, x4, x5, x7, x8, x9 x1, x4, x5, x7, x8, x9
NEG(X) x2, x6, x10 x2, x3, x6, x10
BND(X) x3
0.6 POS(X) x1, x4, x7, x8, x9 x1, x4, x7, x8, x9
NEG(X) x2, x3, x5, x6, x10 x2, x3, x5, x6, x10
BND(X)
0.7 POS(X) x1, x4, x5, x7, x8 x1, x4, x5, x7, x8
NEG(X) x2, x9, x10 x2, x9, x10
BND(X) x3, x6 x3, x6
0.8 POS(X) x1, x4, x5, x7, x8 x1, x4, x5, x7, x8
NEG(X) x2, x3, x6, x9, x10 x2, x3, x6, x9, x10
BND(X)
0.9 POS(X) x1, x4, x5, x7, x8 x1, x4, x5, x7, x8
NEG(X) x2, x3, x6, x9, x10 x2, x3, x6, x9, x10
BND(X)
1.0 POS(X) x1, x4, x5, x7, x8 x1, x4, x5, x7, x8
NEG(X) x2, x3, x6, x9, x10 x2, x3, x6, x9, x10
BND(X)

表 7可以看出,随着决策偏好的粒度L的变化,决策者的选择会有一定的变化。当L=0.7时,乐观决策者和悲观决策者认为x3x6需要进一步的诊断,才能确诊。然而当L≥0.8时,乐观决策者和悲观决策者认为x3x6不需要进一步诊断,即可视为无患病者。且随着粒度的增大,决策者的决策趋于稳定的状态。

在IIS中,基于已给出的相似关系及已求得的条件概率,取三角模糊数的端点值作为区间值,将基于不完备信息系统的三角模糊数决策粗糙集与文献[17]中的区间决策粗糙集方法作对比,在测试数据集上进行实验,根据文献[17]可得相对应的各个病人的相关阈值,乐观和悲观决策者的决策结果,及当L∈ [0.5, 1],步长0.1时,随着L粒度的变化,与之对应的乐观和悲观决策者的决策,结果如表 8~10所示。

表 8 各个病人的相关阈值计算结果 Table 8 The associated threshold value of each patient's
U 乐观决策者 悲观决策者
α1 β1 γ1 α1 β1 γ1
x1 0.500 0 0.250 0 0.400 0 0.500 0 0.250 0 0.333 3
x2 0.833 3 0.333 3 0.583 3 0.833 3 0.333 3 0.625 0
x3 0.285 7 0.500 0 0.333 3 0.285 7 0.500 0 0.470 3
x4 0.666 7 0.555 6 0.600 0 0.666 7 0.555 6 0.500 0
x5 0.566 7 0.800 0 0.554 5 0.566 7 0.800 0 0.600 0
x6 0.574 2 0.500 0 0.533 3 0.574 2 0.500 0 0.666 7
x7 0.855 6 0.666 7 0.611 1 0.855 6 0.666 7 0.400 0
x8 0.250 0 0.200 0 0.222 2 0.250 0 0.200 0 0.350 0
x9 0.872 9 0.750 0 0.636 3 0.872 9 0.750 0 0.571 4
x10 0.333 3 0.142 8 0.200 0 0.333 3 0.142 8 0.333 3

表 9 决策结果 Table 9 The decision results
U 乐观决策者 悲观决策者
x1 POS(X) POS(X)
x2 NEG(X) NEG(X)
x3 POS(X) POS(X)
x4 POS(X) POS(X)
x5 BND(X) NEG(X)
x6 NEG(X) NEG(X)
x7 POS(X) POS(X)
x8 POS(X) POS(X)
x9 POS(X) POS(X)
x10 NEG(X) NEG(X)

表 10 L取不同的值所对应的决策结果 Table 10 The different decision results corresponding to L values
L 乐观决策者 悲观决策者
0.5 POS(X) x1, x3, x4, x7, x8, x9 x1, x3, x4, x7, x8, x9
NEG(X) x2, x6, x10 x2, x5, x6, x10
BND(X) x5
0.6 POS(X) x1, x4, x5, x7, x8, x9 x1, x4, x5, x7, x8, x9
NEG(X) x2, x6, x10 x2, x3, x6, x10
BND(X) x3
0.7 POS(X) x1, x4, x7, x8, x9 x1, x3, x4, x5, x7, x8
NEG(X) x2, x6, x10 x2, x6, x10
BND(X) x3, x5 x9
0.8 POS(X) x1, x4, x5, x7, x8, x9 x1, x4, x5, x7, x8, x9
NEG(X) x2, x3, x6, x10 x2, x3, x6, x10
BND(X)
0.9 POS(X) x1, x4, x5, x7, x8, x9 x1, x4, x5, x7, x8, x9
NEG(X) x2, x3, x6, x10 x2, x3, x6, x10
BND(X)
1.0 POS(X) x1, x4, x5, x7, x8, x9 x1, x4, x5, x7, x8, x9
NEG(X) x2, x3, x6, x10 x2, x3, x6, x10
BND(X)

表 9可以看出,取区间值作为基础数据集时,在乐观决策者看来,{x1, x3, x4, x7, x8, x9}∈POS(X),{x2, x6, x10}∈NEG(X),{x5}∈BND(X)。但在悲观决策者看来,{x1, x3, x4, x7, x8, x9}∈POS(X),{x2, x5, x6, x10}∈NEG(X)。通过与表 6及集合X={x1, x4, x5, x7, x8}得流感的概率相对较高的患者对比可以发现,x5是诱发患者患病的主要因素,但是悲观决策者认为不需要进一步的诊断。而x3不是诱发患者患病的主要因素,但是对于取区间值的乐观决策者和悲观决策者来说,都需对它进行进一步的诊断。

表 10可以看出,当L≥0.8时,乐观和悲观决策者的决策结果趋于稳定,其中x9不是诱发患者患病的主要因素,但是对于取区间值的乐观和悲观决策者来说,都需对它进行进一步的诊断。与采用三角模糊数方法相比,采用区间值分析与实际经验值会产生较大的误差。

4 结束语

本文基于IIS,从决策粗糙集出发,利用三角模糊数来设定损失函数,首先提出一种描述不完备信息的相似关系。然后,针对IIS中缺失值,借助三角模糊数的运算法则,利用三角模糊数来获取损失函数,构建出三角模糊数决策粗糙集的基础模型。通过实例可知,不同于区间数决策粗糙集的决策机制,利用三角模糊数来获取损失函数,不仅能弥补使用区间参数时无法考虑区间内取值机会不等的问题,而且能更加细致地描述各个参量,使决策结果更加符合实际应用。下一个阶段,将着重研究其他不确定环境下相应的扩展粗糙集模型的建立,如损失函数是随机数且服从正态分布等情况下的研究。

参考文献
[1] 王国胤. Rough集理论在不完备信息系统中的扩充[J]. 计算机研究与发展 , 2002, 39 (10) : 1238-1243 WANG Guoyin. Extension of rough set under incomplete information systems[J]. Journal of computer research and development , 2002, 39 (10) : 1238-1243
[2] GRZYMALA-BUSSE J W. On the unknown attribute values in learning from examples[C]//RAS Z W, ZEMANKOVA M. Proceedings of the 6th International Symposium on Methodologies for Intelligent Systems (ISMIS-91). Berlin, Heidelberg:Springer-Verlag, 1991, 542:368-377. http://link.springer.com/chapter/10.1007/3-540-54563-8_100
[3] KRYSZKIEWICZ M. Rough set approach to incomplete information systems[J]. Information sciences , 1988, 112 (1/2/3/4) : 39-49
[4] 杨习贝, 杨静宇, 於东军, 等. 不完备信息系统中的可变精度分类粗糙集模型[J]. 系统工程理论与实践 , 2008, 28 (5) : 116-121 YANG Xibei, YANG Jingyu, YU Dongjun, et al. Rough set model based on variable parameter classification in incomplete information systems[J]. Systems engineering-theory & practice , 2008, 28 (5) : 116-121
[5] GRZYMALA-BUSSE J W, WANG A Y. Modified algorithms LEM1 and LEM2 for rule induction from data with missing attribute values[C]//Proceeding of the Fifth International Workshop on Rough Sets and Soft Computing (RSSC'97) at the Third Joint Conference on Information Sciences (JCIS'97). Research Triangle Park, NC, 1997:69-72.
[6] STEFANOWSKI J, TSOUKIàS A. Incomplete information tables and rough classification[J]. Computational intelligence , 2001, 17 (3) : 545-566 DOI:10.1111/coin.2001.17.issue-3
[7] YAO Y Y, WONG S K M. A decision theoretic framework for approximating concepts[J]. International journal of man-machine studies , 1922, 37 (6) : 793-809
[8] 贾修一, 商琳, 陈家骏. 决策风险最小化属性约简[J]. 计算机科学与探索 , 2011, 5 (2) : 155-160 JIA Xiuyi, SHANG Lin, CHEN Jiajun. Attribute reduction based on minimum decision cost[J]. Journal of frontiers of computer science & technology , 2011, 5 (2) : 155-160
[9] 于洪, 王国胤, 姚一豫. 决策粗糙集理论研究现状与展望[J]. 计算机学报 , 2015, 38 (8) : 1628-1639 YU Hong, WANG Guoyin, YAO Yiyu. Current research and future perspectives on decision-theoretic rough sets[J]. Chinese journal of computers , 2015, 38 (8) : 1628-1639
[10] LI Huaxiong, ZHOU Xianzhong. Risk decision making based on decision-theoretic rough set:a three-way view decision model[J]. International journal of computational intelligence systems , 2011, 4 (1) : 1-11 DOI:10.1080/18756891.2011.9727759
[11] 衷锦仪, 叶东毅. 基于模糊数风险最小化的拓展决策粗糙集模型[J]. 计算机科学 , 2014, 41 (3) : 50-54 ZHONG Jinyi, YE Dongyi. Extended decision-theoretic rough set models based on fuzzy minimum cost[J]. Computer science , 2014, 41 (3) : 50-54
[12] LIU Dun, LI Huaxiong, ZHOU Xianzhong. Two decades'research on decision-theoretic rough sets[C]//Proceeding of the 9th IEEE International Conference on Cognitive Informatics. Beijing:IEEE, 2010:968-973. https://www.researchgate.net/profile/Dun_Liu2/publication/221471126_Two_decades'research_on_decision-theoretic_rough_sets/links/0deec51695d1584107000000.pdf
[13] 李华雄, 刘盾, 周献中. 决策粗糙集模型研究综述[J]. 重庆邮电大学学报:自然科学版 , 2010, 22 (5) : 624-630 LI Huaxiong, LIU Dun, ZHOU Xianzhong. Rewiew on decision-theoretic rough set model[J]. Journal of Chongqing university of posts and telecommunications:natural science edition , 2010, 22 (5) : 624-630
[14] 李华雄, 周献中, 李天瑞, 等. 决策粗糙集理论及其研究进展[M]. 北京: 科学出版社, 2011 . LI Huaxiong, ZHOU Xianzhong, LI Tianrui, et al. Decision-theoretic rough sets theory and recent research[M]. Beijing: Science Press, 2011 .
[15] 刘盾, 姚一豫, 李天瑞. 三枝决策粗糙集[J]. 计算机科学 , 2011, 38 (1) : 246-250 LIU Dun, YAO Yiyu, LI Tianrui. Three-way decision-theoretic rough sets[J]. Computer science , 2011, 38 (1) : 246-250
[16] LIANG Decui, PEDRYCZ W, LIU Dun, et al. Three-way decisions based on decision-theoretic rough sets under linguistic assessment with the aid of group decision making[J]. Applied soft computing , 2015, 29 : 256-269 DOI:10.1016/j.asoc.2015.01.008
[17] 刘盾, 李天瑞, 李华雄. 区间决策粗糙集[J]. 计算机科学 , 2012, 39 (7) : 178-181 LIU Dun, LI Tianrui, LI Huaxiong. Interval-valued decision-theoretic rough sets[J]. Computer science , 2012, 39 (7) : 178-181
[18] 马兴斌, 鞠恒荣, 杨习贝, 等. 不完备信息系统中的多重代价决策粗糙集[J]. 南京大学学报:自然科学版 , 2015, 51 (2) : 335-342 MA Xingbin, JU Hengrong, YANG Xibei, et al. Multi-cost based decision-theoretic rough sets in incomplete information systems[J]. Journal of Nanjing university:natural sciences , 2015, 51 (2) : 335-342
[19] LIU Dun, LIANG Decui, WANG Changchun. A novel three-way decision model based on incomplete information system[J]. Knowledge-based systems , 2016, 91 : 32-45 DOI:10.1016/j.knosys.2015.07.036
[20] YAO Y Y, WONG S K M. A decision theoretic framework for approximating concepts[J]. International journal of man-machine studies , 1992, 37 (6) : 793-809 DOI:10.1016/0020-7373(92)90069-W
[21] YAO Yiyu. Decision-theoretic rough set models[M]//YAO Jingtao, LINGRAS P, WU Weizhi, et al. Rough Sets and Knowledge Technology. Berlin Heidelberg:Springer, 2007, 4481:1-12.
[22] 唐国春. 模糊排序中的面积模糊度[J]. 上海第二工业大学学报 , 1999, 16 (2) : 48-55 TANG Guochun. The area degree of fuzziness in fuzzy scheduling[J]. Journal of Shanghai second polytechnic university , 1999, 16 (2) : 48-55
[23] KRYSZKIEWICZ M. Rough set approach to incomplete information systems[J]. Information sciences , 1998, 112 (1/2/3/4) : 39-49
[24] KAUFMAN A, GUPTA M M. Introduction to fuzzy arithmetic:theory and application[M]. New York: Van Nostrand Reinhold, 1985 .
[25] 陈圣兵, 李龙澍, 纪霞, 等. 不完备信息系统中基于集对相似度的粗集模型[J]. 计算机科学 , 2010, 37 (7) : 186-190 CHEN Shengbing, LI Longshu, JI Xia, et al. Extension of rough set model based on SPA similarity degree in incomplete information systems[J]. Computer science , 2010, 37 (7) : 186-190
[26] KUMAR A, SINGH P, KAUR A, et al. A new approach for ranking of L-R type generalized fuzzy numbers[J]. Expert systems with applications , 2011, 38 (9) : 10906-10910 DOI:10.1016/j.eswa.2011.02.131
[27] YAO Yiyu. The superiority of three-way decisions in probabilistic rough set models[J]. Information sciences , 2011, 181 (6) : 1080-1096 DOI:10.1016/j.ins.2010.11.019
DOI: 10.11992/tis.201606016
中国人工智能学会和哈尔滨工程大学联合主办。
0

文章信息

李亚鸽, 杨宏志, 徐久成
LI Yage, YANG Hongzhi, XU Jiucheng
基于不完备信息系统的三角模糊数决策粗糙集
Triangular fuzzy number decision-theoretic rough sets under incomplete information systems
智能系统学报, 2016, 11(4): 449-458
CAAI Transactions on Intelligent Systems, 2016, 11(4): 449-458
http://dx.doi.org/10.11992/tis.201606016

文章历史

收稿日期: 2016-06-03
网络出版日期: 2016-08-08

相关文章

工作空间