混合决策信息系统的模糊效用三支决策模型

引用本文

岳文琦, 张楠, 童向荣, 等. 混合决策信息系统的模糊效用三支决策模型[J]. 郑州大学学报(理学版), 2020, 52(1): 24-32.

YUE Wenqi, ZHANG Nan, TONG Xiangrong, et al. Fuzzy Utility Three-way Decisions Model in Hybrid Decision Information Systems[J]. Journal of Zhengzhou University(Natural Science Edition), 2020, 52(1): 24-32.

基金项目

国家自然科学基金项目(61572418, 61572419, 11801491);山东省自然科学基金项目(ZR2018BA004)

通信作者

张楠(1979—), 男, 山东烟台人, 讲师, 主要从事粗糙集、粒计算与人工智能模型研究, E-mail:zhangnan0851@163.com

作者简介

岳文琦(1995—), 女, 山东泰安人, 硕士研究生, 主要从事三支决策模型研究, E-mail:woshiyuewenqi@163.com

文章历史

收稿日期：2019-04-23

Contents Abstract Full text Figures/Tables PDF

混合决策信息系统的模糊效用三支决策模型

岳文琦^1,2, 张楠^1,2, 童向荣^1,2, 张中喜^1,2

1. 烟台大学计算机与控制工程学院山东烟台 264005;
2. 烟台大学数据科学与智能技术山东省高校重点实验室山东烟台 264005

收稿日期：2019-04-23

基金项目：国家自然科学基金项目(61572418, 61572419, 11801491);山东省自然科学基金项目(ZR2018BA004)

作者简介：岳文琦(1995—), 女, 山东泰安人, 硕士研究生, 主要从事三支决策模型研究, E-mail:woshiyuewenqi@163.com.

通信作者：张楠(1979—), 男, 山东烟台人, 讲师, 主要从事粗糙集、粒计算与人工智能模型研究, E-mail:zhangnan0851@163.com.

摘要：在混合决策系统中提出模糊效用三支决策模型和两种启发式算法。在模糊效用三支决策模型中提出正域分布保持属性约简算法, 扩展了效用三支决策模型的属性约简算法研究。首先结合混合距离概念与高斯核模糊T-等价关系, 构造相应的模糊条件概率, 然后使用效用函数为不同决策类生成概率阈值划分论域, 最后提出最大效用启发式属性约简算法和正域分布保持的启发式属性约简算法。

关键词：混合决策信息系统三支决策模型效用理论模糊集

Fuzzy Utility Three-way Decisions Model in Hybrid Decision Information Systems

YUE Wenqi^1,2, ZHANG Nan^1,2, TONG Xiangrong^1,2, ZHANG Zhongxi^1,2

1. School of Computer and Control Engineering, Yantai University, Yantai 264005, China;
2. Key Lab for Data Science and Intelligence Technology of Shandong Higher Education Institutes, Yantai University, Yantai 264005, China

Abstract: The existing utility-based three-way decisions models cannot process the hybrid data and retain preserve positive region unchanged. An attribute reduction algorithm for positive region distribution preservation was proposed in a fuzzy utility three-way decisions model, which was regarded as an extension work of attribute reduction for utility three-way decisions. Firstly, based on the hybrid distance concept and Gaussian kernel fuzzy T-equivalence relation, the fuzzy conditional probability was constructed. Secondly, the universe was divided by the probability threshold, which was calculated by the utility function. Finally, heuristic attribute reduction algorithms for positive region distribution preservation and the maximal utility were proposed.

Key words: hybrid decision information systems three-way decisions model utility theory fuzzy sets

0 引言

三支决策模型^[1-2]是Yao等基于决策粗糙集理论模型并结合实际决策情况扩展的分类决策, 相对于经典的粗糙集模型^[3]提高了容错率, 较二支决策更符合人们日常决策行为。三支决策模型已得到诸多学者的完善与发展^[4-13], 在数据挖掘、集成学习和信息处理等众多研究领域^[14-17]得到广泛应用。文献[18]提出序贯三支决策模型的代价敏感分类方法。文献[19]提出了基于三角范数和三角余模的半三支决策空间到三支决策空间的转换方法。文献[20]提出基于行动的三支决策的有效性度量。文献[21]将期望效用理论引入三支决策模型, 提出效用三支决策模型。三支决策模型中属性约简算法主要有代价敏感近似属性约简算法^[22]、风险最小化属性约简算法^[23]、正域最大化属性约简算法及定性和定量属性约简算法^[24]。

混合决策信息系统中存在实值型、布尔型和类别型等混合类型数据, 现有的三支决策模型不能处理混合类型数据。本文提出的模糊效用三支决策模型补充了三支决策模型在处理混合类型数据方面的空缺。该模型在混合决策信息系统中使用混合距离函数^[25]处理混合属性, 用高斯核函数定义决策表属性集的模糊T-等价关系, 然后构造相应的模糊条件概率, 使用效用函数构造概率阈值划分论域。本文在模糊效用三支决策模型中提出正域分布保持和最大效用属性约简算法。正域分布保持属性约简算法以保证约简前后不改变决策表正域为约简目标, 可以求出不改变所有决策类正域的约简; 最大效用属性约简算法以追求决策者最大满意程度为约简目标, 可求出比决策表属性集更大的约简。近似分类质量实验表明正域分布保持启发式算法属性约简前后不改变决策表正域。J48正确分类率对比实验表明本文提出的两种算法高于文献[21]和文献[23]算法分类正确率; 算法运行时间实验比较三种不同决策态度中两种算法的运行效率; 约简效用表明最大效用启发式算法可以在混合决策信息系统中找到比决策表属性集更大效用的约简。

1 基本概念 1.1 混合决策信息系统

存在多种类型数据的信息系统或决策系统, 称为混合决策信息系统。本节主要介绍混合决策信息系统和混合距离函数定义。

混合决策信息系统HIS=(U, AT=C∪D, V, f), 其中：U表示对象的集合；AT表示属性的集合；C表示混合条件属性的集合；D表示决策属性集合；V表示属性值的集合；f:U×AT→V是一个信息函数, 是对象到混合属性值关系的映射。

定义1^[25] 给定混合决策信息系统HIS=(U, AT=C∪D, V, f), C={a₁, a₂, …, a_n}, n=C, ∀x, y∈U, a(x), a(y)∈V, 混合距离函数HD(x, y)定义为

$ HD\left( {x, y} \right) = \sqrt {\sum\limits_{i = 1}^n {{d^2}} \left( {{a_i}\left( x \right), {a_i}\left( y \right)} \right)} , $

$ 其中:\mathit{d} = \left\{ \begin{array}{l} \mathit{VDM}(a(x), a(y)) = \sqrt {\frac{1}{{|U/D|}}\sum\limits_{{x_i} = U/D} {{{\left( {\frac{{\left| {a(x) \cap {X_i}} \right|}}{{|a(x)|}} - \frac{{\left| {a(y) \cap {X_i}} \right|}}{{|a(y)|}}} \right)}^2}} } , a是类别型属性;\\ \mathit{VDR}(a(x), a(y)) = \frac{{|a(x) - a(y)|}}{{4{\delta _a}}}, a是实值型属性, {\delta _a}是a下所有属性值的标准差;\\ \mathit{VDB}(a(x), a(y)) = \left\{ {\begin{array}{*{20}{c}} {0, a(x) = a(y)}\\ {1, a(x) \ne a(y)} \end{array}} \right., a是布尔型属性. \end{array} \right. $

定义2^[26-28] 给定混合决策信息系统HIS=(U, AT=C∪D, V, f), ∀x, y∈U, 对于∀A⊆C, 对象x和y之间的模糊关系用高斯核函数定义为

$ {\mu _A}\left( {x, y} \right) = \exp \left( { - \frac{{HD{{\left( {x, y} \right)}^2}}}{{2{\sigma ^2}}}} \right), $

μ_A(x, y)反映了论域中的对象x和y对于属性集A的隶属程度, σ²的值由专家经验给定。

1.2 效用三支决策模型

效用是决策者在决策活动中对于决策后果的偏好^[29], 假定决策者对备择选项带来的效用进行预期, 则决策者的最终决策目标为最大化期望效用。

给定状态集Ω={X, X^c}, X表示对象x属于决策类, X^c表示对象x不属于决策类, 决策方案A′={α_P, α_B, α_N}, α_P表示判定对象x属于正域, α_B表示判定对象x属于边界域, α_N表示判定对象x属于负域。在不同状态下采取不同的决策方案的效用值如表 1^[21]所示。

表 1 效用函数 Tab. 1 The utility function

2 模糊效用三支决策模型

本节结合模糊概念和决策者的主观效用, 提出一种新的模糊效用三支决策模型, 在该模型中提出两个约简目标(最大效用和正域分布保持)。

2.1 期望效用决策规则

期望效用决策规则以追求决策者最大满意程度为决策目标, 通过贝叶斯风险决策过程, 获取决策规则, 选取效用值最大的决策方案进行决策。

定义3 给定混合决策信息系统HIS=(U, AT=C∪D, V, f), ∀x, y∈U, ∀A⊆C, 模糊隶属度函数为μ_A(x, y), 包含对象x的模糊类定义为

$ {\left[ x \right]_{{\mu _A}}} = \sum\limits_{y \in U} {{\mu _A}} \left( {x, y} \right)/y。$

定义4 给定混合决策信息系统HIS=(U, AT=C∪D, V, f), ∀x, y∈U, ∀A⊆C, 模糊隶属度函数为μ_A(x, y), U={x₁, x₂, …, x_|U|}, 决策类X∈U/D, 混合信息系统下的模糊条件概率定义为

$ P\left( {X\left| {{{\left[ x \right]}_{{\mu _A}}}} \right.} \right) = \sum\limits_{i = 1}^{\left| U \right|} {\left( {X \cap {{\left[ x \right]}_{{\mu _A}}}} \right)\left( {{x_i}} \right)} /\sum\limits_{i = 1}^{\left| U \right|} {{{\left[ x \right]}_{{\mu _A}}}\left( {{x_i}} \right)} 。$

P(X|[x]_{μ_A})表示模糊T-等价类[x]_{μ_A}被正确分类到X中的概率, 模糊类[x]_{μ_A}关于X的隶属度越高, x被划分到X中的概率越高；反之, 模糊类[x]_{μ_A}关于X的隶属度越低, x被划分到X中的概率越低。

决策者采取决策方案A′={α_P, α_B, α_N}产生的期望效用为定义5。

定义5 给定混合决策信息系统HIS=(U, AT=C∪D, V, f), ∀A⊆C, X∈U/D, 模糊类为[x]_{μ_A}, 采取三种决策方案α_P、α_B和α_N的期望效用分别为

$ \mathit{\Psi }\left( {{\alpha _P}\left| {{{\left[ x \right]}_{{\mu _A}}}} \right.} \right) = u\left( {{\lambda _{PP}}} \right)P\left( {X\left| {{{\left[ x \right]}_{{\mu _A}}}} \right.} \right) + u\left( {{\lambda _{PN}}} \right)P\left( {{X^C}\left| {{{\left[ x \right]}_{{\mu _A}}}} \right.} \right), $

$ \mathit{\Psi }\left( {{\alpha _B}\left| {{{\left[ x \right]}_{{\mu _A}}}} \right.} \right) = u\left( {{\lambda _{BP}}} \right)P\left( {X\left| {{{\left[ x \right]}_{{\mu _A}}}} \right.} \right) + u\left( {{\lambda _{BN}}} \right)P\left( {{X^C}\left| {{{\left[ x \right]}_{{\mu _A}}}} \right.} \right), $

$ \mathit{\Psi }\left( {{\alpha _N}\left| {{{\left[ x \right]}_{{\mu _A}}}} \right.} \right) = u\left( {{\lambda _{NP}}} \right)P\left( {X\left| {{{\left[ x \right]}_{{\mu _A}}}} \right.} \right) + u\left( {{\lambda _{NN}}} \right)P\left( {{X^C}\left| {{{\left[ x \right]}_{{\mu _A}}}} \right.} \right)。$

根据最大期望效用贝叶斯决策准则, 定义对象x划分到正域、边界域和负域的决策规则如定义6。

定义6 给定混合决策信息系统HIS=(U, AT=C∪D, V, f), ∀A⊆C, 决策类X∈U/D, 模糊类为[x]_{μ_A}, 对于∀x∈U决策规则为:

1) 若模糊条件概率满足P(X|[x]_{μ_A})≥α, 则判定x∈POS_A(X)；

2) 若模糊条件概率满足β < P(X|[x]_{μ_A}) < α, 则判定x∈BND_A(X)；

3) 若模糊条件概率满足P(X|[x]_{μ_A})≤β, 则判定x∈NEG_A(X)。

现实生活中, 决策者进行决策时，所有的决策结果产生的影响并不完全一致。信息系统中, 决策表中不同决策类也存在差异。针对决策表中每个决策类生成不同的概率阈值，划分论域、正域、边界域和负域及全部效用为定义7。

定义7 给定混合决策信息系统HIS=(U, AT=C∪D, V, f), 决策类集合U/D={X₁, X₂, …, X_m}, m=|U/D|, 0≤β < α≤1, 对于∀A⊆C, ∀X⊆U/D, 对象x划分到所有决策类X的正域、边界域和负域产生的正域效用、边界域效用和负域效用分别表示为

$ Utility_A^{POS} = \sum\limits_{i = 1}^m {\sum\limits_{x \in POS_A^{\left( {{\alpha _i}, {\beta _i}} \right)}\left( {{X_i}} \right)} P } \left( {{X_i}|{{[x]}_{{\mu _A}}}} \right) \cdot u\left( {{\lambda _{PP}}} \right) + \left( {1 - \left( {P\left( {{X_i}|{{[x]}_{{\mu _A}}}} \right)} \right) \cdot u\left( {{\lambda _{PN}}} \right)} \right., $

$ Utility_A^{BND} = \sum\limits_{i = 1}^m {\sum\limits_{x \in BND_A^{\left( {{\alpha _i}, {\beta _i}} \right)}\left( {{X_i}} \right)} P } \left( {{X_i}|{{[x]}_{{\mu _A}}}} \right) \cdot u\left( {{\lambda _{BP}}} \right) + \left( {1 - \left( {P\left( {{X_i}|{{[x]}_{{\mu _A}}}} \right)} \right) \cdot u\left( {{\lambda _{BN}}} \right)} \right., $

$ Utility_A^{NEG} = \sum\limits_{i = 1}^m {\sum\limits_{x \in NEG_A^{\left( {{\alpha _i}, {\beta _i}} \right)}\left( {{X_i}} \right)} P } \left( {{X_i}|{{[x]}_{{\mu _A}}}} \right) \cdot u\left( {{\lambda _{NP}}} \right) + \left( {1 - \left( {P\left( {{X_i}|{{[x]}_{{\mu _A}}}} \right)} \right) \cdot u\left( {{\lambda _{NN}}} \right)} \right.。$

属性集A的全部效用Utility_A:Utility_A=Utility_A^POS+Utility_A^BND+Utility_A^NEG。

2.2 正域分布保持定义

信息量是一个事件所带来的具体信息的量度, 本节主要内容为结合条件信息量^[30]和正域分布保持^[31]给出模糊效用三支决策模型下混合属性条件信息量的定义。

定义8 给定混合决策信息系统HIS=(U, AT=C∪D, V, f), 决策类集合U/D={X₁, X₂, …, X_m}, m=|U/D|, 0≤β < α≤1, 对于∀A⊆C, 混合属性集A的条件信息量定义为

$ I\left( {{R_{POS_C^{\left( {\alpha , \beta } \right)}}}\left| A \right.} \right) = \sum\limits_{i = 1}^{m + 1} {\frac{{\left| {POS_A^{\left( {{\alpha _i}, {\beta _i}} \right)}\left( {{X_i}} \right) \cap POS_C^{\left( {{\alpha _i}, {\beta _i}} \right)}\left( {{X_i}} \right)} \right|}}{{\left| {POS_A^{\left( {{\alpha _i}, {\beta _i}} \right)}\left( {{X_i}} \right)} \right|}}} \cdot \left( {1 - \frac{{\left| {POS_A^{\left( {{\alpha _i}, {\beta _i}} \right)}\left( {{X_i}} \right) \cap POS_C^{\left( {{\alpha _i}, {\beta _i}} \right)}\left( {{X_i}} \right)} \right|}}{{\left| {POS_A^{\left( {{\alpha _i}, {\beta _i}} \right)}\left( {{X_i}} \right)} \right|}}} \right), $

其中：$\mathit{POS}_A^{\left({{\alpha _{m + 1}}, \ldots, {\beta _{m + 1}}} \right)}\left({{X_{m + 1}}} \right) = U - \mathop {\underbrace \cup _{j = 1}}\limits^m POS_A^{({\alpha _i}, {\beta _i})}\left({{X_i}} \right); POS_c^{\left({{\alpha _{m + 1}}, {\beta _{m + 1}}} \right)}\left({{X_{m + 1}}} \right) = U - \bigcup\limits_{j = 1}^m {POS_c^{({\alpha _i}, {\beta _i})}\left({{X_i}} \right)} $。

由条件信息量的定义可得

1) 对于∀X⊆U/D, ∀A⊆C, 若POS_A^{(α, β)}(X)=POS_C^{(α, β)}(X), 则称A为混合决策信息系统的(α, β)正域分布保持集。

2) 若POS_A^{(α, β)}(X)=POS_C^{(α, β)}(X)且对于∀A′⊂A, 都有POS_A′^{(α, β)}(X)≠POS_C^{(α, β)}(X), 则称A为混合系统的(α, β)正域分布保持约简。

3) 当A是混合系统的正域分布保持约简时, I(R_{POS_C^{(α, β)}}|A)=0；当A不是混合系统的正域分布保持约简时，I(R_{POS_C^{(α, β)}}|A)>0。

3 混合模糊效用三支决策模型属性约简算法 3.1 算法介绍

本节中两个约简目标(最大效用和正域分布保持)均采用前向贪婪循环算法进行属性约简。

定义9 给定混合决策信息系统HIS=(U, AT=C∪D, V, f), 且A⊆C, 当且仅当A满足以下两个条件时, A是C的一个最大效用属性约简。

1) Utility_A≥Utility_C；

2) 对于∀A′⊂A, Utility_A′ < Utility_A。

定义10 给定混合决策信息系统HIS=(U, AT=C∪D, V, f), A⊆C, a_i∈C－A, 最大效用启发式属性约简算法的外部属性重要度为

$ Sig_{Uilitiy}^{{\rm{out }}}\left( {A, {a_i}} \right) = Utilit{y_{A \cup \left\{ {{a_i}} \right\}}} - Utilit{y_A}。$

定义11 给定混合决策信息系统HIS=(U, AT=C∪D, V, f), A⊆C, 0≤β < α≤1, 当且仅当A满足以下两个条件时, A是C的一个正域分布保持属性约简。

1) I(R_{POS_C^{(α, β)}}|A)=0；

2) 对于∀A′⊂A, I(R_{POS_C^{(α, β)}}|A')>0。

定义12 给定混合决策信息系统HIS=(U, AT=C∪D, V, f), A⊆C, a_i∈C－A, 正域分布保持启发式属性约简算法中的外部属性重要度为

$ Sig_{POS}^{{\rm{out }}}\left( {A, {a_i}} \right) = I\left( {{R_{POS_C^{\left( {\alpha , \beta } \right)}}}\left| {A \cup \left\{ {{a_i}} \right\}} \right.} \right) - I\left( {{R_{POS_C^{\left( {\alpha , \beta } \right)}}}\left| A \right.} \right)。$

构造混合决策信息系统中的最大效用启发式属性约简算法(forward greedy algorithm of maximal utility attribute reduction, FG-MUAR), 算法如下。

算法1 最大效用属性约简算法

输入:混合决策信息表HIS=(U, AT=C∪D, V, f)。

输出:决策表的一个约简A。

A=Ø。

计算决策表所有属性集效用Utility_C。

若Utility_A < Utility_C, 开始循环:

对于∀a_i∈C－A计算Sig_Utility^out(A, a_i)；

选择Sig_Utility^out(A, a_i)最大的属性, 记作a, A=A∪{a}。C=C－{a}；

若不满足条件则结束循环。

对于∀a_i∈A, 若满足条件Utility_{A－{a_i}}≥Utility_A, 则A=A－{a_i}。

输出约简A。

构造混合决策信息系统中的正域分布保持属性约简算法(forward greedy algorithm of positive region distribution preservation, FG-PRAR), 算法如下。

算法2 正域分布保持属性约简算法

输入:混合决策信息表HIS=(U, AT=C∪D, V, f)。

输出:决策表的一个约简A。

Core(C)=Ø。

对于∀c_i∈C若I(R_{POS_C^{(α, β)}}|C－{c_i})>0, Core(C)=Core(C)∪{c_i}。

A=Core(C)。

若I(R_{POS_C^{(α, β)}}|A)≠0且C≠Ø, 开始循环:

对于∀a_i∈C－A, 计算Sig_POS^out(A, a_i)；

选择Sig_POS^out(A, a_i)最大的属性, 记作a。A=A∪{a}, C=C－{a}；

若不满足条件，则结束循环。

对于∀a_i∈A, 若满足条件I(R_{POS_C^{(α, β)}}|A－{a_i})=0, 则A=A－{a_i}。

输出约简A。

4 实验分析

本节实验采用6个UCI数据集(取自http://archive.ics.uci.edu/ml/index.php)进行实验, 数据集均带有分类属性。所有实验均在Windows7、CPU Intel^®Core^TM i5-6500、8.00 GB内存的个人计算机上进行, 所用编程环境为Python3.6。实验分为算法运行时间和实验对比表(近似分类质量、J48分类正确率、约简效用)两个部分。

使用函数式u(λ_Δ)=d(-λ_Δ+c)^b(Δ∈{PP, BP, NP, NN, BN, PN})^[29]作为效用函数式, 给定参数取值范围d∈[1, 10], c∈[1, 10], λ∈[0, 10]。

表 2 实验数据集 Tab. 2 Experimental data sets

4.1 实验对比表

本文提出的FG-PRAR算法与FG-MUAR算法原始数据和属性约简后的近似分类质量^[3]如表 3所示。

表 3 近似分类质量 Tab. 3 Approximate classification quality

FG-PRAR原始数据表示FG-PRAR算法中决策表的近似分类质量。FG-MUAR原始数据表示FG-MUAR算法中决策表的近似分类质量。FG-PRAR算法可以保持所有决策类的正域不变, 因此FG-PRAR约简与FG-PRAR原始数据的近似分类质量数值相同。FG-MUAR约简与FG-MUAR原始数据对比, 近似分类质量发生改变, 原因是FG-MUAR约简前后会引起决策表正域的改变。近似分类质量数值为0是由于随机产生的概率阈值过大, 因此划分出的决策表正域为空集。近似分类质量数值为1是由于随机产生的概率阈值过小, 导致论域中所有对象均被划分到决策表正域。

使用Weka软件中J48分类器并采用十折交叉验证法验证决策表的4种算法属性约简后的J48分类正确率。本次实验使用10次随机产生的概率阈值, 其平均分类正确率如表 4所示。

表 4 J48分类正确率 Tab. 4 Classification accuracy comparision with J48

原始数据表示决策表的J48分类正确率。表 4中本文所提出的FG-PRAR算法属性约简结果的分类正确率在多数情况下可以大于等于原始数据的分类正确率。本文所提出的FG-PRAR算法的正确分类率均大于文献[21]中最大期望效用算法(maximum expect utility, MAXEU)和文献[23]中最小决策损失算法(minimum decision cost, MINDC)的正确分类率, 存在两种原因:1) MAXEU算法和MINDC算法缺乏处理离散型数据和混合数据的能力, 所以要在属性约简前对数据进行预处理, 会对数据造成一定的损失, 最终对数据的分类正确率造成一定的影响; 2) MAXEU算法和MINDC算法均未考虑到决策表中不同决策类的差异, 没有为每个决策类生成不同的概率阈值，而是统一采用一致的阈值划分论域, 因此这两种算法在6个数据集上的分类正确率均低于本文提出的FG-PRAR和FG-MUAR算法分类正确率。

FG-MUAR算法保证属性约简后不降低原始决策表的效用, 约简应该具有比原始决策表更高或者相等的效用, 据决策者对待风险的三种主观态度, 可以将效用函数分为:当b=1时, 效用函数为风险中立型(RN)；当b>1时, 效用函数为风险厌恶型(RA)；当b < 1时, 效用函数为风险喜好型(RP)。FG-MUAR算法在三种风险态度下约简结果的效用值如表 5所示。

表 5 约简效用 Tab. 5 The utility of decision table and reduct

在三种风险态度下使用的效用函数参数不同, 因此三种风险态度下的决策表效用不同。FG-MUAR算法的目标即为使决策者的效用值最大化, 由表 5可以得知, FG-MUAR算法在6个数据集中约简结果的总效用值均大于原始决策表的总效用值, 因此约简结果有效。对比三种决策态度中约简结果的效用值相差较小, 表明三种不同决策态度中决策者对待决策结果的满意程度基本一致。

4.2 算法运行时间

不同决策者对待风险的决策态度不同, 在决策过程中的决策行为也不完全相同。为分析两种算法在三种不同决策态度中的决策效率, 比较FG-PRAR和FG-MUAP两种算法在决策者不同决策态度中随着论域变化的运行时间。图 1和图 2实验采取的方式是将每个数据集的论域数目均等分成十份, 依次加入一份样本, 比较加入样本后FG-PRAR算法在三种决策态度中的运行时间, x轴表示样本份数, y轴表示算法运行时间。

图 1 FG-PRAR算法随论域数目增加运行时间的变化 Fig. 1 The running time of the FG-PRAR algorithm increases with the sizes of the universe

图 2 FG-MUAR算法随论域数目增加运行时间的变化 Fig. 2 The running time of the FG-MUAR algorithm increases with the sizes of the universe

由图 1可知, 随着样本数的增加, 三种决策态度中FG-PRAR算法运行时间基本一致, 图 1中数据集(b)、(d)随着样本数的增加, 风险中立型的算法运行时间没有严格单调递增, 是因为不同样本下使用不同的概率阈值划分的正域可能不同, 当前样本数使用的随机概率阈值划分出的正域比前一份样本数使用的概率阈值划分出的正域较小, 因此算法运行时间略有下降。本文提出的FG-PRAR算法是保持约简结果正域与决策表正域一致。总体来看, 不同决策态度对于FG-PRAR算法运行时间影响较小。

对于FG-MUAR算法, 三种决策态度中样本数与算法运行时间的关系如图 2所示。

由图 2可知, 在决策者不同决策态度中, 随着论域的增加，运行时间曲线的变化并不完全一致, 不同决策态度对于FG-MUAR算法运行时间略有影响。FG-MUAR算法计算正域、负域和边界域的全部效用, 相对于FG-PRAR算法的运行时间更长。图 2数据集(b)、(c)、(e)中的三种不同风险态度曲线随着论域数目增加, 并不是严格单调递增, 这是由于随着样本数的增加, 每个属性的模糊T-等价关系表也随之变化, 由此计算的模糊条件概率可能增加、不变或减少, 从而引起效用值的变化, 最终影响FG-MUAR算法的运行时间。在现实生活中, 决策者的心理满足程度也可能随着时间的变化或者事件的改变而发生变化, 图 2曲线的不单调变化更贴合实际生活中决策者的决策情况。

5 结束语

在混合决策信息系统中，本文结合模糊和效用提出一种新的模糊效用三支决策模型, 提高了三支决策模型处理混合数据的能力。本文在该模型中提出正域分布保持和最大效用启发式属性约简算法, 实验表明了两种算法的有效性。然而效用函数在决策表属性约简过程中并不具有单调性, 两种算法仍需遍历删除冗余属性求解约简, 寻找三支决策模型中主观效用与客观数据结合的单调启发式因子是后续所要研究的主要内容。

参考文献

[1]	YAO Y Y. Three-way decision: an interpretation of rules in rough set theory[C]//Proceedings of the 4th International Conference on Rough Sets and Knowledge Technology. Golden Coast, 2009: 642-649. (0)
[2]	YAO Y Y. Three-way decisions with probabilistic rough sets[J]. Information sciences, 2010, 180(3): 341-353. DOI:10.1016/j.ins.2009.09.021 (0)
[3]	PAWLAK Z. Rough sets[J]. International journal of computer & information sciences, 1982, 11(5): 341-356. (0)
[4]	米据生, 吴伟志, 张文修. 粗糙集的构造与公理化方法[J]. 模式识别与人工智能, 2002, 15(3): 280-284. MI J S, WU W Z, ZHANG W X. Constructive and axiomatic approaches of the theory of rough sets[J]. Pattern recognition and artificial intelligence, 2002, 15(3): 280-284. DOI:10.3969/j.issn.1003-6059.2002.03.005 (0)
[5]	梁德翠, 曹雯. 三支决策模型及其研究现状分析[J]. 电子科技大学学报(社科版), 2019, 21(1): 104-112. LIANG D C, CAO W. Three-way decisions: model and the state of the art[J]. Journal of university of electronic science and technology of China(social sciences edition), 2019, 21(1): 104-112. (0)
[6]	李言, 李丽红, 李爽, 等. 基于集对联系熵的三支决策模型及应用[J]. 郑州大学学报(理学版), 2017, 49(3): 52-58. LI Y, LI L H, LI S, et al. Three-way decisions model and application based on set pair information entropy[J]. Journal of Zhengzhou university(natural science edition), 2017, 49(3): 52-58. (0)
[7]	张春英, 乔鹏, 王立亚, 等. 一种基于PS-粗糙集的动态三支决策算法[J]. 郑州大学学报(理学版), 2019, 51(2): 72-77. ZHANG C Y, QIAO P, WANG L Y, et al. A kind of dynamic three-way decisions algorithm based on PS-rough set[J]. Journal of Zhengzhou university(natural science edition), 2019, 51(2): 72-77. (0)
[8]	钱进. 多粒度决策粗糙集模型研究[J]. 郑州大学学报(理学版), 2018, 50(1): 33-38. QIAN J. Research on multigranulation decision-theoretic rough set models[J]. Journal of Zhengzhou university(natural science edition), 2018, 50(1): 33-38. (0)
[9]	QIAN Y H, ZHANG H, SANG Y L, et al. Multigranulation decision-theoretic rough sets[J]. International journal of approximate reasoning, 2014, 55(1): 225-237. DOI:10.1016/j.ijar.2013.03.004 (0)
[10]	李金海, 邓硕. 概念格与三支决策及其研究展望[J]. 西北大学学报(自然科学版), 2017, 47(3): 321-329. LI J H, DENG S. Concept lattice, three-way decisions and their research outlooks[J]. Journal of northwest university(natural science edition), 2017, 47(3): 321-329. (0)
[11]	LIU D, LIANG D C. Three-way decisions in ordered decision system[J]. Knowledge-based systems, 2017, 137: 182-195. DOI:10.1016/j.knosys.2017.09.025 (0)
[12]	王莉, 周献中, 李华雄. 模糊决策粗糙集模型及其属性约简[J]. 上海交通大学学报, 2013, 47(7): 1032-1035. WANG L, ZHOU X Z, LI H X. Fuzzy decision-theoretic rough set model and its attribute reduction[J]. Journal of Shanghai jiaotong university, 2013, 47(7): 1032-1035. (0)
[13]	SONG J J, TSANG E C C, CHEN D G, et al. Minimal decision cost reduct in fuzzy decision-theoretic rough set model[J]. Knowledge-based systems, 2017, 126: 104-112. DOI:10.1016/j.knosys.2017.03.013 (0)
[14]	LUO C, LI T R, HUANG Y Y, et al. Updating three-way decisions in incomplete multi-scale information systems[J]. Information sciences, 2019, 476: 274-289. DOI:10.1016/j.ins.2018.10.012 (0)
[15]	QIAN J, LIU C H, YUE X D. Multigranulation sequential three-way decisions based on multiple thresholds[J]. International journal of approximate reasoning, 2019, 105: 396-416. DOI:10.1016/j.ijar.2018.12.007 (0)
[16]	CHEN H M, LI T R, LUO C, et al. A decision-theoretic rough set approach for dynamic data mining[J]. IEEE transactions on fuzzy systems, 2015, 23(6): 1958-1970. DOI:10.1109/TFUZZ.2014.2387877 (0)
[17]	LI W W, HUANG Z Q, LI Q. Three-way decisions based software defect prediction[J]. Knowledge-based systems, 2016, 91: 263-274. DOI:10.1016/j.knosys.2015.09.035 (0)
[18]	LI H X, ZHANG L B, HUANG B, et al. Sequential three-way decision and granulation for cost-sensitive face recognition[J]. Knowledge-based systems, 2016, 91: 241-251. DOI:10.1016/j.knosys.2015.07.040 (0)
[19]	QIAO J S, HU B Q. On transformations from semi-three-way decision spaces to three-way decision spaces based on triangular norms and triangular conorms[J]. Information sciences, 2018, 432: 22-51. DOI:10.1016/j.ins.2017.12.005 (0)
[20]	JIANG C M, YAO Y Y. Effectiveness measures in movement-based three-way decisions[J]. Knowledge-based systems, 2018, 160: 136-143. DOI:10.1016/j.knosys.2018.07.008 (0)
[21]	张楠, 姜丽丽, 岳晓冬, 等. 效用三支决策模型[J]. 智能系统学报, 2016, 11(4): 459-468. ZHANG N, JIANG L L, YUE X D, et al. Utility-based three-way decisions model[J]. CAAI transactions on intelligent systems, 2016, 11(4): 459-468. (0)
[22]	FANG Y, MIN F. Cost-sensitive approximate attribute reduction with three-way decisions[J]. International journal of approximate reasoning, 2019, 104: 148-165. DOI:10.1016/j.ijar.2018.11.003 (0)
[23]	JIA X Y, LIAO W H, TANG Z M, et al. Minimum cost attribute reduction in decision-theoretic rough set models[J]. Information sciences, 2013, 219(10): 151-167. (0)
[24]	ZHAO Y, WONG S K M, YAO Y Y. A note on attribute reduction in the decision-theoretic rough set model[C]// Proceedings of the 6th International Conference on Rough Sets and Current Trends in Computing. Akron, 2008: 61-70. (0)
[25]	ZENG A P, LI T R, LIU D, et al. A fuzzy rough set approach for incremental feature selection on hybrid information systems[J]. Fuzzy sets and systems, 2015, 258: 39-60. DOI:10.1016/j.fss.2014.08.014 (0)
[26]	WILSON D, MARTINEZ T. Improved heterogeneous distance functions[J]. Journal of artificial intelligence research, 1997, 6: 1-34. DOI:10.1613/jair.346 (0)
[27]	MOSER B. On representing and generating kernels by fuzzy equivalence relations[J]. Journal of machine learning research, 2006, 7: 2603-2620. (0)
[28]	HU Q H, ZHANG L, CHEN D G, et al. Gaussian kernel based fuzzy rough sets: model, uncertainty measures and applications[J]. International journal of approximate reasoning, 2010, 51(4): 453-471. DOI:10.1016/j.ijar.2010.01.004 (0)
[29]	袁捷敏. 决策效用函数两类拟合方法比较[J]. 统计与决策, 2006(1): 49-50. YUAN J M. Comparison of two kinds of fitting methods for decision utility function[J]. Statistics & decision, 2006(1): 49-50. (0)
[30]	刘振华, 刘三阳, 王珏. 基于信息量的一种属性约简算法[J]. 西安电子科技大学学报, 2003, 30(6): 835-838. LIU Z H, LIU S Y, WANG J. An attribute reduction algorithm based on the information quantity[J]. Journal of xidian university, 2003, 30(6): 835-838. DOI:10.3969/j.issn.1001-2400.2003.06.028 (0)
[31]	马希骜, 王国胤, 于洪. 决策域分布保持的启发式属性约简方法[J]. 软件学报, 2014, 25(8): 1761-1780. MA X A, WANG G Y, YU H. Heuristic method to attribute reduction for decision region distribution preservation[J]. Journal of software, 2014, 25(8): 1761-1780. (0)