«上一篇
文章快速检索     高级检索
下一篇»
  智能系统学报  2020, Vol. 15 Issue (6): 1068-1078  DOI: 10.11992/tis.201909015
0

引用本文  

曾婷, 唐孝, 谭阳, 等. 相似度三支决策模糊粗糙集模型的决策代价研究[J]. 智能系统学报, 2020, 15(6): 1068-1078. DOI: 10.11992/tis.201909015.
ZENG Ting, TANG Xiao, TAN Yang, et al. Decision costs of the similarity three-way decision-theoretic fuzzy rough set model[J]. CAAI Transactions on Intelligent Systems, 2020, 15(6): 1068-1078. DOI: 10.11992/tis.201909015.

基金项目

四川省科技计划资助项目(2019YJ0529);四川省教育厅重点项目(18ZA0410)

通信作者

唐孝. E-mail:18242087@qq.com

作者简介

曾婷,硕士研究生,主要研究方向为数据挖掘;
唐孝,副教授,博士,硕士生导师,主要研究方向为基于不确定性理论的信息处理及应用。发表学术论文20余篇;
谭阳,硕士研究生,主要研究方向为数据挖掘

文章历史

收稿日期:2019-09-06
相似度三支决策模糊粗糙集模型的决策代价研究
曾婷 1,2, 唐孝 1,2, 谭阳 1,2, 丁本香 1,2     
1. 四川师范大学 数学科学学院,四川 成都 610066;
2. 四川师范大学 智能信息与量子信息研究所,四川 成都 610066
摘要:在三支决策模糊粗糙集模型中,一些学者基于相似度三支决策模糊粗糙集模型建立了目标函数来得到最优阈值对 $\left( {\alpha ,\;\beta } \right)$ 的计算方法,但在该过程的研究中,学者并没有在相似度三支决策模糊粗糙集模型中讨论关于决策代价的描述问题。基于模糊信息系统用新的函数来描述决策代价成为计算阈值对 $\left( {\alpha ,\;\beta } \right)$ 的一种方法,首先,在模糊信息系统中,通过建立一个描述决策代价的函数,将模糊信息系统中的模糊数与三支决策的决策代价联系在一起;然后对隶属频率进行拟合,得到了三支决策中决策代价的数值描述;最后,通过两个实例说明了该方法的可行性和适用性。
关键词三支决策    模糊粗糙集    决策代价    模糊数    阈值对    属性值    区间值    多重集    
Decision costs of the similarity three-way decision-theoretic fuzzy rough set model
ZENG Ting 1,2, TANG Xiao 1,2, TAN Yang 1,2, DING Benxiang 1,2     
1. School of Mathematical Science, Sichuan Normal University, Chengdu 610066, China;
2. Institute of Intelligent Information and Quantum Information, Sichuan Normal University, Chengdu 610066, China
Abstract: In the three-way decision-theoretic fuzzy rough set model, several scholars established the objective function based on the similarity three-way decision-theoretic fuzzy rough set model to derive the method for calculating the optimal threshold pair (α, β). However, during this research, the authors did not discuss the description of the decision costs in the similarity three-way decision-theoretic fuzzy rough set model. The new function describing the decision costs is used in the method for calculating the threshold pair (α, β) based on the fuzzy information system. First, in the fuzzy information system, the fuzzy number is associated with the decision costs of three-way decisions by establishing a function describing the decision costs. Then, the numerical description of the decision costs of three-way decisions is obtained by fitting the membership frequency. Finally, two examples are given to illustrate the feasibility and applicability of the method.
Key words: three-way decisions    fuzzy rough set    decision costs    fuzzy number    threshold pair    attribute value    interval value    multiset    

模糊集用隶属函数描述对象的隶属程度来刻画模糊边界的不分明性。粗糙集用上、下近似刻画对象间的不可区分关系来对对象进行分类。模糊集和粗糙集都是处理不完全、不确定性信息的重要数学工具,同时都推广了经典集合论处理不确定性和不精确性问题。两者既有相似性又有区别,因此不能互相包含、互相取代,很多人就试图将粗糙集和模糊集进行融合。20世纪90年代,Dubois 等[1-2]将粗糙集和模糊集结合在一起,提出了描述不确定性的模糊粗糙集模型。在概率近似空间上,Sun等[3]提出了粗糙近似模糊概念。Yao等[4]基于贝叶斯决策近似概念的含义提出了模糊粗糙集。Zhao等[5]在模糊概率近似空间和区间值模糊概率近似空间的框架下研究了决策粗糙集。

基于决策粗糙集,Yao[6]提出了三支决策。通过推广贝叶斯决策理论得到了三支决策粗糙集,其考虑的是粗糙集三个成对互不相交的区域,即正域、负域和边界域。之后,Liang等[7]提出了一系列新的三支决策模型,比如区间值粗糙集三支决策、双重犹豫模糊粗糙集三支决策[8],基于点算子的直觉模糊粗糙集的三支决策[9]等。最近,Feng等[10]基于多粒度模糊近似空间和隶属度算子,将三支决策和变精度粗糙集结合在一起,提出了1型变精度多粒度决策模糊粗糙集模型。随着研究的深入,Deng等[11]推广了三支近似模糊集决策模型,提出可变的决策理论公式,通过最小化决策代价计算阈值对 $\left( {\alpha ,\beta } \right)$ 。杨雯琳等[12]建立了基于相似度的三支决策模糊粗糙集最优模型来计算阈值对 $\left( {\alpha ,\beta } \right)$ 。衷锦仪等[13]基于区间值决策粗糙集模型,从模糊数学的角度得出了更为紧凑的阈值对 $\left( {\alpha ,\beta } \right)$ 的上、下近似。对于多重集值,Zhao等[14]提出了多重集决策粗糙集模型和多重集模糊决策粗糙集模型来计算损失函数的期望代价。Liang等[15]将精确值的损失函数概念推广到三角模糊决策粗糙集上来计算决策损失。Lin[16]基于约束满意度提出了一种解决模糊线性关系的方法,该方法被其他学者用于研究阈值对 $\left( {\alpha ,\beta } \right)$

目前,三支决策已经得到了广泛的应用,而且决策粗糙集理论[17]是求解三支分类的经典理论之一。因此,三支决策相关的研究成果包括了不同数据模型的决策粗糙集推广,例如:基于代价敏感度量的概率粗糙集三支决策[18-19]、模糊集三支决策[8]、区间集三支决策[20]、邻域三支决策[21]等。不同模型阈值对确定的方法可能是不同的。邢航[22]提出的基于构造性覆盖算法的三支决策模型可以根据样本的分布特征自动形成三个域,相比于基于决策粗糙集的三支决策模型,基于构造性覆盖算法的三支决策模型不必人为决定关键参数,能自动形成三个域,使得如何获得决策粗糙集理论模型中损失函数、阈值的取值问题得以解决。徐健锋等[23]提出了一种基于三支决策代价目标函数间逻辑关系的新型阈值计算方法。Liu等[24]为决策理论粗糙集中的阈值参数优化建立了理论和系统的框架,并且提出了一种基于优化的通用方法来确定具有各种语义的决策理论粗糙集的阈值对。

在模糊决策粗糙集模型中,大多数研究是以总体决策代价最小化为目标,得出计算最优阈值对 $\left( {\alpha ,\beta } \right)$ 的方法,其中决策代价是专家给出的,并没有进行进一步的研究。而衷锦仪等[13]基于区间值模糊决策粗糙集模型,得出了计算决策代价的方法。本文采用了属性值来描述决策代价,用对象间的曼哈顿距离表示决策代价函数,得出最优阈值对 $\left( {\alpha ,\beta } \right)$

1 决策粗糙集模型

本节介绍了多重集的相关概念和基于模糊数的决策粗糙集模型,该模型用区间值来刻画损失代价得到更为紧凑的阈值对 $\left( {\alpha ,\beta } \right)$ 的上、下近似。

1.1 多重集

定义1[18]  设一个非空论域 $U$ ,在 $U$ 上的一个多重集 $M$ 上定义函数 ${C_M}:U \to N$ ,其中 $N$ 是自然数集, ${C_M}\left( x \right)$ $x$ 的重数, $\forall x \in U$

函数 ${C_M}$ 称为有限函数,表示每个元素出现的次数。 $\mu \left( U \right)$ 表示 $U$ 上的所有多重集族。如果 $\forall x \in U,{C_M}\left( x \right) = 0$ ,则 $M$ 是一个空的多重集,记为 ${\text{Ø}}$ 。多重集有多种表示方式, $M = \left( {x,x,x,y,y, \cdot \cdot \cdot } \right)$ $M = $ $ \left\{ {\left( {x,{C_M}\left( x \right)} \right)\left| {x \in U,{C_M}\left( x \right) \in N} \right.} \right\}$ $M = \displaystyle\sum\limits_{x \in U} {\dfrac{{{C_M}\left( x \right)}}{x}} $ ( $U$ 是有限集)或 $M = \displaystyle\int\limits_{x \in U} {\dfrac{{{C_M}\left( x \right)}}{x}} $ ( $U$ 是无限集)。

定义2[14]  在 ${\mu _F}\left( {\left[ {0,1} \right]} \right)$ 上,多重集 $M = \{ ( x, $ $ {C_M}\left( x \right) )\left| {x \in \left[ {0,1} \right],{C_M}\left( x \right) \in N} \right. \}$ $M$ 的长度定义为: ${\left\| M \right\|_p} = $ $ {\left( {\displaystyle\sum\limits_x {{C_M}\left( x \right) \cdot {x^p}} } \right)^{\frac{1}{p}}},p \geqslant 1$

常用的长度有:曼哈顿长度,即 ${\left\| M \right\|_1} = \displaystyle\sum\limits_x {{C_M}\left( x \right) \cdot x} $ ;欧几里得长度,即 ${\left\| M \right\|_2} = {\left( {\displaystyle\sum\limits_x {{C_M}\left( x \right) \cdot {x^2}} } \right)^{\frac{1}{2}}}$ ;无限长度,即 ${\left\| M \right\|_\wp } = {\max _x}\left\{ {{C_M}\left( x \right) \cdot x} \right\}$

1.2 基于模糊数的决策粗糙集模型

Yao等[4]基于贝叶斯决策过程,提出决策理论粗糙集模型,该模型利用状态集 $O = \left\{ {A,{A^C}} \right\}$ 和动作集 $a = \left\{ {{a_e},{a_b},{a_r}} \right\}$ 来描述决策过程,其中状态集 $O = \left\{ {A,{A^C}} \right\}$ 中的元素分别表示某事件属于 $A$ 和不属于 $A$ ,动作集 $a = \left\{ {{a_e},{a_b},{a_r}} \right\}$ 中的元素分别表示将对象 $x$ 划分到正域、边界域和负域。

对象 $x$ 采取3个行动之一引起的实际代价 $R\left( {{a_e}\left| {\left[ x \right]} \right.} \right),R\left( {{a_b}\left| {\left[ x \right]} \right.} \right),R\left( {{a_r}\left| {\left[ x \right]} \right.} \right)$ 分别为

$\begin{array}{l} \left. 1 \right)R\left( {{a_e}\left| {\left[ x \right]} \right.} \right) = {\lambda _{ep}} \cdot P\left( {A\left| {\left[ x \right]} \right.} \right) + {\lambda _{en}} \cdot P\left( {{A^C}\left| {\left[ x \right]} \right.} \right) \\ \left. 2 \right)R\left( {{a_b}\left| {\left[ x \right]} \right.} \right) = {\lambda _{bp}} \cdot P\left( {A\left| {\left[ x \right]} \right.} \right) + {\lambda _{bn}} \cdot P\left( {{A^C}\left| {\left[ x \right]} \right.} \right) \\ \left. 3 \right)R\left( {{a_r}\left| {\left[ x \right]} \right.} \right) = {\lambda _{rp}} \cdot P\left( {A\left| {\left[ x \right]} \right.} \right) + {\lambda _{rn}} \cdot P\left( {{A^C}\left| {\left[ x \right]} \right.} \right) \\ \end{array} $

式中: ${\lambda _{ep}}{\text{、}}{\lambda _{bp}}{\text{、}}{\lambda _{rp}}$ 分别表示当 $x$ $ \in $ $A$ 采取行动 ${a_e}{\text{、}}{a_b}{\text{、}}{a_r}$ 时的决策代价; ${\lambda _{en}}{\text{、}}{\lambda _{bn}}{\text{、}}{\lambda _{rn}}$ 分别表示当 $x$ $ \notin $ $A$ 采取行动 ${a}_{e}{\text{、}}{a}_{b}{\text{、}}{a}_{r}$ 时的决策代价; $P\left( {A\left| {\left[ x \right]} \right.} \right)$ 表示 $x$ $\in $ $A$ 的条件概率, $P\left( {{A^C}\left| {\left[ x \right]} \right.} \right) $ 表示 $x$ $ \notin $ $A$ 的条件概率。

所以,总体决策代价为 $R = \displaystyle\sum\limits_{x \in U} {R\left( {a\left| x \right.} \right)} = \displaystyle\sum\limits_{x \in U} {{\lambda _{ap}}} \cdot $ $ { P\left( {A\left| {\left[ x \right]} \right.} \right) + {\lambda _{an}} \cdot P\left( {{A^C}\left| {\left[ x \right]} \right.} \right)}$

根据贝叶斯决策准则,要使总体决策代价达到最小,则需要采取行动的实际代价最小,即决策规则为:

1)如果 $R\left( {{a_e}\left| {\left[ x \right]} \right.} \right) \leqslant R\left( {{a_b}\left| {\left[ x \right]} \right.} \right)$ $R\left( {{a_e}\left| {\left[ x \right]} \right.} \right) \leqslant R( {a_r}| $ $ {\left[ x \right]} )$ ,则采取接受决策;

2)如果 $R\left( {{a_b}\left| {\left[ x \right]} \right.} \right) \leqslant R\left( {{a_e}\left| {\left[ x \right]} \right.} \right)$ $R\left( {{a_b}\left| {\left[ x \right]} \right.} \right) \leqslant R( {a_r}| $ $ {\left[ x \right]} )$ ,则采取延迟决策;

3)如果 $R\left( {{a_r}\left| {\left[ x \right]} \right.} \right) \leqslant R\left( {{a_e}\left| {\left[ x \right]} \right.} \right)$ $R\left( {{a_r}\left| {\left[ x \right]} \right.} \right) \leqslant R( {a_b}| $ $ {\left[ x \right]} ) $ ,则采取拒绝决策。

可以计算出阈值对 $\left( {\alpha ,\beta } \right)$ $\Bigg( \dfrac{{{\lambda _{an}} - {\lambda _{bn}}}}{{\left( {{\lambda _{an}} - {\lambda _{bn}}} \right) + \left( {{\lambda _{bp}} - {\lambda _{ap}}} \right)}}, $ $ \dfrac{{{\lambda _{bn}} - {\lambda _{rn}}}}{{\left( {{\lambda _{bn}} - {\lambda _{rn}}} \right) + \left( {{\lambda _{rp}} - {\lambda _{bp}}} \right)}} \Bigg)$

定义3[13]  设论域 $U$ 上的模糊数为 $F$ ,如果 $F$ 的隶属度函数 ${\mu _F}:U \to \left[ {0,1} \right]$ 表示为

${\mu _F}\left\{ \begin{array}{l} 0,\quad x < {r_1} \\ \dfrac{{x - {r_1}}}{{{r_2} - {r_1}}},\quad {r_1} \leqslant x < {r_2} \\ 1,\quad {r_2} \leqslant x < {r_3} \\ \dfrac{{{r_4} - x}}{{{r_4} - {r_3}}},\quad {r_3} \leqslant x < {r_4} \\ 0,\quad x \geqslant {r_4} \end{array} \right.$

则称 $M = \left( {{r_1},{r_2},{r_3},{r_4}} \right)$ 为梯形模糊数。

设一组决策代价 ${\lambda _{ep}} = \left[ {\lambda _{ep}^L,\lambda _{ep}^U} \right],{\lambda _{bp}}$ $= \left[ {\lambda _{bp}^L,\lambda _{bp}^U} \right], {\lambda _{rp}} = $ $ \left[ {\lambda _{rp}^L,\lambda _{rp}^U} \right], {\lambda _{en}} = \left[ {\lambda _{en}^L,\lambda _{en}^U} \right],{\lambda _{bn}} =$ $\left[ {\lambda _{bn}^L,\lambda _{bn}^U} \right],{\lambda _{rn}} = \left[ {\lambda _{rn}^L,\lambda _{rn}^U} \right]$ 。设 ${\lambda _{ * * }}$ 为某个状态决策动作的决策代价,模糊统计方法如下:

1)设在一次统计中, $n$ 位专家给出了 $n$ 个区间值 ${\lambda _{ * * }} = \left[ {\lambda _{ * * }^L,\lambda _{ * * }^U} \right]$

2)找出 $n$ 个区间值中的最小值 ${\lambda _{\min }}$ 和最大值 ${\lambda _{\max }}$ ,以 ${\lambda _{\min }}$ 为起点, ${\lambda _{\max }}$ 为终点, $\dfrac{{{\lambda _{\max }} - {\lambda _{\min }}}}{k}$ 为长度( $k \in {N^ * }$ ),作 $k$ 个区间的划分;

3)计算每个区间的隶属频率 $f = \dfrac{m}{n}$ ,其中 $n$ 为随机选择的样本总数, $m$ 为区间样本覆盖 ${\lambda _{ * * }}$ 的频数;

4)以实数 $x$ 为横坐标,隶属频率为纵坐标,绘出 ${\lambda _{ * * }}$ 的模糊分布曲线。

5)对该模糊分布左右两边的曲线进行直线拟合,得到一个梯形分布函数。

设决策代价 ${\lambda _{ * * }}$ 的梯形模糊数为 ${M_{ * * }}$ ,即

${M_{ep}} = \left( {{r_{11}},{r_{12}},{r_{13}},{r_{14}}} \right)$
${M_{bp}} = \left( {{r_{21}},{r_{22}},{r_{23}},{r_{24}}} \right)$
${M_{rp}} = \left( {{r_{31}},{r_{32}},{r_{33}},{r_{34}}} \right)$
${M_{en}} = \left( {{s_{11}},{s_{12}},{s_{13}},{s_{14}}} \right)$
${M_{bn}} = \left( {{s_{21}},{s_{22}},{s_{23}},{s_{24}}} \right)$
${M_{rn}} = \left( {{s_{31}},{s_{32}},{s_{33}},{s_{34}}} \right)$

可以得到 $\alpha {\text{、}}\beta $ 的模糊分布为

$ \begin{split}& \;\alpha \!=\! \left( {\dfrac{1}{{1 \!+\! \dfrac{{{r_{24}} - {r_{11}}}}{{{s_{31}} - {s_{24}}}}}},\dfrac{1}{{1 \!+\! \dfrac{{{r_{23}} - {r_{12}}}}{{{s_{32}} - {s_{23}}}}}},\dfrac{1}{{1 \!+\! \dfrac{{{r_{22}} - {r_{13}}}}{{{s_{33}} - {s_{22}}}}}},\dfrac{1}{{1 \!+\! \dfrac{{{r_{21}} - {r_{14}}}}{{{s_{34}} - {s_{21}}}}}}} \right)\\ &\;\beta \!=\! \left( {\dfrac{1}{{1 \!+\! \dfrac{{{r_{34}} - {r_{21}}}}{{{s_{21}} - {s_{14}}}}}},\dfrac{1}{{1 \!+\! \dfrac{{{r_{33}} - {r_{22}}}}{{{s_{22}} - {s_{13}}}}}},\dfrac{1}{{1 \!+\! \dfrac{{{r_{32}} - {r_{23}}}}{{{s_{23}} - {s_{12}}}}}},\dfrac{1}{{1 \!+\! \dfrac{{{r_{31}} - {r_{24}}}}{{{s_{24}} - {s_{11}}}}}}} \right) \end{split} $

$M = \left( {{r_1},{r_2},{r_3},{r_4}} \right)$ 是梯形模糊数, $\alpha = ( {a_1},{a_2}, $ $ {a_3},{a_4} ),\beta = \left( {{b_1},{b_2},{b_3},{b_4}} \right)$ ,用模糊满意度[16]来比较两个模糊数的大小, $\eta $ -水平截集的左右断点分别记为 $\alpha _\eta ^L{\text{、}}\alpha _\eta ^U{\text{、}}\beta _\eta ^L{\text{、}}\beta _\eta ^U$ ,则 $\alpha _\eta ^L = {a_2}\eta + {a_1}\left( {1 - \eta } \right),$ $\alpha _\eta ^U = {a_3}\eta + $ $ {a_4}\left( {1 - \eta } \right),\beta _\eta ^L = {b_2}\eta + {b_1}\left( {1 - \eta } \right), \beta _\eta ^U = {b_3}\eta +$ ${b_4}\left( {1 - \eta } \right)$

2 基于三支决策模糊粗糙集模型的决策代价

在文献[12]中只是给出了最优阈值对 $\left( {\alpha ,\beta } \right)$ 关于决策代价的表示,并没有讨论决策代价的问题。文献[14]在多重集中用了重数刻画决策代价,那么在三支决策的模糊粗糙集模型中也可以用属性值来刻画决策代价。对比文献[13]计算决策代价的方法,本文用对象间的曼哈顿距离表示决策代价函数,再进行模糊统计,提出了一种基于相似度三支决策模糊粗糙集模型的计算决策代价的方法。

定义4 设模糊信息系统 $\varOmega = \left( {U,A,V,f} \right)$ $A = $ $ \left\{ {{a_1},{a_2}, \cdot \cdot \cdot ,{a_m}} \right\}$ 是属性集, $U = \left\{ {{x_1},{x_2}, \cdot \cdot \cdot ,{x_n}} \right\}$ 是对象集, $V = \left\{ {{V_a}\left| {a \in A} \right.} \right\} = {\left( {{v_{ij}}} \right)_{n \times m}}$ 是属性值集, ${V_a}$ 是一个隶属函数值,则每个对象在每个属性下相对于其他对象的距离为 ${{\rm{dis}}_{ij}} = {\left[ {\dfrac{{\displaystyle\sum\limits_{k = 1}^n {{{\left| {{v_{ij}} - {v_{kj}}} \right|}^p}} }}{n}} \right]^{1/p}}$ ,其中 $i = 1, 2, \cdots , n,j = $ $ 1,2, \cdot \cdot \cdot ,m$ ,则对象对相应属性的距离 $D = {\left( {\rm{di}}{{\rm{s}}_{ij}^{p}}\right)_{n \times m}}$

常用的距离有:

曼哈顿距离: ${\rm{di}}{{\rm{s}}_{ij}^{1}} = \dfrac{{\displaystyle\sum\limits_{k = 1}^n {\left| {{v_{ij}} - {v_{kj}}} \right|} }}{n}$

欧氏距离: ${\rm{di}}{{\rm{s}}_{ij}^{2}} = \sqrt {\dfrac{{\displaystyle\sum\limits_{k = 1}^n {{{\left| {{v_{ij}} - {v_{kj}}} \right|}^2}} }}{n}}$

切比雪夫距离: ${\rm{di}}{{\rm{s}}_{ij}^{m}} = {\max _{1 \leqslant k \leqslant n}}\left\{ {\left| {{v_{ij}} - {v_{kj}}} \right|} \right\}$

定义5 在 $\varOmega = \left( {U,A,V,f} \right)$ 中,决策代价函数 ${\lambda _ * }:D \to {\lambda _ * }\left( D \right)$ ${\lambda _ * }$ 为决策动作的决策代价:

1)接受决策: ${\lambda _e}\left( D \right) = 1 - D$

2)延迟决策: ${\lambda _b}\left( D \right) = \left| {0.5 - D} \right|$

3)拒绝决策: ${\lambda _r}\left( D \right) =D$

当采取接受决策时,需要付出的决策代价为产生错误决策的决策代价, ${\lambda _e}\left(D\right) = 1 - D$ ;当采取延迟决策时,未做任何决策,保留了对象的不确定性, ${\lambda _b}\left(D \right) = \left| {0.5 - D} \right|$ ;当采取拒绝决策时,需要付出的决策代价为 ${\lambda _r}\left(D \right) = D$

模糊统计方法如下:

设某个决策动作的决策代价组 ${\lambda _ * } = \left( {\lambda _ * ^1,\lambda _ * ^2, \cdot \cdot \cdot ,\lambda _ * ^m} \right)$ $\lambda _ * ^l$ 表示第 $l$ 个属性的决策代价。

1)在一个模糊信息系统 $\varOmega = \left( {U,A,V,f} \right)$ 中,计算每个对象在每个属性下相对于其他对象的距离(此处用曼哈顿距离 ${\rm{di}}{{\rm{s}}_{ij}^{1}} = \dfrac{{\displaystyle\sum\limits_{k = 1}^n {\left| {{v_{ij}} - {v_{kj}}} \right|} }}{n}$ ),得到关于决策代价的曼哈顿距离 $D = {\left( {{\rm{di}}{{\rm{s}}_{ij}^{1}}} \right)_{n \times m}}$ ,其中 $i = $ $ 1,2, \cdot \cdot \cdot ,n{\text{;}}j = 1,2, \cdot \cdot \cdot ,m$

2)计算决策代价函数 ${\lambda }_{*}\left(D\right)$

3)找出 $n$ 个值中的最小值 ${\lambda _{\min }}$ 和最大值 ${\lambda _{\max }}$ ,以 ${\lambda _{\min }} - \delta - \dfrac{{{\lambda _{\max }} - {\lambda _{\min }}}}{{2k}}$ 为起点, ${\lambda _{\max }} + \delta + \dfrac{{{\lambda _{\max }} - {\lambda _{\min }}}}{{2k}}$ 为终点, $\dfrac{{{\lambda _{\max }} - {\lambda _{\min }}}}{k}$ 为区间长度( $k \in {N^ * }$ ),划分为 $k + 1$ 个区间,其中 $\delta $ 为邻域值;

4)计算每个动作在不同属性下的隶属频率 $f = \dfrac{m}{n}$ ,其中 $n$ 为随机选择的样本总数, $m$ 为区间样本覆盖某个值的 $\delta $ 邻域的频数;

5)以实数 $x$ 为横坐标,隶属频率为纵坐标,对点进行曲线拟合,取决策动作在每个属性下曲线最高点的横坐标,得到一个不同属性下的决策代价组;

6)某个决策动作的决策代价即为

$ {\lambda _ * } = \sqrt {\dfrac{{\displaystyle\sum\limits_{l = 1}^m {\lambda {{_ * ^l}^2}} }}{m}} $
3 实例分析

实验采用的配置如下:CPU为Intel(R) Celeron(R) CPU 1007U @ 1.5 GHz,4.0 GB内存,软件是64位MATLAB R2014a。

基于文献[12]的模糊信息系统实例来分析本文基于三支决策模糊粗糙集模型的决策代价。

例1  $\varOmega = \left( {U,A,V,f} \right)$ 是一个模糊信息系统,如表1所示。其中,对象集合 $U = \left\{ {{x_1},{x_2}, \cdot \cdot \cdot ,{x_8}} \right\}$ ,属性集合 $A = \left\{ {{a_1},{a_2}, \cdot \cdot \cdot ,{a_4}} \right\}$ $\forall a \in A,\forall x \in U$ ,对象的隶属度为 ${\mu _a}\left( x \right) \in \left[ {0,1} \right]$

表 1 模糊信息系统 Tab.1 Fuzzy information system

计算每个对象在每个属性下相对于其他对象的曼哈顿距离 ${\rm{di}}{{\rm{s}}_{ij}^{1}} = \dfrac{{\displaystyle\sum\limits_{k = 1}^8 {\left| {{v_{ij}} - {v_{kj}}} \right|} }}{8}$ ,其中, $i = 1,2, \cdot \cdot \cdot , $ $ 8{\text{;}}j = 1, 2, \cdot \cdot \cdot ,4$ ,得到的关于决策代价的曼哈顿距离 $D= {\left( {{\rm{di}}{{\rm{s}}_{ij}^{1}}} \right)_{8 \times 4}}$ 表2所示。

表 2 曼哈顿距离 Tab.2 Manhattan distance

计算当采取接受决策时的决策代价 ${\lambda _e}\left( D\right) = $ $ 1 - D$ ,则得到接受决策的决策代价如表3所示。

表 3 接受决策的决策代价 Tab.3 Decision costs of accepting the decision

接受决策的决策代价在属性 ${a_1}$ 下的最小值为0.475,最大值为0.7,取 $\delta = 0.15$ ,以0.3125为起点,0.8625为终点,0.025为区间长度,划分为22个区间。接受决策属性 ${a_1}$ 的决策代价频率分布如表4所示。

表 4 属性 ${a_1}$ 决策代价频率分布 Tab.4 Attribute ${a_1}$ decision costs frequency distribution

以决策代价 $x_1$ 为横坐标,隶属频率为纵坐标,对点进行曲线拟合,接受决策的决策代价在属性 ${a_1}$ 下的隶属频率拟合曲线如图1所示。图2~4分别是接受决策在属性 ${a_2}{\text{、}}{a_3}{\text{、}}{a_4}$ 下的隶属频率拟合曲线。

Download:
图 1 接受决策属性 ${a_1}$ 频率分布拟合曲线 Fig. 1 Accept the decision attribute ${a_1}$ frequency distribution fitting curve
Download:
图 2 接受决策属性 ${a_2}$ 频率分布拟合曲线 Fig. 2 Accept the decision attribute ${a_2}$ frequency distribution fitting curve
Download:
图 3 接受决策属性 ${a_3}$ 频率分布拟合曲线 Fig. 3 Accept the decision attribute ${a_3}$ frequency distribution fitting curve
Download:
图 4 接受决策属性 ${a_4}$ 频率分布拟合曲线 Fig. 4 Accept the decision attribute ${a_4}$ frequency distribution fitting curve

以上各个拟合曲线取最高点的横坐标作为该决策动作不同属性下的决策代价,得到接受决策在属性 ${a_1}{\text{、}}{a_2}{\text{、}}{a_3}{\text{、}}{a_4}$ 下的决策代价分别为0.6347、0.6738、0.737、0.7465,因此接受决策的决策代价组为 ${\lambda _e} = \left( {0.634\;7,0.673\;8,0.737\;0,0.746\;5} \right)$ 。同理,对延迟决策和拒绝决策按照以上步骤处理,得到延迟决策的决策代价组为 ${\lambda _b} = ( 0.145\;9,0.174\;1,0.237\;8, $ $ 0.246\;5 )$ ,拒绝决策的决策代价组为 ${\lambda _r} = ( 0.365\;3, $ $ 0.326\;2, 0.263\;0,0.253\;5)$

对3个决策代价组分别求欧氏距离 ${\lambda _ * } = $ $ \sqrt {\dfrac{{\displaystyle\sum\limits_{l = 1}^4 {\lambda {{_ * ^l}^2}} }}{4}} $ ,得到3个决策动作的决策代价分别为 ${\lambda _e} = $ $ 0.699\;5,{\lambda _b} \!=\! 0.205\;5,{\lambda _r} = 0.305\;5$ 。所以, $\alpha \!= \!\dfrac{{{\lambda _e} + 0.5{\lambda _b}}}{{{\lambda _e} + {\lambda _b}}} = $ $ 0.886, \beta = \dfrac{{0.5{\lambda _b}}}{{{\lambda _b} + {\lambda _r}}} = 0.201$

通过比较文献[12]与本文的结果,可以看出本文计算得出的阈值对是合理的。表5给出了文献[12]与本文计算得出的阈值对。

表 5 文献[12]与本文的阈值对比 Tab.5 Comparision of the threshold pair between Ref. [12] and this study

例2  $\varOmega = \left( {U,A,V,f} \right)$ 是一个模糊信息系统,如表6所示。其中,对象集合 $U = \left\{ {{x_1},{x_2}, \cdot \cdot \cdot ,{x_{10}}} \right\}$ ,属性集合 $A = \left\{ {{a_1},{a_2},{a_3},{a_4}} \right\}$ $\forall a \in A,\forall x \in U$ ,对象的隶属度为 ${\mu _a}\left( x \right) \in \left[ {0,1} \right]$ (数据来源UCI:Connectionist Bench(Sonar, Mines vs. Rocks))。

表 6 联结主义数据 Tab.6 Connectionist date

计算每个对象在每个属性下相对于其他对象的曼哈顿距离 ${\rm{di}}{{\rm{s}}_{ij}^{1}} = \dfrac{{\displaystyle\sum\limits_{k = 1}^{10} {\left| {{v_{ij}} - {v_{kj}}} \right|} }}{{10}}$ $i = 1,2, \cdots ,10,j = 1, $ $ 2, \cdots ,4$ ,得到的关于决策代价的曼哈顿距离 $D = $ $ {\left( {{\rm{di}}{{\rm{s}}_{ij}^{1}}} \right)_{10 \times 4}}$ 表7所示。

计算接受决策的决策代价 ${\lambda _e}\left( D \right) = 1 -D$ ,得到接受决策的决策代价如表8所示。

表 7 曼哈顿距离 Tab.7 Manhattan distance
表 8 接受决策的决策代价 Tab.8 Decision costs of accepting the decision

接受决策的决策代价在属性 ${a_1}$ 下的最小值为0.5525,最大值为0.7435,取 $\delta = 0.070\;5$ ,以0.47536为起点,0.82064为终点,0.01328为区间长度,划分为26个区间。其频率分布如表9所示。

表 9 属性 ${a_1}$ 决策代价频率分布 Tab.9 Attribute ${a_1}$ decision costs frequency distribution

以决策代价 $x_1$ 为横坐标,隶属频率为纵坐标,对点进行曲线拟合,接受决策的决策代价在属性 ${a_1}$ 下的隶属频率拟合曲线如图5所示。图6~8分别是接受决策在属性 ${a_2}{\text{、}}{a_3}{\text{、}}{a_4}$ 下的隶属频率拟合曲线。

Download:
图 5 接受决策属性 ${a_1}$ 频率分布拟合曲线 Fig. 5 Accept the decision attribute ${a_1}$ frequency distribution fitting curve
Download:
图 6 接受决策属性 ${a_2}$ 频率分布拟合曲线 Fig. 6 Accept the decision attribute ${a_2}$ frequency distribution fitting curve
Download:
图 7 接受决策属性 ${a_3}$ 频率分布拟合曲线 Fig. 7 Accept the decision attribute ${a_3}$ frequency distribution fitting curve
Download:
图 8 接受决策属性 ${a_4}$ 频率分布拟合曲线 Fig. 8 Accept the decision attribute ${a_4}$ frequency distribution fitting curve

以上各个拟合曲线取最高点的横坐标作为该决策动作不同属性下的决策代价,得到接受决策在属性 ${a_1}{\text{、}}{a_2}{\text{、}}{a_3}{\text{、}}{a_4}$ 下的决策代价分别为0.6557、0.6568、0.6599、0.7546,因此接受决策的决策代价组为 ${\lambda _e} = \left( {0.655\;7,0.656\;8,0.659\;9,0.754\;6} \right)$ 。同理,对延迟决策和拒绝决策按照以上步骤处理,得到延迟决策的决策代价组为 ${\lambda _b} = ( 0.154\;9, 0.157\;5, 0.159\;2, $ $ 0.254\;6)$ ,拒绝决策的决策代价组为 ${\lambda _r} = ( 0.344\;3, $ $ 0.343\;3,0.340\;1, $ $ 0.245\;4)$

对3个决策代价组分别求欧氏距离 ${\lambda _ * } = $ $ \sqrt {\dfrac{{\displaystyle\sum\limits_{l = 1}^4 {\lambda {{_ * ^l}^2}} }}{4}} $ ,得到3个决策动作的决策代价分别为 ${\lambda _e}\! =\! $ $ 0.683\;0,{\lambda _b} \!=v 0.186\;4,{\lambda _r} \!=\! 0.321\;0$ 。所以 , $\alpha\! =\! \dfrac{{{\lambda _e}\! +\! 0.5{\lambda _b}}}{{{\lambda _e} + {\lambda _b}}} = $ $ 0.892\;8,\beta = \dfrac{{0.5{\lambda _b}}}{{{\lambda _b} + {\lambda _r}}}$ $ = 0.183\;7$

例3   $\varOmega = \left( {U,A,V,f} \right)$ 是一个模糊信息系统,如表10所示。其中,对象集合 $U = \left\{ {{x_1},{x_2}, \cdot \cdot \cdot ,{x_{10}}} \right\}$ ,属性集合 $A = \left\{ {{a_1},{a_2},{a_3},{a_4},{a_5}} \right\}$ $\forall a \in A,\forall x \in U$ ,对象的隶属度为 ${\mu _a}\left( x \right) \in \left[ {0,1} \right]$ (数据来源UCI:Ionosphere)。

表 10 逸散层数据 Tab.10 Lonosphere data

计算每个对象在每个属性下相对于其他对象的曼哈顿距离 ${\rm{di}}{{\rm{s}}_{ij}^{1}} = \dfrac{{\displaystyle\sum\limits_{k = 1}^{10} {\left| {{v_{ij}} - {v_{kj}}} \right|} }}{{10}}$ $i = 1,2, \cdots ,10,j = 1, $ $ 2, \cdots ,5$ ,得到的关于决策代价的曼哈顿距离 $D = $ $ {\left( {{\rm{di}}{{\rm{s}}_{ij}^{1}}} \right)_{10 \times 5}}$ ,如表11所示。

表 11 曼哈顿距离 Tab.11 Manhattan distance

计算接受决策的决策代价 ${\lambda _e}\left(D \right) = 1 - D$ ,得到接受决策的决策代价如表12所示。

表 12 接受决策的决策代价 Tab.12 Decision costs of accepting the decision

接受决策的决策代价在属性 ${a_1}$ 下的最小值为0.5445,最大值为0.7694,取 $\delta = 0.138\;3$ ,以0.393665为起点,0.920135为终点,0.02507为区间长度,划分21个区间。其频率分布如表13所示。

表 13 属性 ${a_1}$ 决策代价频率分布 Tab.13 Attribute ${a_1}$ decision costs frequency distribution

以决策代价 $x$ 为横坐标,隶属频率为纵坐标,对点进行曲线拟合,接受决策的决策代价在属性 ${a_1}$ 下的隶属频率拟合曲线如图9所示。图10~13分别是接受决策在属性 ${a_2}{\text{、}}{a_3}{\text{、}} $ $ {a_4}{\text{、}}{a_5}$ 下的隶属频率拟合曲线。

Download:
图 9 接受决策属性 ${a_1}$ 频率分布拟合曲线 Fig. 9 Accept the decision attribute ${a_1}$ frequency distribution fitting curve
Download:
图 10 接受决策属性 ${a_2}$ 频率分布拟合曲线 Fig. 10 Accept the decision attribute ${a_2}$ frequency distribution fitting curve
Download:
图 11 接受决策属性 ${a_3}$ 频率分布拟合曲线 Fig. 11 Accept the decision attribute ${a_3}$ frequency distribution fitting curve

以上各个拟合曲线取最高点的横坐标作为该决策动作不同属性下的决策代价,得到接受决策在属性 ${a_1}{\text{、}}{a_2}{\text{、}}{a_3}{\text{、}}{a_4}{\text{、}}{a_5}$ 下的决策代价分别为0.6966、0.6840、0.7552、0.7272、0.7077,因此接受决策的决策代价组为 ${\lambda _e} = ( 0.696\;6,0.684\;0,0.755\;2, $ $ 0.727\;2, 0.707\;7)$ 。同理,对延迟决策和拒绝决策按照以上步骤处理,得到延迟决策的决策代价组为 ${\lambda _b} = \left( {0.202\;5,0.187\;2,0.255\;2,0.227\;2,0.207\;7} \right)$ ,拒绝决策的决策代价组为 ${\lambda _r} =( 0.303\;3,0.316\;0,0.244\;7, 0.272\;9, $ $ 0.292\;3)$

Download:
图 12 接受决策属性 ${a_4}$ 频率分布拟合曲线 Fig. 12 Accept the decision attribute ${a_4}$ frequency distribution fitting curve
Download:
图 13 接受决策属性 ${a_5}$ 频率分布拟合曲线 Fig. 13 Accept the decision attribute ${a_5}$ frequency distribution fitting curve

对3个决策代价组分别求欧氏距离 ${\lambda _ * } = $ $ \sqrt {\dfrac{{\displaystyle\sum\limits_{l = 1}^5 {\lambda {{_ * ^l}^2}} }}{5}} $ ,得到3个决策动作的决策代价分别为 ${\lambda _e} \!=\! $ $ 0.714\;6,{\lambda _b} \!=\! 0.217\;2,{\lambda _r} \!=\! 0.286\;9$ 。所以, $\alpha = \dfrac{{{\lambda _e} + 0.5{\lambda _b}}}{{{\lambda _e} + {\lambda _b}}} = $ $ 0.883\;5,\beta = \dfrac{{0.5{\lambda _b}}}{{{\lambda _b} + {\lambda _r}}}$ $= 0.215\;4$

4 结束语

决策粗糙集模型是粗糙集模型的概率拓展,其通过使用损失函数和贝叶斯决策过程计算阈值对。在区间值决策粗糙集的框架下,已经研究了最优阈值对 $\left( {\alpha ,\beta } \right)$ 的上、下近似。本文在基于相似度的三支决策模糊粗糙集模型中讨论决策代价,通过定义函数将模糊信息系统中的模糊数与三支决策的决策代价联系在一起,通过对隶属频率拟合的过程,得到不同决策动作在不同属性下的决策代价,再计算其欧氏距离,得到不同决策动作的决策代价,代入文献[12]得到的阈值对表达式来计算 $\left( {\alpha ,\beta } \right)$ 。本文只是在基于相似度的三支决策模糊粗糙集模型中讨论决策代价,还有许多其他的模糊粗糙集模型中的决策代价有待研究。

参考文献
[1] DUBOIS D, PRADE H. Rough fuzzy sets and fuzzy rough sets[J]. International journal of general systems, 1990, 17(2/3): 191-209. (0)
[2] DUBOIS D, PRADE H. Putting rough sets and fuzzy sets together[M]//SŁOWIŃSKI R. Intelligent Decision Support: Handbook of Applications and Advances of the Rough Sets Theory. Dordrecht: Springer, 1992: 203−222. (0)
[3] SUN Bingzhen, MA Weimin, ZHAO Haiyan. Decision-theoretic rough fuzzy set model and application[J]. Information sciences, 2014, 283: 180-196. DOI:10.1016/j.ins.2014.06.045 (0)
[4] YAO Y Y, WONG S K M. A decision theoretic framework for approximating concepts[J]. International journal of man-machine studies, 1992, 37(6): 793-809. DOI:10.1016/0020-7373(92)90069-W (0)
[5] ZHAO Xuerong, HU Baoqing. Fuzzy and interval-valued fuzzy decision-theoretic rough set approaches based on fuzzy probability measure[J]. Information sciences, 2015, 298: 534-554. DOI:10.1016/j.ins.2014.12.008 (0)
[6] YAO Yiyu. An outline of a theory of three-way decision[C]//Proceedings of the International Conference on Rough Sets and Current Trends in Computing. Berlin, Heidelberg, Germany, 2012: 1−17. (0)
[7] LIANG Decui, LIU Dun. Systematic studies on three-way decisions with interval-valued decision-theoretic rough sets[J]. Information sciences, 2014, 276: 186-203. DOI:10.1016/j.ins.2014.02.054 (0)
[8] LIANG Decui, XU Zeshui, LIU Dun. Three-way decisions based on decision-theoretic rough sets with dual hesitant fuzzy information[J]. Information sciences, 2017, 396: 127-143. DOI:10.1016/j.ins.2017.02.038 (0)
[9] LIANG Decui, XU Zeshui, LIU Dun. Three-way decisions with intuitionistic fuzzy decision-theoretic rough sets based on point operators[J]. Information sciences, 2017, 375: 183-201. DOI:10.1016/j.ins.2016.09.039 (0)
[10] FENG Tao, MI Jusheng. Variable precision multigranulation decision-theoretic fuzzy rough sets[J]. Knowledge-based systems, 2016, 91: 93-101. DOI:10.1016/j.knosys.2015.10.007 (0)
[11] DENG Xiaofei, YAO Yiyu. Decision-theoretic three-way approximations of fuzzy sets[J]. Information sciences, 2014, 279: 702-715. DOI:10.1016/j.ins.2014.04.022 (0)
[12] 杨霁琳, 张贤勇, 唐孝, 等. 基于最优相似度三支决策的模糊粗糙集模型[J]. 计算机科学, 2018, 45(10): 27-32.
YANG Jilin, ZHANG Xianyong, TANG Xiao, et al. Fuzzy rough set model based on three-way decisions of optimal similar degrees[J]. Computer science, 2018, 45(10): 27-32. DOI:10.11896/j.issn.1002-137X.2018.10.005 (0)
[13] 衷锦仪, 叶东毅. 基于模糊数风险最小化的拓展决策粗糙集模型[J]. 计算机科学, 2014, 41(3): 50-54.
ZHONG Jinyi, YE Dongyi. Extended decision-theoretic rough set models based on fuzzy minimum cost[J]. Computer science, 2014, 41(3): 50-54. DOI:10.3969/j.issn.1002-137X.2014.03.010 (0)
[14] ZHAO Xuerong, HU Baoqing. Three-way decisions with decision-theoretic rough sets in multiset-valued information tables[J]. Information sciences, 2020, 507: 684-699. DOI:10.1016/j.ins.2018.08.024 (0)
[15] LIANG Decui, LIU Dun, PEDRYCZ W, et al. Triangular fuzzy decision-theoretic rough sets[J]. International journal of approximate reasoning, 2013, 54(8): 1087-1106. DOI:10.1016/j.ijar.2013.03.014 (0)
[16] LIU Xinwang. Measuring the satisfaction of constraints in fuzzy linear programming[J]. Fuzzy sets and systems, 2001, 122(2): 263-275. DOI:10.1016/S0165-0114(00)00114-7 (0)
[17] YAO Yiyu, ZHAO Yan. Attribute reduction in decision-theoretic rough set models[J]. Information sciences, 2008, 178(17): 3356-3373. DOI:10.1016/j.ins.2008.05.010 (0)
[18] LI Wentao, XU Weihua. Double-quantitative decision-theoretic rough set[J]. Information sciences, 2015, 316: 54-67. DOI:10.1016/j.ins.2015.04.020 (0)
[19] QIAN Yuhua, ZHANG Hu, SANG Yanli, et al. Multigranulation decision-theoretic rough sets[J]. International journal of approximate reasoning, 2014, 55(1): 225-237. DOI:10.1016/j.ijar.2013.03.004 (0)
[20] ZHANG Hongying, YANG Shuyun, MA Jianmin. Ranking interval sets based on inclusion measures and applications to three-way decisions[J]. Knowledge-based systems, 2016, 91: 62-70. DOI:10.1016/j.knosys.2015.07.025 (0)
[21] LI Weiwei, HUANG Zhiqiu, JIA Xiuyi, et al. Neighborhood based decision-theoretic rough set models[J]. International journal of approximate reasoning, 2016, 69: 1-17. DOI:10.1016/j.ijar.2015.11.005 (0)
[22] 邢航. 基于构造性覆盖算法的三支决策模型[D]. 合肥: 安徽大学, 2014.
XING Hang. Three-way decisions model based on constructive covering algorithm[D]. Hefei: Anhui University, 2014. (0)
[23] 徐健锋, 何宇凡, 刘斓. 三支决策代价目标函数的关系及推理研究[J]. 计算机科学, 2018, 45(6): 176-182.
XU Jianfeng, HE Yufan, LIU Lan. Relationship and reasoning study for three-way decision cost objective functions[J]. Computer science, 2018, 45(6): 176-182. DOI:10.11896/j.issn.1002-137X.2018.06.031 (0)
[24] LIU Jiubing, LI Huaxiong, ZHOU Xianzhong, et al. An optimization-based formulation for three-way decisions[J]. Information sciences, 2019, 495: 185-214. DOI:10.1016/j.ins.2019.05.010 (0)