«上一篇
文章快速检索     高级检索
下一篇»
  应用科技  2020, Vol. 47 Issue (1): 88-93  DOI: 10.11991/yykj.202001005
0

引用本文  

周武庆, 康向平, 张超. 面向复杂评价和决策的数据分析模型及其在烟草行业的应用[J]. 应用科技, 2020, 47(1): 88-93. DOI: 10.11991/yykj.202001005.
ZHOU Wuqing, KANG Xiangping, ZHANG Chao. A data analysis model for complex evaluations and decisions and its applications in tobacco industry[J]. Applied Science and Technology, 2020, 47(1): 88-93. DOI: 10.11991/yykj.202001005.

基金项目

国家自然科学基金项目(61603278,61806116,61972238,61802237);山西省重点研发计划项目(国际科技合作,201903D421041);山西省自然科学基金项目(201801D221175,201901D211176);山西省高等学校科技创新项目(201802014,2019L0066);山西省高等学校优秀成果培育项目(2019SK036);山西省高等学校青年科研人员培育计划

通信作者

周武庆,Email:zhouwq@sx.tobacco.gov.cn

作者简介

周武庆,男,从事企业管理工作;
康向平,男,高级工程师,博士后

文章历史

收稿日期:2020-01-05
网络出版日期:2020-03-20
面向复杂评价和决策的数据分析模型及其在烟草行业的应用
周武庆1, 康向平1, 张超2    
1. 中国烟草总公司 山西省公司,山西 太原 030006;
2. 山西大学 计算智能与中文信息处理教育部重点实验室 计算机与信息技术学院,山西 太原 030006
摘要:随着烟草行业信息化建设的快速发展,各类辅助决策系统相继建立。然而,大多数辅助决策系统依赖于传统的统计学分析,无法对复杂的主观性强的评价和决策信息进行有效表示与分析,辅助决策存在一定局限性。据此,本文以复杂评价和决策问题为研究对象,以烟草行业为应用背景,借助模糊论、概率论以及粗糙集(rough sets,RS)等理论,尝试去构建一种广义上的数据分析方法。该方法结合心理学,应用范围广,能充分体现评价人的主观意识和决策心理,能为卷烟产品定性定量分析评价、生产经营管理决策提供更为合理的理论支持。
关键词烟草信息化    辅助决策    概率论    复杂评价    模糊集    RS理论    犹豫心理    卷烟产品评价    
A data analysis model for complex evaluations and decisions and its applications in tobacco industry
ZHOU Wuqing1, KANG Xiangping1, ZHANG Chao2    
1. China Tobacco General Company Shanxi Company, Taiyuan 030006, China;
2. Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education, School of Computer and Information Technology, Shanxi University, Taiyuan 030006, China
Abstract: In recent years, with the rapid development of informatization construction in tobacco industry, various assistant decision-making systems have been set up successively. However, the majority of assistant decision-making systems still rely on traditional statistical analysis, and they cannot effectively handle information descriptions and analysis for complex and strong subjective evaluations and decisions, which have some limitations in aiding the decision making. Hence, in order to study complex evaluations and decisions, taking complex evaluation and decision-making problem as the research object and tobacco industry as an example of application, this paper tries to construct a generalized data analysis approach by means of fuzzy sets, probabilistic theory, rough sets and so on. The approach combines psychology, fully embodies the subjective consciousness and decision-making psychology of the appraiser, has a wider application range, and can provide a theoretical support for qualitative and quantitative evaluations, and management decisions of tobacco productions.
Keywords: tobacco informatization    assistant decision-making system    probabilistic theory    complex evaluations    fuzzy sets    rough set theory    hesitation psychology    tobacco productions evaluations    

大数据时代,信息化辅助决策在烟草行业显得愈发重要,基于数据挖掘和人工智能技术的烟草信息化系统近年来得到了快速发展。经过十余年的信息化建设,全国烟草行业的信息化网络已初步建成[1]。然而,当前烟草信息系统中仍存在一些瓶颈,尤其是辅助决策系统主要依赖于简单的统计学方法,针对现实中诸多不确定性信息还无法有效处理[2-3]。随着《烟草行业信息化发展规划(2014—2020)》的正式发布,烟草行业对信息化建设的深度愈加紧迫,因此有必要研究不确定环境下的行业数据挖掘方法。

在构建面向复杂问题的辅助决策系统时,通常需要处理两大任务,即评价或决策信息的表示,以及评价或决策信息的分析处理[4-5]。在信息表示方面,模糊理论将经典集合论中隶属度的取值范围由0或1推广到闭区间[0,1],可有效表示不确定性信息。随后,诸多推广模糊数据分析模型相继被提出,从不同的角度完善了不确定性信息的表示手段[6-7]。其中,为了合理描述专家在决策过程中犹豫不决这一心理状态,美国学者Smarandache[8]于上世纪末同时引入了包含隶属度、犹豫度和非隶属度的序对来表示不确定性信息,随后,犹豫模糊分析理论被建立,并在管理决策领域产生了广泛的影响[9-11]。2015年,Ye[12]进一步发展了犹豫模糊分析理论,提出了一种广义的犹豫模糊理论,建立了犹豫中智集的概念,其可为烟草辅助决策信息的表示提供有效的理论工具[13-14]。此外,在评价和决策信息分析处理方面,RS理论从确定性规则与可能性规则的角度出发,通过下近似集合与上近似集合来进行数据挖掘,是一种行之有效的管理决策工具[15-18]。在众多RS模型之中,概率粗糙集(probabilistic rough set, PRS)模型通过引入条件概率,能够降低错误分类对最终决策结果的影响,可为烟草辅助决策信息的分析提供具有较强稳定性和鲁棒性的方案[19-21]

总的来讲,针对复杂的评价和决策问题,传统统计学存在一定局限性,相关研究正逐步向更高级更复杂的方向持续演进,在此背景下,本文研究,无论是对于丰富相关理论,还是更好地辅助管理决策,显然都是有意义的。

1 问题提出

通常,在处理复杂评价和决策问题时,人们往往会从多个不同角度去看待问题,尽管角度不同,结果会有差异,但综合起来却可能是一个相对全面客观的评价,在这方面,正反两方面评价就是一种最常见的方式。例如,当对一个人的品行进行评价时,如果基于正面评价的结论是:“他是一个有担当、讲责任、明规矩的人”,基于反面评价的结论是“他不是一个卑劣、庸俗、自私的人”,尽管正反两方面评价出发点不一样,但目标指向却是一致的,在此情形下,综合起来更能充分说明:这个人是一个具有良好品行的人。事实上,无论是对于什么样的评价客体,只要是遵循上述评价理念,评价的结果一般都不会出现太大的偏差。

当然,在实际评价和决策中,除了多视角综合分析外,可能更需要人们统筹考虑以下影响因素:

1)应注重评价人的自身心理状态。评价时,评价人可能会犹豫不决。犹豫,说明对事物的评价没有足够把握,结果不一定准确、可信度较低;相反,不犹豫,则说明可信度较高。事实上,这样的心理因素是非常重要的。一定程度上来讲,评价人不仅仅是评价主体,同时也是评价客体,需要对自身犹豫心理给出一个客观合理的评价,只有这样,才能从根源上客观反映出评价结果的合理性。

2)应注重评价和决策结果的不唯一性。以正面评价为例,如果满分是100分的话,结论也许是一个范畴,如80~90分,亦或是这个范畴中的多个值,如80分、85分、88分等,这些值可能无法取舍,都具有一定的合理性。在此情形下,如果一味强调评价结果的唯一性,而忽视评价结果的多样性,那么评价结果可能是片面的,是不完整的。同样,对于反面评价,或者是评价人对自身心理状态的评价,都可能会面临评价结果不唯一这样的实际情况。

3)应注重评价和决策的模糊性。在确定性逻辑下,人们对于事物的判定结果只有“0”和“1”两种情况,非此即彼,二者必居其一。然而,边界的模糊性是普遍存在的,甚至是像高与底、强与弱、好与坏等这些明显对立特征的概念也没有绝对分明的边界。在此情形下,确定性逻辑尽管简单易懂易用,但在处理一些复杂的评价或决策时,往往不利于人们从看似不相关的复杂数据中发现一些潜在的有价值的知识。例如,当评价一个人是否年轻时,也许没有一个肯定的回答(用“1”表示),或一个否定的回答(用“0”表示),只能是给出一个介于“0”和“1”之间的中间值,即用“隶属于年轻人群体的大小程度”去度量这种模糊情况。

在实际应用中,当人们统筹考虑上述因素去处理一些相对复杂的评价和决策问题时,如果仅仅是依赖于一些传统的评价方法或模型,评价结果可能会失真,与实际存在较大的偏差。近年来,尽管相关研究取得了一定进展,但尚处于初始阶段,尤其是,犹豫,这种反映评价人心理的客观事实,在数据建模关键步骤中尚未得到足够的重视,心理学与统计学的融合问题仍有待进一步深入研究。

为有效应对复杂数据背景下不确定性问题建模、分析与计算任务,适应更复杂环境下的评价和决策需求,为解决烟草行业辅助决策系统在处理不确定性决策信息时存在的局限性,本文统筹考虑正反两个方面的模糊评价、评价人对自身心理状态的评价,以及评价结果的多样性,尝试借助模糊论、概率论,以及RS理论等,从信息表示与信息分析两个层面出发,去探讨一种广义上的数学分析方法。该方法涉及心理因素分析,应用范围较广,可以为卷烟品牌发展评价、生产经营管理决策提供一定的理论支持,也可以为科学合理设计烟草行业计算机辅助决策系统提供有益参考。

2 基础知识

基于上一节对评价或决策理念的认知,本文选用广义犹豫模糊理论,即基于犹豫中智集作为信息表示工具,其中犹豫中智集的形式化定义为:

对于数据集U,一个犹豫中智集A由3个函数来刻画,即隶属函数 $C{T_A}:U \to {\rm{int}}\left[ {0,1} \right]$ ,犹豫函数 $C{I_A}:U \to {\rm{int}}\left[ {0,1} \right]$ 和非隶属函数 $C{F_A}:U \to $ ${\rm{int}}\left[ {0,1} \right]$ ${\rm{int}}\left[ {0,1} \right] $ 代表[0,1]的幂集。在此意义下,犹豫中智集A被描述为[12]

$ A = \left\{ {\left\langle {x,I,{\rm{}}J,{\rm{}}K} \right\rangle |x \in U} \right\} $

式中: $I = \left( {T_A^1\left( x \right),T_A^2\left( x \right),{\rm{}} \cdots ,T_A^q\left( x \right)} \right) $ 为隶属函数序列; $J = \left( {I_A^1\left( x \right),\;I_A^2\left( x \right),\; \cdots ,I_A^q\left( x \right)} \right) $ 为犹豫函数序列; $K =$ $ \left( {F_A^1\left( x \right),} {F_A^2\left( x \right),\; \cdots ,\;F_A^q\left( x \right)} \right) $ 为非隶属函数序列。此外,IJK中的各个元素按照升序排列,且对于i=1,2,…,q序列中的元素需满足 $0 \leqslant T_A^i\left( {{x}} \right) + I_A^i\left( {{x}} \right) + $ $F_A^i\left( {{x}} \right) \leqslant 3$ 的条件约束。

基于不同的表示方法,展现的内容和方式是不一样的。事实上,相对于传统方法,基于犹豫中智集的信息表示相对更为合理,信息量也更为丰富。例如:

模糊理论:隶属度(单一值),非隶属度(单一值),如 $\left\langle {0.6,0.1} \right\rangle $ ,其中0.6为隶属度、0.1为非隶属度。

犹豫模糊理论:隶属度(单一值)、犹豫度(单一值)、非隶属度(单一值),如 $\left\langle {0.6,0.1,0.1} \right\rangle $ ,其中0.6为隶属度、0.1为犹豫度、0.1为非隶属度。

广义犹豫模糊理论(即犹豫中智集):隶属度(单一值或多个值)、犹豫度(单一值或多个值)、非隶属度(单一值或多个值),如 $\left\langle {\left( {0.6,0.7} \right),\left( {0.1,0.2} \right),} \right.$ $\left. {\left( {0.05,0.1} \right)} \right\rangle $ ,其中0.6和0.7均为隶属度、0.1和0.2均为犹豫度、0.05和0.1均为非隶属度。

在信息分析处理方面,传统方法同样无法提供考虑错误分类对最终结论影响的机制,因此本文尝试引用PRS模型作为信息分析工具。

假设U是一个数据集,(U, R )是一个近似空间,P是一个基于σ代数的概率度量,则(U, R, P)是一个概率近似空间。常见的概率分布如正态分布的概率密度函数:

$f\left( {x|\mu ,{\sigma ^2}} \right) = \frac{1}{{\sqrt {2{\text{π}} {\sigma ^2}} }}{{\rm e}^{ - \frac{{{{\left( {x - \mu } \right)}^2}}}{{2{\sigma ^2}}}}}$

拉普拉斯分布概率密度函数:

${\rm{Laplace}}\left( {x,\mu ,\gamma } \right) = \frac{1}{{2\gamma }}{\rm{exp}}\left( { - \frac{{\left| {x - \mu } \right|}}{\gamma }} \right)$

伯努利分布概率密度函数:

$p\left( x \right) = {p^x}{\left( {1 - p} \right)^{1 - x}}$

对于阈值 $0 \leqslant \beta \leqslant {\rm{\alpha }} \leqslant 1$ ,任意集合 $X \subseteq U$ X关于(U, R, P)的下近似集合与上近似集合可表示为[9]

$ {\underline P _\alpha }\left( X \right) = \left\{ {x \in U|P\left( {X|\left[ x \right]{\rm{}}} \right) \geqslant \alpha } \right\} $
${\bar P_\beta }\left( X \right) = \left\{ {x \in U|P\left( {X|\left[ x \right]{\rm{}}} \right) > \beta } \right\}$

同时,依据 $X$ 关于(U, R, P)的下近似集合与上近似集合, $X$ 的正域、负域与边界域可表示为

$ {\rm{POS}}\left( {X,\alpha ,\beta } \right) = {\underline P _\alpha }\left( X \right) = \left\{ {x \in U|P\left( {X|\left[ x \right]{\rm{}}} \right) \geqslant \alpha } \right\} $
${\rm{NEG}}\left( {X,\alpha ,\beta } \right) = U - {\bar P_\beta }\left( X \right) = \left\{ {x \in U|P\left( {X|\left[ x \right]{\rm{}}} \right) \leqslant \beta } \right\}$
$ {\rm{BND}}\left( {X,\alpha ,\beta } \right) = {\bar P_\beta }\left( X \right) - {\underline P _\alpha }\left( X \right) = \left\{ {x \in U|\beta < P\left( {X|\left[ x \right]{\rm{}}} \right) < \alpha } \right\} $

上述PRS模型,主要是用于数据分类处理,即将待评价数据集最终划分为3个不同的类:一类是正域 ${\rm{POS}}\left( {X,\alpha ,\beta } \right)$ ,正域中的数据肯定属于集合X;一类是边界域 ${\rm{BND}}\left( {X,\alpha ,\beta } \right)$ ,边界域中的数据可能包含于集合X;最后一类是负域 ${\rm{NEG}}\left( {X,\alpha ,\beta } \right)$ ,负域中的数据肯定不属于集合X。此外,阈值参数αβ,代表对于决策失误的容忍度,即专家做出错误决策在一定程度下也不会影响正确决策结论的得出。

3 问题分析及数据建模

在现实生活中,人们通常会做出各种各样的评价和决策,但大多数情况下,这些决策更多是一种匹配性的决策。例如,当消费者在选择卷烟品牌时,其购买前,一定是有内在诉求的,即每个消费者心目中都会有一个理想的品牌,以及相应的理想评价集合(即,针对理想品牌每一项评价指标预先给出的理想期待值,如品牌焦油含量要低、卷烟质量要过硬、香型要清香、浓香、中间香或雅香、外包装设计要精美、品牌文化要得到认同、价格要适中……)。在实际购买中,当面对n个不同的卷烟品牌,消费者同样也会从焦油含量、香型、外包装设计、品牌文化、价格等m个角度做出现场评价(本质上是建立n个品牌与m个评价指标之间的评价矩阵),与消费者内心期待相近、相吻合、匹配程度较高的即为消费者心仪的卷烟品牌(本质上是将理想评价集合与决策矩阵进行匹配)。

对于如何匹配,本文引入了条件概率的建模思想。从本质上来讲,条件概率模型本身就是一个典型的匹配性决策模型,通常,条件概率模型表示为

$P\left( {A{\rm{|}}B} \right) = \frac{{P\left( {AB} \right)}}{{P\left( B \right)}}$

即在事件B发生的条件下,事件B和事件A同时发生的概率。在本文中,决策矩阵可以理解为“条件部分”,对应事件B;理想评价集合可以理解为事件A;事件AB同时发生的概率 $P\left( {{{AB}}} \right)$ 可以理解为它们之间的匹配情况。

当然,基于上述条件概率思想得到的结果通常表现为具体的数值,尚不能给出最终的决策结论,后续,仍需要通过某种机制将数值转化为具体的决策方案。为此,本文拟引入阈值、融入RS理论建模思想,通过对数据进行筛选,可以进一步确定理想评价集合的正域、负域、边界域,并最终得到问题的决策方案,其中,正域与理想目标最接近,其次分别为边界域和负域,正域中方案即为最佳决策方案。

遵循上述建模机理,本文设计了如下数据分析模型。

假设 $\left( {U,V,R,P} \right)$ 是一个概率近似空间,其中UV是2个数据集,RU×V中的一个犹豫中智关系,P是基于σ代数的概率度量。对于任意犹豫中智集A $x \in U$ $y \in V$ $A$ 关于R(x, y)的条件概率为

$P\left( {A|R\left( {x,y} \right)} \right) = \left\langle {\left( 1 \right),\left( 0 \right),\left( 0 \right)} \right\rangle - \frac{{\mathop \sum \nolimits_{y \in V} {{\left( {A\left( y \right)} \right)}^C}R\left( {x,y} \right)}}{{\mathop \sum \nolimits_{y \in V} R\left( {x,y} \right)}}$ (1)

式中 ${\left( {A\left( y \right)} \right)^C}$ 为犹豫中智集的补集。式(1)求解过程中涉及到的基础计算逻辑详见文献[12]。

依托上述概率近似空间 $\left( {U,V,R,P} \right)$ ,对于任意犹豫中智集合A,本文将其下近似集合与上近似集合分别定义为

$ \underline {{\rm{HFNR}}} _P^\alpha \left( A \right) = \left\{ {x \in U|{\rm{}}P\left( {A|R\left( {x,y} \right)} \right) \geqslant \alpha + \varepsilon ,y \in V} \right\} $
$ \overline {{\rm{HFNR}}} _P^\beta \left( {\rm{A}} \right) = \left\{ {x \in U|P\left( {A|R\left( {x,y} \right)} \right) > \beta - \varepsilon ,y \in V} \right\} $

式(1) 中, ${\rm{}}\left\langle {\left( 0 \right),\left( 1 \right),\left( 1 \right)} \right\rangle \leqslant \beta - \varepsilon \leqslant \alpha + \varepsilon \leqslant \left\langle {\left( 1 \right),\left( 0 \right),\left( 0 \right)} \right\rangle $ ,参数ε主要是用于突出强调犹豫心理,根据实际需要可以进行适当微调。

借助 $\underline {{\rm{HFNR}}} _P^\alpha \left( A \right)$ $\overline {{\rm{HFNR}}} _P^\beta \left( A \right)$ A的正域、负域、边界域可表示为如下形式:

$\begin{split} &{\rm{PO}}{{\rm{S}}_{{\rm{HFNR}}}}\left( {A,\alpha ,\beta } \right) = \underline {{\rm{HFNR}}} _P^\alpha \left( A \right)= \\ &\;\;\;\;\;\;\;\; \left\{ {{\rm{}}x \in U{\rm{|}}\left\langle {\left( 1 \right),\left( 0 \right),\left( 0 \right)} \right\rangle - \dfrac{{\mathop \sum \nolimits_{y \in V} {{\left( {A\left( y \right)} \right)}^C}R\left( {x,y} \right)}}{{\mathop \sum \nolimits_{y \in V} R\left( {x,y} \right)}} \geqslant} \right.\\ &\;\;\;\;\;\;\;\;\;\;\;\; \Biggr. { \alpha + \varepsilon ,y \in V{\rm{}}} \Biggr\} \end{split}\!\!\!\!\!\!\!\!\!\!\!\!\!\!$
$\begin{split} &{\rm{NE}}{{\rm{G}}_{{\rm{HFNR}}}}\left( {A,\alpha ,\beta } \right) = U - \overline {{\rm{HFNR}}} _P^\beta \left( A \right)=\\ &\;\;\;\;\;\;\;\;\;\;\;\;\;\; \left\{ {{\rm{}}x \in U{\rm{|}}\left\langle {\left( 1 \right),\left( 0 \right),\left( 0 \right)} \right\rangle - \dfrac{{\mathop \sum \nolimits_{y \in V} {{\left( {A\left( y \right)} \right)}^C}R\left( {x,y} \right)}}{{\mathop \sum \nolimits_{y \in V} R\left( {x,y} \right)}} \leqslant} \right.\\ &\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\Biggr. { \beta - \varepsilon ,y \in V{\rm{}}} \Biggr\} \end{split}\!\!\!\!\!\!\!\!\!\!\!\!\!\!$
$\begin{split} &\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!{\rm{BN}}{{\rm{D}}_{{\rm{HFNR}}}}\left( {A,\alpha ,\beta } \right) = \overline {{\rm{HFNR}}} _P^\beta \left( A \right) - \underline {{\rm{HFNR}}} _P^\alpha \left( A \right) = \\ &\!\!\!\!\!\!\!\;\left\{ {{\rm{}}x \in U{\rm{|}}\beta - \varepsilon < \left\langle {\left( 1 \right),\left( 0 \right),\left( 0 \right)} \right\rangle - \dfrac{{\mathop \sum \nolimits_{y \in V} {{\left( {A\left( y \right)} \right)}^C}R\left( {x,y} \right)}}{{\mathop \sum \nolimits_{y \in V} R\left( {x,y} \right)}} <} \right.\\ &\;\;\; \Biggr. { \alpha + \varepsilon ,{\rm{y}} \in V{\rm{}}} \Biggr\} \end{split}\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!\!$

上述模型是一种多理论融合的形态,也是一种相对通用的知识表示和分析处理框架,能充分体现评价人的主观意识和决策心理,可以为复杂情况下相关评价和决策提供一定的理论支撑。

在卷烟品牌选择中,上述模型可以勾勒出消费者所心仪品牌的范围,范围之内的区域称为正域,范围之外的区域称为负域,范围边界上的区域称为边界域。如果一个品牌经过匹配,确定其处于正域,则说明该品牌一定是消费者心仪的品牌;相反,确定其处于负域,则说明该品牌距离消费者的诉求还有很大差距;如果一个品牌经过匹配,确定其处于边界域,则说明该品牌介于上述心仪和不心仪两种情况之间,消费者购买欲可能会不太强烈。

4 数据模型在烟草行业的应用

本文能为卷烟品牌定性定量分析评价、生产经营管理决策提供更为合理的理论支持。以烟草品牌发展潜力分析为例,假设数据集 $U:{{x}}_1,{{x}}_2, \cdots ,{{x_m}}$ 是待评价的烟草品牌集合, $V:{{y}}_1,{{y}}_2, \cdots ,{{y_n}}$ 是由若干个评价指标组成的评价指标集,A是行业或企业针对理想品牌每一项评价指标预先给出的理想评估值。

首先,针对两个数据集UV,由专家建立U×V上的一个犹豫中智关系R。在此基础上,基于

$P\left( {A|R\left( {x,y} \right)} \right) = \left\langle {\left( 1 \right),\left( 0 \right),\left( 0 \right)} \right\rangle - \frac{{\mathop \sum \nolimits_{y \in V} {{\left( {A\left( y \right)} \right)}^C}R\left( {x,y} \right)}}{{\mathop \sum \nolimits_{y \in V} R\left( {x,y} \right)}}$

建立概率近似空间 $\left( {U,V,R,P} \right)$

在概率近似空间中,对照理想品牌的指标符合性状态,确定4个待评估品牌与理想目标A的匹配情况,在此基础上,求解A的正域、负域、边界域,其中正域中的品牌均为潜力品牌;负域中的品牌不具有发展潜力;边界域中的品牌为待定品牌,需要进一步评估。具体求解步骤如下。

输入 品牌集U,指标集V,理想品牌的理想评估值集A

输出 有发展潜力的烟草品牌。

1) 建立概率测度空间 $\left( {U,V,{{R}},P} \right)$ ,其中R是待评价品牌与评价指标之间的决策矩阵,由评价专家建立;

2) 计算条件概率 $P\left( {A{\rm{|}}{{R}}\left( {x,y} \right)} \right)$ ,定量分析待评估品牌与理想目标A的匹配情况;

3) 设定阈值αβε

4) 求解A的下近似集 $\underline {{\rm{HFNR}}} _P^\alpha \left( A \right)$ 、上近似集 $\overline {{\rm{HFNR}}} _P^\beta \left( A \right)$

5) 导出正域 ${\rm{PO}}{{\rm{S}}_{{\rm{HFNR}}}}\left( {A,\alpha ,\beta } \right)$ 、负域 ${\rm{NE}}{{\rm{G}}_{{\rm{HFNR}}}}$ $\left( {A,{\rm{\alpha }},{\rm{\beta }}} \right)$ 、边界域 ${\rm{BN}}{{\rm{D}}_{{\rm{HFNR}}}}\left( {A,\alpha ,\beta } \right)$

6) 依据正域、负域、边界域,确定各类卷烟品牌的发展潜力,其中正域中品牌即为潜力品牌;

end

接上例,假设集合U中包含4个待评价的卷烟品牌x1,x2,x3,x4;集合V中包含5个具体的评价指标y1,y2,y3,y4,y5,如品牌市场状态、销售规模体量、创新性、消费者普遍接受程度等指标;集合A是一个理想评价集合,即针对每一项评价指标,由行业或企业预先给定的理想评价值,其中

$\begin{array}{l} a_1 = \left\langle {y_1,\left( {0.81,0.5,0.6} \right),\left( {0.31,0.2,0.1} \right),\left( {0.42,0.2,0.1} \right)} \right\rangle \\ a_2 = \left\langle {y_2,\left( {0.51,0.4,0.3} \right),\left( {0.42,0.4,0.3} \right),\left( {0.61,0.4,0.3} \right)} \right\rangle \\ a_3 = \left\langle {y_3,\left( {0.22,0.1,0.0} \right),\left( {0.31,0.2,0.2} \right),\left( {0.81,0.71,0.7} \right)} \right\rangle \\ a_4 = \left\langle {y_4,\left( {0.73,0.6,0.5} \right),\left( {0.31,0.1,0.2} \right),\left( {0.4,0.31,0.2} \right)} \right\rangle \\ a_5 = \left\langle {y_5,\left( {0.4,0.2,0.3} \right),\left( {0.6,0.5,0.51} \right),\left( {0.63,0.42,0.4} \right)} \right\rangle \end{array}$

专家给定的阈值:

$\begin{array}{l} \alpha = \left\langle {\left( {0.86,0.73,0.62} \right),\left( {0.06,0.035,0.021} \right)} \right.\\ \quad \quad \left. {\left( {0.074,0.021,0.01} \right)} \right\rangle \\ \beta = \left\langle {\left( {0.51,0.42,0.31} \right),\left( {0.13,0.12,0.07} \right)} \right.\\ \quad \quad \left. {\left( {0.09,0.02,0.01} \right)} \right\rangle \end{array}$

为简化分析,暂不考虑ε因素。基于上述前置性信息,依据专家评价意见构建U×V上的犹豫中智关系R,详见表1

表 1 一个犹豫中智关系

基于条件概率公式 $P\left( {A{\rm{|}}R\left( {x,y} \right)} \right)$ ,确定4个待评估品牌与理想目标集A的匹配情况,进而获取A关于 $\left( {U,V,R,P} \right)$ 的下近似集、上近似集:

$\underline {{\rm{HFNR}}} _P^{\rm{\alpha }}\left( A \right) = \left\{ {x_1} \right\}\;\;\;\;\overline {{\rm{HFNR}}} _P^\beta \left( A \right) = \left\{ {x_1,x_2,x_3} \right\}$

确定理想目标集A的正域、负域、边界域:

$\begin{array}{l} {\rm{PO}}{{\rm{S}}_{{\rm{HFNR}}}}\left( {A,\alpha ,\beta } \right) = \left\{ {x_1} \right\}\\ {\rm{NE}}{{\rm{G}}_{{\rm{HFNR}}}}\left( {A,\alpha ,\beta } \right) = \left\{ {x_4} \right\}\\ {\rm{BN}}{{\rm{D}}_{{\rm{HFNR}}}}\left( {A,\alpha ,\beta } \right) = \left\{ {x_2,x_3} \right\} \end{array}$

依据上述计算结果,得到最终决策结论:

1)正域结论:品牌x1具有发展潜力。

2)负域结论:品牌x4不具有发展潜力。

3)边界域结论:品牌x2x3为待定品牌,需要进一步评估。

5 结论

1) 针对目前多大数烟草辅助决策系统依赖传统统计学分析,无法对复杂评价和决策信息有效表示与分析的局限性,本文通过融合RS理论、概率论、模糊论,以及心理学等,提出了一种合理的数据分析模型。

2) 该模型能充分体现评价人的主观意识和决策心理,具有较强的容错能力,一定程度上可以为烟草行业辅助决策系统建设提供有益参考。

参考文献
[1] 冯云, 王宇山, 谈宁韡. 烟草行业主数据平台建设方法研究[J]. 中国烟草学报, 2015, 21(4): 107-111. (0)
[2] 田临卿, 许自成. 数据挖掘技术在烟草行业中的应用[J]. 中国农业科技导报, 2012, 14(6): 84-90. DOI:10.3969/j.issn.1008-0864.2012.06.14 (0)
[3] 许兆新, 周双娥. 电信决策支持系统的设计与实现[J]. 应用科技, 2001, 28(3): 33-34. DOI:10.3969/j.issn.1009-671X.2001.03.015 (0)
[4] 张超, 李德玉, 翟岩慧. 双论域上的犹豫模糊语言多粒度粗糙集及其应用[J]. 控制与决策, 2017, 32(1): 105-110. (0)
[5] 于君娜, 赵春晖. 一种基于BP网络和决策融合的高光谱遥感图像分类方法[J]. 应用科技, 2007, 34(1): 13-16. DOI:10.3969/j.issn.1009-671X.2007.01.004 (0)
[6] BUSTINCE H, BARRENECHEA E, PAGOLA M, et al. A historical account of types of fuzzy sets and their relationships[J]. IEEE transactions on fuzzy systems, 2016, 24(1): 179-194. DOI:10.1109/TFUZZ.2015.2451692 (0)
[7] ZHANG Chao, LI Deyu, LIANG Jiye. Hesitant fuzzy linguistic rough set over two universes model and its applications[J]. International journal of machine learning and cybernetics, 2018, 9(4): 577-588. DOI:10.1007/s13042-016-0541-z (0)
[8] SMARANDACHE F. Neutrosophy: neutrosophic probability, set, and logic[M]. American Research Press, Rehoboth, USA, 1998. (0)
[9] 廖虎昌, 缑迅杰, 徐泽水. 基于犹豫模糊语言集的决策理论与方法综述[J]. 系统工程理论与实践, 2017, 37(1): 35-48. (0)
[10] 张超, 李德玉. 犹豫模糊图及其在多属性决策中的应用[J]. 模式识别与人工智能, 2017, 30(11): 1012-1018. (0)
[11] 张超, 李德玉. 考虑关联性与优先关系的区间犹豫模糊图决策[J]. 计算机研究与发展, 2019, 56(11): 2438-2447. DOI:10.7544/issn1000-1239.2019.20180314 (0)
[12] YE Jun. Multiple-attribute decision-making method using the under a single-valued neutrosophic hesitant fuzzy environment[J]. Journal of intelligent systems, 2015, 24(1): 23-36. (0)
[13] YE Jun. Bidirectional projection method for multiple attribute group decision making with neutrosophic numbers[J]. Neural computing and applications, 2017, 28: 1021-1029. DOI:10.1007/s00521-015-2123-5 (0)
[14] YE Jun, DU Shigui. Some distances, similarity and entropy measures for intervalvalued neutrosophic sets and their relationship[J]. International journal of machine learning and cybernetics, 2019, 10(3): 347-355. (0)
[15] ZHANG Chao, LI Deyu, KANG Xiangping, et al. Neutrosophic fusion of rough set theory: An overview[J]. Computers in industry, 2020, 115: 103117. DOI:10.1016/j.compind.2019.07.007 (0)
[16] 徐计, 王国胤, 于洪. 基于粒计算的大数据处理[J]. 计算机学报, 2015, 38(8): 1497-1517. DOI:10.11897/SP.J.1016.2015.01497 (0)
[17] 梁德翠, 曹雯. 三支决策模型及其研究现状分析[J]. 电子科技大学学报(社科版), 2019, 21(1): 104-112. (0)
[18] 刘财辉, 蔡克参. 元素最小描述并集下的多粒度覆盖粗糙集模型[J]. 智能系统学报, 2016, 11(4): 534-538. (0)
[19] ZHANG Chao, LI Deyu, LIANG Jiye. Multi-granularity three-way decisions with adjustable hesitant fuzzy linguistic multigranulation decision-theoretic rough sets over two universes[J]. Information sciences, 2020, 507: 665-683. DOI:10.1016/j.ins.2019.01.033 (0)
[20] 胡晓元, 孙秉珍. 基于双论域量化模糊粗糙集的公共卫生应急决策模型[J]. 系统科学与数学, 2019, 3: 409-424. (0)
[21] 赵可彤, 孙秉珍. “一带一路”背景下中医药产品国际化质量监管的多方博弈模型[J]. 西安电子科技大学学报(社会科学版), 2019, 29(1): 19-25. (0)