中国公共卫生  2009, Vol. 25 Issue (5): 600-601   PDF    
居民住院卫生服务利用影响因素决策树分析
曹伟燕, 王培承, 蔡伟芹, 孟祥臻     
潍坊医学院预防医学系, 山东 潍坊 261042
摘要: 目的 了解山东省潍坊市居民住院卫生服务利用现状, 并分析其影响因素。 方法 采用分层随机抽样并进行入户调查; 在对资料进行描述性分析的基础上, 通过SAS Enterprise Miner软件建立决策树模型, 分析居民住院卫生服务利用的影响因素。 结果 对居民是否利用住院卫生服务建立决策树模型, 其对训练集, 验证集, 测试集有分类错误率分别为4.86%, 4.94%, 4.94%, 按重要性排序筛选出前5位影响因素为是否患慢性病、人均收入、年龄、医疗保险类型和婚姻状况。 结论 不同人群住院卫生服务利用的影响因素不尽相同。针对不同人群, 采用相应政策, 降低应住院而未住院的比例, 满足居民的住院卫生服务需要。
关键词住院     影响因素     决策树     卫生服务利用    
Use of hospitalization services among residents of Weifang and its influencing factor
CAO Wei-yan, WANG Pei-cheng, CAI Wei-qin, et al     
Department of Preventive Medicine, Weifang Medical College, Weifang 261042, China
Abstract: Objective To assess the use of hospitalization services and its influencing factor among the residents of Weifang. Methods Data of the residents health service were collected throngh stratified and random asmpling.A decision tree model was built up with SAS software to analyze the data. Results The misclassification of the training set, the valid set and the test set of the decision tree was 4.86%, 4.94%, 4.94%, respectively.The study found that the top five factors affecting the hospitalization probability included whether suffering from chronic disseases, the per capita income, age, the foun of medical insurance and marital status. Conclusion Differentpolicies should be made for different populations to fulfil the need of in-patient health service to the residents.
Key words: hospitalization     influencing factor     decision tree     usage of health service    

2003年中国第三次卫生服务调查显示,我国居民患病应住院而未住院的比例达29.6%,我国居民的住院卫生服务需求得不到满足。本研究通过2007年山东省潍坊市居民家庭卫生服务和抽样调查数据,了解住院服务需要和需求量,分析潍坊市居民卫生服务利用情况及其影响因素,为卫生机构制定和实施区域卫生规划,合理配置卫生资源,有效开展卫生服务提供依据1, 2

1 对象与方法 1.1 对象

采用分层随机抽样的方法抽取2007年潍坊市4个试点区的居民为调查对象。以县(区)为基本单位,抽取样本家庭。调查对象为样本住户的实际人口,抽取1 884户,共调查研究居民6 724人。

1.2 方法

采用自设问卷入户调查,调查内容包括家庭一般情况(家庭规模、家庭收支情况等)、个人基本情况(如性别、年龄、文化程度、婚姻状况)、住户成员健康状况与卫生服务利用等。

1.3 统计分析

建立SPSS数据库,将SPSS数据库导入SAS数据库,通过Enteerprise Miner3-6建立决策树模型。以目前较常用的C4.57算法建立决策树,以是否住院为目标变量,以社会经济、人口学特征、居民健康状况等变量作为解释变量进行决策树分析。

2 结果 2.1 一般情况

本次共调查居民6 724人,其中,男性3 293人,女性3 431人,男女比例为0.96:1。被调查者平均年龄为39.32岁。文化程度:文盲或识字少的占22%,小学的占23.5%,初中占40.5%, 高中/中专/技校占9.3%,大专及以上占4.8%。婚姻状况:未婚占27.8%,已婚占67.6%,离婚或丧偶独居占4.5%。医保形式:合作医疗占89.5%。在调查前一年内共有316人住院,住院率为46.9‰平均住院天数为11 d。住院原因排在前5位的疾病系统分别是循环系统疾病,妊娠、分娩及产褥期并发症,损伤和中毒,呼吸系统疾病,消化系统疾病。选择住院的医疗机构,乡镇医疗机构占43.6%。应住院而未住院的比例为24.9%,其中71.8%的患者因经济困难而未住院。

2.2 住院卫生服务利用的决策树分析

以是否住院为目标变量,以社会经济、人口学特征、居民健康状况等变量作为解释变量生成决策树模型。通过决策树模型可以得出,树的根节点是依据是否慢性病划分,说明此变量在各解释变量中影响是最大的,树状图的其他节点还包括人均收入、年龄、医疗保险类型、婚姻状况和收入来源等。本文决策树有26个叶节点,对应26条分类规则,将各解释变量的重要性排序列出,变量按重要性大小排序,重要性大,说明增加该变量进入决策树时,整个系统不确定程度减少得多,各解释变量中排序见表 1

表 1 住院卫生服务利用各解释变量的重要性排序

3 讨论

3个分割后的数据集的误分率分别为训练集4.86%, 验证集4.94%, 测试集4.94%,正确分类率分别为95.14%, 95.06%, 95.06%。决策树的根结点为是否患慢性病,说明患慢性病对住院卫生服务利用的影响很大,建议卫生部门应加强健康教育,提倡健康的生活方式,降低慢性病的发病率; 同时加快建立健康档案,关注慢性病患者病情,慢性病患者提供及时有效的医疗卫生服务。

从决策树模型可以看出,所选出的影响素对不同人群的影响不一致,如医疗保险类型对患慢性病组影响较大,而对于未患慢性病组,婚姻状况影响较大。从决策树可以看出,在患慢性病组的分支上,拥有城镇职工医疗保险的居民有35.7%的可能利用住院卫生服务,说明医疗保险是提高居民住院卫生服务利用的有效方法,龙其是对于慢性病人群,因此,完善医疗保险制度,加大保障制度的报销比例是提高居民住院卫生服务利用的重要举措。

潍坊市居民住院率为46.9‰,高于全国水平(36‰)8(χ2=21.230, P=0.000), 差异有统计学意义,说明潍坊市居民住院卫生服务利用率较高,同时也说明潍坊市居民住院卫生服务需要量较大。但是,潍坊市应住院而未住院的患者所占比例较高,说明看不起病的状况仍然存在。因此,卫生部门应制定相应的政策保证居民看得起病,满足居民卫生服务需求。

参考文献
[1] 徐凌中, 王晋臣, 孙庆九, 等. 东营市城乡居民住院服务利用及其影响因素分析[J]. 中华医院管理杂志, 2004, 20(7) : 402–405.
[2] 卢安, 王新立, 高贵军, 等. 河北省城乡居民卫生服务需求和利用抽样调查[J]. 中国公共卫生, 2005, 21(11) : 1384–1385.
[3] 徐蕾, 决策树技术及其在医学中的应用[D].上海:第二军医大学, 2004:22-30. http://cdmd.cnki.com.cn/Article/CDMD-10147-1011024621.htm
[4] 邵峰晶, 于忠清. 数据挖掘原理与算法[M]. 北京: 中国水利水电出版社, 2003: 126-152.
[5] 胡桂林, 曾庆. 常用数据挖掘软件比较[J]. 国外医学:卫生经济分册, 2005, 22(1) : 20–26.
[6] 黄平. 统计分析与SAS软件[M]. 广州: 华南理工大学出版社, 2005: 60-152.
[7] 韩慧, 毛锋, 王文渊. 数据挖掘中决策树算法的最新进展[J]. 计算应用研究, 2004(12) : 5–8.
[8] 中华人民共和国卫生部.2007中国卫生统计年鉴[OL]. http://www.moh.gov.cn/publicfiles//business/htmlfiles/zwgkzt/pwstj/index/htm.