将住院费用、住院天数、手术次数进行关联,规则见表 14、15
表14住院费用与住院天数规则(初次住院、未进行手术) 前项 后项 支持度 (support ) 置信度 (con fide nee ) 提升度 (lift ) An tecede nt Con seque nt {第几次住院 =1,手术次数=0,住院 0.06829553 费用=1} => { 住院天数=1} {第几次住院 =1,手术次数=0,住院 0.05916355 费用=2} => { 住院天数=1} {第几次住院 =1,手术次数=0,住 0.03436635 院费用=3} => { 住院天数=2} {第几次住院 =1,手术次数=0,住院 0.03555642 费用=4} => { 住院天数=2} 0.9398396 1.6223098 0.7483871 1.2918329 0.5099099 1.6950614 0.6365217 2.1159491 正常住院天数一般为10-20天,与手术相比,保守治疗见效慢康复时间长, 住院时间会相对延长。由表12可以看出,住院费用在1万元以下、初次住院、 未进行手术的患者住院天数多小于10天,低于正常住院天数。即使住院费用在 1— 8万元的患者,住院天数多为10-20天,仍在一个正常的范围。
表15住院费用与住院天数规则(初次住院、进行一次手术) 前项 后项 支持度 (support ) 置信度 (con fide nee ) 提升度 (lift ) An tecede nt Con seque nt {第几次住院 =1,手术次数=1,住 0.07461019 院费用=2} => { 住院天数=1} 0.9029982 1.5587159 {第几次住院 =1,手术次数=1,住院 0.05114878 费用=3} => { 住院天数=1} {第几次住院=1,手术次数=1,住院 0.03239909 费用=4} 0.7908374 1.3651088 0.8007203 1.1402385 => { 住院天数=1} 由表15可以看出,初次住院、进行1次手术、住院费用分别在0.5 — 1万元、 1 — 3万元、3—8万元的患者住院天数多集中在10天以内
由以上两个规则可以看出: 该医院无论住院费用高低, 是否进行手术, 都尽
可能缩短患者的住院时间以提高病床流转率, 反映当前山西省优质医疗资源稀缺 分布不均。
六、研究不足及展望 本文有效捕捉出隐含在病案首页数据中的显著频繁集,
找出有价值的关联规 则,但数据仅来自一家大型医院, 存在一定局限性。 如果以更多医院的数据进行 挖掘,相信能够挖掘出更多有价值的规则。
本文挖掘出的部分规则不够系统, 如果能结合医学等更多领域知识, 提前做 一些预测分析, 有方向性地进行挖掘, 挖掘可以更高效, 也可用关联规则挖掘出 数据中的知识和模式,再结合其他挖掘方法如贝叶斯网络、 BP 神经网络、支持 向量机等方法做更深入的研究。
参考文献
[1] 王 静,李 曼,胡运涛等 . 应用人工神经网络模型分析胃癌病人住院费用影 响因素作用大小 [J]. 中国卫生统计, 2009.26
[2] 张云洋.面向医疗质量的病案首页数据关联规则挖掘 [D] . 天津大学, 2009 [3]
Agrawal R. Imielinski T and A. Swami. Mining Association Rules Between Sets of Items in Large Databases. Proceeding of ACM SIGMOD International Conference. ( 1993)
[4] 张菊英,韦健,杨树勤.神经网络模型在住院费用影响因素分析中的应用 [J] .中华医院管理杂志, 2002,18
[5] 马进等. 韩国医疗服务支付方式改革对我国的启示 [J]. 中国卫生经 济.2004.23 [6] 彭坤,吴明,陈立新 . 基于关联规则的医院感染数据挖掘 [J]. 感染、炎症、 修复, 2008.12
[7] 廖海波. 关联规则挖掘在病案数据分析中的应用研究 [D]. 合肥工业大学, 2008
[8] 赵连朋. 基于关联规则的医疗处方智能监督方法的研究 [J]. 计算机工程与 应用, 2006.12
[9] 罗仁夏,吴彬 . 医疗保险住院费用调查及多因素分析 [J] .中国医院统计, 2006. 3