好文档 - 专业文书写作范文服务资料分享网站

基于Access的大规模住院病案首页数据挖掘

天下 分享 时间: 加入收藏 我要投稿 点赞

基于Access的大规模住院病案首页数据挖掘

王妮,陈婕卿,刘文艳,陈卉

【摘 要】[摘 要] 目的 探索基于Access数据库进行大规模住院病案首页数据挖掘的方法.方法 收集某市2002~2013年的住院病案首页,经过数据清理和疾病编码转换,利用Access数据库的窗体和VBA技术编程,按年度对住院病案首页数据进行汇总分析.以慢性阻塞性肺疾病(简称慢阻肺)为例汇总分析相关住院指标.结果 对近600万条住院病案首页记录进行汇总分析总耗时267 s.2002~2013年,该市因慢阻肺住院的患者逐年增加,平均住院天数下降,平均住院费用上升,30 d再住院率尚无明显变化趋势.60岁以上慢阻肺患者的住院天数、费用均高于其他年龄段患者.结论 时间连续的住院病案首页数据提供了对单病种患者住院指标进行时间趋势分析的可能性,其结果可为卫生和医院主管部门在医院管理决策、流行病学监测、卫生经济学等方面提供重要信息. 【期刊名称】中国医疗设备 【年(卷),期】2017(032)010 【总页数】3

【关键词】[关键词] 住院病案首页;慢性阻塞性肺疾病;医院管理;数据挖掘

引言

如今是一个数据共享化、智能化的时代,因此出现了爆炸性增长的quot;大数据quot;.大数据的应用首当其冲的就是智慧医疗,具体可应用在临床诊断、远程监控、药品研发、防止医疗诈骗等方面[1].研究表明,大数据即将到达期望膨胀期,能够在5~10年的时间里达到一个成熟的阶段进而稳步发展直至变为实际生产力[2].在医疗卫生领域,目前国内医院信息化建设不断完善,经过不断积累,各种形

式的电子化医疗系统产生了体量庞大的医疗大数据,它们成为生成医学证据的巨大来源.

住院病案首页是目前标准化程度最高、最易于挖掘、具有很高价值的一类医疗大数据[3-5].对连续多年、覆盖某一地区所有医院的住院病案首页数据进行分析,可以了解该地区某一病种患者住院天数、住院费用、再住院率等的变化趋势,为卫生和医院主管部门在医疗卫生资源分配、医院管理决策、流行病学监测、卫生经济学等方面提供重要信息.但是,由于存在数据量巨大、疾病编码复杂且不一致、数据质量参差不齐等问题,在对海量住院病案首页进行分析时仍然存在很多困难.针对这些问题,我们在Access数据库中编程实现了数据清理、疾病编码转换、住院指标统计,并以慢性阻塞性肺疾病为例进行了统计分析,取得了满意的效果.

1 材料与方法

1.1 数据来源

收集某市2002~2013年所有二级及以上医院的住院病案首页数据,共约600万条记录,按年度存储在Access数据库中.提取病案首页中患者的病案号、性别、出生日期、入院时间、出院时间、住院天数、出院主要诊断、出院其他诊断、住院费用等信息用于本研究. 1.2 数据预处理

数据预处理分为数据清理和疾病编码转换两部分.

(1) 数据清理.通过对字段排序,发现异常的年龄值(如gt;150岁)、出生日期(如1878年3月15日)、住院费用(如lt;10元),并剔除相应记录;利用入院时间和出生日期得到住院时的年龄,利用出院时间和入院时间得到住院天数,如果计算结果

与记录中保存的数据相差较大,则认为该条记录可靠性差,予以剔除.对由于首位为数字0造成的同一患者病案号不同的情况,补足所有病案号的前置0,减少由此造成的无法识别多次入院的同一患者的问题.

(2)疾病编码转换.现在通用的疾病编码为国际疾病分类(International Classification of Diseases,ICD)编码,是WHO制定的国际统一的疾病分类方法,它根据疾病的病因、病理、临床表现和解剖位置等特性,将疾病分门别类,使其成为一个有序的组合,并用编码的方法来表示的系统,现通用ICD-10疾病编码[6].由于ICD-10编码庞大、过于细致,不利于进行病种统计,因此我们采用了目前在国外已有较多应用的临床分类软件(Clinical Classifications Software,CCS)编码体系[7-9].它根据ICD-10编码将疾病归为259种,为诊断和手术分类提供了便利.我们在Access中编程实现了ICD-10编码到CCS编码的转换. 1.3 编程汇总住院指标

在Access中,利用窗体和VBA技术,按年度对住院病案首页数据进行汇总分析.汇总指标包括因以CCS编码表示的指定病种D(在本文D表示本研究所选取的示例慢性阻塞性肺疾病)住院的患者人数、平均住院天数、平均住院费用、出院后30 d再住院率.所有指标均按照性别(男和女)、年龄段(0~17、18~35、36~60以及60岁以上)分层计算.计算30 d再住院率时,还区分以病种D为出院主要诊断的再住院、病种D为出院其他诊断的再住院,以及出院主要及其他诊断中均无病种D的再住院这3种情况.

计算30 d再住院率是此次软件编制过程中的难点.需要提取以病种D为出院主要诊断的患者的病案号,并根据病案号回溯这些患者所有的再住院情况,并判断与上次因病种D住院的时间间隔是否在30 d以内.

基于Access的大规模住院病案首页数据挖掘

基于Access的大规模住院病案首页数据挖掘王妮,陈婕卿,刘文艳,陈卉【摘要】[摘要]目的探索基于Access数据库进行大规模住院病案首页数据挖掘的方法.方法收集某市2002~2013年的住院病案首页,经过数据清理和疾病编码转换,利用Access数据库的窗体和VBA技术编程,按年度对住院病案首页数据进行汇总分析.以慢性阻塞性肺疾病(简称
推荐度:
点击下载文档文档为doc格式
80pig5tqh98xswm2yhl07916095eiv009ej
领取福利

微信扫码领取福利

微信扫码分享