详情

基于电子病历的慢性阻塞性肺疾病共病模式与用药规律研究

申报人:王思澄 申报日期:2025-03-20

基本情况

2025创新项目
基于电子病历的慢性阻塞性肺疾病共病模式与用药规律研究 学生申报
创新训练项目
管理学
图书情报与档案管理类
学生来源于教师科研项目选题
二年期
项目采用关联规则与关联分析法、基于共现网络分析法对慢性阻塞性肺疾病住院患者的诊疗电子病历信息进行挖掘分析,建立“用药规律-共病模式”双维度分析框架,探寻慢性阻塞性肺疾病共病现状、常见共病模式以及用药规律,构建慢性阻塞性肺疾病患者分层管理模型,针对不同共病类团进行差异化治疗具有实际意义,为制定慢性阻塞性肺疾病相关的预防和管理指南提供参考。
参加第十届山东省大学生科技创新大赛;参加第十四届“挑战杯”济宁医学院大学生创业计划竞赛
参与多项国家级科研项目,作为项目负责人承担济宁医学院校级科研及教研项目5项;发表学术论文19篇,其中以第一作者发表学术论文13篇;两次获济宁市社会科学优秀成果奖三等奖。
指导教师对项目提供总体规划与技术路线支持
校级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
王思澄 医学信息工程学院 信息管理与信息系统(本科) 2023 论文撰写
郭天泽 医学信息工程学院 信息管理与信息系统(本科) 2023 数据预处理
程海艳 医学信息工程学院 信息管理与信息系统(本科) 2023 构建共病网络图谱
赵颖 医学信息工程学院 信息管理与信息系统(本科) 2023 建立Apriori模型
陈遥 医学信息工程学院 信息管理与信息系统(本科) 2023 结果解释与评价
张金钰 医学信息工程学院 信息管理与信息系统(本科) 2023 可视化

指导教师

序号 教师姓名 所属学院 是否企业导师 教师类型
张庆 医学信息工程学院

立项依据

慢性阻塞性肺疾病(Chronic Obstructive Pulmonary Disease, COPD)是一种以持续气流受限为特征的慢性呼吸系统疾病,具有不可逆性和进行性加重的特点。本研究以电子病历多源数据为基础,通过融合关联规则挖掘(Apriori算法)与复杂网络分析技术,系统解析COPD患者多维诊疗特征:一方面,针对用药规律,挖掘高频药物组合及强关联用药模式,揭示COPD治疗与并发症防治的协同作用机制;另一方面,构建动态共病网络图谱,识别COPD共病簇及其演化路径。研究旨在建立“用药规律-共病模式”双维度分析框架,阐明临床诊疗中的多药联用逻辑与疾病关联机制,为优化个体化用药策略、制定分层管理指南提供数据驱动的科学依据,助力提升COPD综合防控的精准性与卫生政策制定的科学性。
项目研究内容主要包括基于电子病历的COPD患者用药规律挖掘与优化分析、COPD共病关联网络构建与动态特征解析、用药-共病协同管理模型与干预策略研究。
1.基于电子病历的COPD患者用药规律挖掘与优化分析
(1)数据整合与标准化:收集山东省某三甲医院COPD住院患者电子病历数据,提取用药名称、用药频次、剂量等信息,参照《中国药典》进行药物名称规范化处理,构建标准化用药数据库。
(2)关联规则建模:应用Apriori算法挖掘COPD患者高频药物组合及关联规则,利用支持度、置信度、提升度筛选强关联规则,识别核心治疗药物及其协同效应。
(3)临床验证与指南适配:结合临床指南与专家共识,验证药物关联规则的科学性,分析用药模式与患者预后的关联性。
2.COPD共病关联网络构建与动态特征解析
(1)共病数据提取:摘录患者病历信息中的疾病诊断名称信息,合并同一患者不同时段的就诊信息,对同一疾病不同名称形式进行规范化,建成疾病诊断信息数据库。
(2)复杂网络拓扑分析:以电子病历中冠心病患者的其他诊断信息为节点,其他诊断中疾病间的共现关系为边,利用Gephi工具构建COPD共病网络,分析网络密度、节点中心性及模块化类团,识别核心共病类团及枢纽疾病。
(3)共病模式挖掘:采用Apriori算法逐层搜索的迭代方式来完成频繁共病组合的挖掘工作。扫描疾病诊断信息数据库,累积每个项的计数,挖掘满足最小支持度的项,找出频繁项集,即COPD患者的共患病模式。
3.用药-共病协同管理模型与干预策略研究
(1)多维度数据融合:整合用药规则与共病网络,分析药物选择对共病管理的直接影响,提出用药优化路径。
(2)个性化干预模型:基于关联规则与网络分析结果,构建COPD患者分层管理模型,针对不同共病类团设计差异化治疗方案。 
国务院办公厅发布的《全国医疗卫生服务体系规划纲要》中指出要借助互联网+、大数据来改善信息资源配置,推动惠及全民的健康信息服务和智慧医疗服务,推动健康医疗大数据的应用,逐步转变服务模式,提高服务能力和管理水平。
数据挖掘(Data Mining)是应用一系列技术从大型数据库和数据仓库中提取人们事先未知而潜在有用的隐含的信息和知识的过程[1]。常用的数据挖掘方法主要包括决策树、聚类分析、关联规则与关联分析。
在国外,数据挖掘技术已被广泛应用于医疗领域中,如疾病的推理诊断、病理应用、药理试验以及生物基因工程等方面。在DNA序列研究方面,通过采集异构基因数据,分析基因相应的涵义,利用工具分析序列的相似度,完成DNA数据片段的分析和应用。在相关疾病的治疗方面,数据挖掘技术在肿瘤的诊断、治疗与病理分析中都有具体应用。Nishtala, PS(2018)等人运用关联规则方法,通过确定药物组合对老年人骨折风险的影响,来评价与老年人骨折相关的频繁药物组合,并认为关联规则方法可以成为确定与药物不良事件相关的药物组合的重要工具,肯定了关联规则方法的有效性和合理性[2];Wright, A(2013)等人验证了基于关联规则挖掘方法来推断药物与问题之间的关联,旨在验证该方法,结果证实关联规则方法的高准确性,证明关联规则方法具有可推广性[3];Yan Feng(2014)等人论述了数据挖掘的特点并综述了其各种方法如相关性分析、聚类分析、进化分析等在中西医结合研究在冠心病中的应用,分析了该领域的研究进展与展望,最终认为数据挖掘方法在该领域的应用已经建立了相对完整的范式和技术支撑[4]。
在国内,关联规则分析常用于中药制剂处方用药规律分析[5-7]、穴位配伍规律分析[8]、经典名方用药规律分析[9]、基于电子病历的患者用药规律分析[10]、慢性病共病分析[11]、患者高额住院费用分析[13]等。
综上,数据挖掘技术在医学领域应用广泛,目前学界将数据挖掘技术应用于算法的优化、疾病的诊疗,生物信息学等领域,在国内的应用更多关注于中医药领域具体方剂的挖掘分析。
近年来,为全面实施健康中国战略,建立健全电子病历信息化建设工作机制,电子病历中蕴涵的各种临床信息(包括人口统计学、诊断史、药物、实验室检测结果等)的来源越来越丰富,电子病历已成为大规模健康数据分析的重要来源。对电子病历的挖掘分析有助于医学专业人员了解疾病的诊疗过程,确定治疗的有效性。
COPD是一种以进行性和持续性气流受限为特征的炎症性疾病,与多种炎症相关慢性疾病共存的情况较为常见,常与焦虑、关节炎、双相情感障碍、心血管疾病、抑郁、糖尿病、高血压、高脂血症、骨质疏松和精神分裂症等共病,当前学界对于共病研究的数据一般来源于调查统计、调查问卷、抽样调查[13-15],对电子病历进行挖掘分析,探寻COPD的共病模式与用药规律,构建COPD患者分层管理模型,针对不同共病类团进行差异化治疗具有实际意义。
参考文献
[1]张庆,王晓月.关联规则在中医药方剂专利挖掘中的应用[J].中华医学图书情报杂志,2019,28(07):27-32.
[2]Nishtala P S, Chyou T, Held F, et al. Association rules method and big data: Evaluating frequent medication combinations associated with fractures in older adults[J]. Pharmacoepidemiology and drug safety, 2018, 27(10): 1123-1130.
[3]Wright A, McCoy A, Henkin S, et al. Validation of an association rule mining-based method to infer associations between medications and problems[J]. Applied Clinical Informatics, 2013, 4(01): 100-109.
[4]Feng Y, Wang Y, Guo F, et al. Applications of data mining methods in the integrative medical studies of coronary heart disease: progress and prospect[J]. Evidence-Based Complementary and Alternative Medicine, 2014, 2014.
[5]赵雪茹,马利,李淑琪等.基于关联规则的骨质疏松性骨折中药熏洗处方用药规律研究[J].中国骨质疏松杂志,2022,28(01):84-88.
[6]张文静,郭桂明,许佳旺等.基于关联规则的31958张含麻黄中药制剂处方用药分析[J].中国中医药信息杂志,2021,28(12):128-133.
[7]图雅,张春生,白翠兰.基于全局和下钻分析的蒙医热证方剂组方规律关联规则挖掘[J].中国现代应用药学,2021,38(15):1842-1848.
[8]徐家淳,于臻,李强等.基于关联规则的针刺治疗血管性痴呆的穴位配伍规律[J].中国老年学杂志,2019,39(09):2156-2159.
[9]万安庆,鲍剑洋,胡孔法.基于Apriori改进算法的名老中医治疗糖尿病用药规律研究[J].中国中医药信息杂志,2017,24(12):97-101.
[10]张庆,刘婷.关联规则在小儿肺炎病案信息挖掘中的应用[J].中华医学图书情报杂志,2020,29(07):31-37.
[11]徐小兵,李迪,孙扬等.基于关联规则的中国老年人慢性病共病分析[J].中国慢性病预防与控制,2021,29(11):808-812.
[12]刘航江,朱慧,杨翠.基于Apriori算法的甲状腺恶性肿瘤患者高额住院费用关联规则分析[J].现代预防医学,2021,48(13):2479-2483.
[13]王志如,贾小芳,刘梦冉,等.2018年我国15省45~64岁中年人共病现状及其影响因素——基于关联规则分析[J].环境与职业医学,2024,41(07):768-773.
[14]李小凤,裴星童,杨春晖,等.老年人群慢性病共病模式与失能状况的关联研究:基于四川省抽样调查[J/OL].中国全科医学,1-10[2024-08-26].
[15]许珊,张书迎,谢文涵,等.生活方式与心血管代谢性共病发生发展轨迹的关联研究[J].现代预防医学,2024,51(12):2113-2120. 
研究方法上创新:将用药关联规则与共病复杂网络分析结合,系统解析COPD“药物-共病-干预”的多维交互关系;课题的研究思路与研究方法具有一定的新颖性与普适性,适用于医学领域慢性病共病模式、共病网络的挖掘分析。
问题选择上创新:COPD是一种以进行性和持续性气流受限为特征的炎症性疾病,常与抑郁、糖尿病、高血压、高脂血症、骨质疏松和精神分裂症等共病,严重影响患者的生活质量。当前学界对于共病研究的数据一般来源于调查统计、抽样调查,对电子病历进行挖掘分析,探寻COPD的共病模式与用药规律,构建COPD患者分层管理模型,针对不同共病类团设计差异化治疗方案具有实际意义。
项目特色:本研究拟选用患者就诊过程中的电子病历信息进行关联挖掘与共现网络分析,这与基于文献或流行病视角对慢性病共病关系的研究有所不同。 
1.项目技术路线
(1)数据预处理
对电子病历数据进行规范化处理,归并同一疾病的不同名称形式;参照《中国药典》进行药物名称规范化处理,构建标准化用药数据库。
(2)生成共现矩阵
利用书目共现分析系统(Bibliographic Item Co-occurrence Matrix Builder,BICOMB)对患者的其他诊断信息进行抽取并生成共现矩阵。
(3)构建疾病共现网络
Gephi是一款基于JVM的开源免费复杂网络分析系统,可用于探索性数据分析、社交网络分析、生物网络分析等,网络分析的效率高、功能强、可视化效果好。本研究以电子病历中COPD患者的其他诊断信息为节点,其他诊断中疾病间的共现关系为边,构建COPD患者共病网络图谱,并对其进行分析。
(4)建构Apriori模型
在本研究中将上述通过数据预处理得到的COPD其他诊断数据构建数据库,扫描数据库,采用逐层搜索的迭代方法来完成频繁项集的挖掘工作,k项集用于探索k+1项集,累积每个项的计数,挖掘满足最小支持度的项,找出频繁项集,即COPD患者的共患病模式;此外,建构COPD患者药物Apriori模型,挖掘得出强关联规则,即COPD患者的联合用药信息。
(5)个性化干预模型
基于关联规则与共病网络协同分析结果,构建COPD患者分层管理模型。
2.拟解决的问题
(1)解析COPD患者共病关联网络。对获取的山东省某三级医院主要诊断为COPD的电子病历信息进行数据清洗,具体包括删除缺失值记录、规范疾病名称,以电子病历中COPD患者的其他诊断信息为节点,其他诊断中疾病间的共现关系为边,基于共现网络分析法构建COPD患者共病网络图谱,并解析网络图谱中的共病类团。
(2)共病模式与用药规律挖掘分析。应用Apriori算法进行关联规则与关联分析,通过计算不同项(患病信息)的支持度、置信度与提升度获取频繁强关联有效关系,获取COPD患者共病模式以及联合用药信息,以此探讨关联分析等数据挖掘方法在电子病历挖掘中的具体应用,为医学专业人员了解慢性病的共病模式及其用药规律提供不同视角与具体可行性路径。
(3)阐明COPD多药联用逻辑与疾病关联机制。“基于用药规律-共病模式”双维度分析框架,为制定分层管理指南提供数据驱动的科学依据,助力提升COPD综合防控的精准性与卫生政策制定的科学性。
3.预期成果
预期公开发表正式学术期刊研究学术论文1篇,基于电子病历的慢性阻塞性肺疾病共病模式与用药规律研究结题报告1份。 

研究前期
2025.06—2025.09 • 查阅相关文献,了解国内外研究动态
                             • 对研究方法、研究技术路线等进行总体设计与规划
                             • 学习并熟练掌握相关软件的应用
研究中期
2025.10—2026.6 • 数据预处理,对患者的电子病历信息进行处理与清洗,规范疾病名称、用药名称等
                           • 构建疾病共现网络
                           • 建立Apriori模型,得出COPD患者的共患病模式以及用药关联规则
                           • 解读分析数据挖掘结果
研究后期
2026.07—2027.06 • 撰写并发表论文,撰写相关报告,不断完善研究成果
                             • 申请结题 
项目组成员多为信息管理与信息系统(医学方向)的学生,擅长医学信息的搜集、加工、处理、分析与预测,以及重组、增值等医学信息服务,项目组负责人及项目组成员踏实肯干,具备项目开展所需的专业技能。后续开展的《医学数据挖掘》课程可为项目开展提供理论方法支撑。
项目指导老师经验较为丰富,参与多项国家级科研项目,作为项目负责人承担校级科研及教研项目5项。指导省级大学生创新训练计划项目1项,校级大学生创新训练计划项目3项。发表学术论文19篇,其中以第一作者发表学术论文13篇。对项目的开展提供整体规划技术路线支持,保障项目的顺利进展。 
已具备的条件:学校购买的各种国内外医学数据库资源,为项目的开展提供学习资源支持;通过对《基础医学概论》《临床医学概论》《药学导论》《医学信息检索》《医学数据挖掘》等课程的学习,可掌握医学资料的搜集、医学数据的统计分析、关联规则与关联分析等技能,可以系统地对医学数据进行统计挖掘分析,并根据结果进行归纳总结,为项目开展提供专业技能支撑。
目前已具备COPD住院患者的电子病历数据,可及时开展后续研究。
尚缺少的条件及解决办法: 学术论文的撰写发表较为短板,随着项目开展,研读相关文献,在指导老师协助下,能解决这一问题。 

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 8000.00 2000.00 6000.00
1. 业务费 7000.00 1000.00 6000.00
(1)计算、分析、测试费 0.00 0.00 0.00
(2)能源动力费 0.00 0.00 0.00
(3)会议、差旅费 2000.00 参加学术会议 1000.00 1000.00
(4)文献检索费 0.00 0.00 0.00
(5)论文出版费 5000.00 论文版面费 0.00 5000.00
2. 仪器设备购置费 0.00 0.00 0.00
3. 实验装置试制费 0.00 0.00 0.00
4. 材料费 1000.00 资料复印费 1000.00 0.00
结束