国务院办公厅发布的《全国医疗卫生服务体系规划纲要》中指出要借助互联网+、大数据来改善信息资源配置,推动惠及全民的健康信息服务和智慧医疗服务,推动健康医疗大数据的应用,逐步转变服务模式,提高服务能力和管理水平。
数据挖掘(Data Mining)是应用一系列技术从大型数据库和数据仓库中提取人们事先未知而潜在有用的隐含的信息和知识的过程[1]。常用的数据挖掘方法主要包括决策树、聚类分析、关联规则与关联分析。
在国外,数据挖掘技术已被广泛应用于医疗领域中,如疾病的推理诊断、病理应用、药理试验以及生物基因工程等方面。在DNA序列研究方面,通过采集异构基因数据,分析基因相应的涵义,利用工具分析序列的相似度,完成DNA数据片段的分析和应用。在相关疾病的治疗方面,数据挖掘技术在肿瘤的诊断、治疗与病理分析中都有具体应用。Nishtala, PS(2018)等人运用关联规则方法,通过确定药物组合对老年人骨折风险的影响,来评价与老年人骨折相关的频繁药物组合,并认为关联规则方法可以成为确定与药物不良事件相关的药物组合的重要工具,肯定了关联规则方法的有效性和合理性[2];Wright, A(2013)等人验证了基于关联规则挖掘方法来推断药物与问题之间的关联,旨在验证该方法,结果证实关联规则方法的高准确性,证明关联规则方法具有可推广性[3];Yan Feng(2014)等人论述了数据挖掘的特点并综述了其各种方法如相关性分析、聚类分析、进化分析等在中西医结合研究在冠心病中的应用,分析了该领域的研究进展与展望,最终认为数据挖掘方法在该领域的应用已经建立了相对完整的范式和技术支撑[4]。
在国内,关联规则分析常用于中药制剂处方用药规律分析[5-7]、穴位配伍规律分析[8]、经典名方用药规律分析[9]、基于电子病历的患者用药规律分析[10]、慢性病共病分析[11]、患者高额住院费用分析[13]等。
综上,数据挖掘技术在医学领域应用广泛,目前学界将数据挖掘技术应用于算法的优化、疾病的诊疗,生物信息学等领域,在国内的应用更多关注于中医药领域具体方剂的挖掘分析。
近年来,为全面实施健康中国战略,建立健全电子病历信息化建设工作机制,电子病历中蕴涵的各种临床信息(包括人口统计学、诊断史、药物、实验室检测结果等)的来源越来越丰富,电子病历已成为大规模健康数据分析的重要来源。对电子病历的挖掘分析有助于医学专业人员了解疾病的诊疗过程,确定治疗的有效性。
COPD是一种以进行性和持续性气流受限为特征的炎症性疾病,与多种炎症相关慢性疾病共存的情况较为常见,常与焦虑、关节炎、双相情感障碍、心血管疾病、抑郁、糖尿病、高血压、高脂血症、骨质疏松和精神分裂症等共病,当前学界对于共病研究的数据一般来源于调查统计、调查问卷、抽样调查[13-15],对电子病历进行挖掘分析,探寻COPD的共病模式与用药规律,构建COPD患者分层管理模型,针对不同共病类团进行差异化治疗具有实际意义。
参考文献
[1]张庆,王晓月.关联规则在中医药方剂专利挖掘中的应用[J].中华医学图书情报杂志,2019,28(07):27-32.
[2]Nishtala P S, Chyou T, Held F, et al. Association rules method and big data: Evaluating frequent medication combinations associated with fractures in older adults[J]. Pharmacoepidemiology and drug safety, 2018, 27(10): 1123-1130.
[3]Wright A, McCoy A, Henkin S, et al. Validation of an association rule mining-based method to infer associations between medications and problems[J]. Applied Clinical Informatics, 2013, 4(01): 100-109.
[4]Feng Y, Wang Y, Guo F, et al. Applications of data mining methods in the integrative medical studies of coronary heart disease: progress and prospect[J]. Evidence-Based Complementary and Alternative Medicine, 2014, 2014.
[5]赵雪茹,马利,李淑琪等.基于关联规则的骨质疏松性骨折中药熏洗处方用药规律研究[J].中国骨质疏松杂志,2022,28(01):84-88.
[6]张文静,郭桂明,许佳旺等.基于关联规则的31958张含麻黄中药制剂处方用药分析[J].中国中医药信息杂志,2021,28(12):128-133.
[7]图雅,张春生,白翠兰.基于全局和下钻分析的蒙医热证方剂组方规律关联规则挖掘[J].中国现代应用药学,2021,38(15):1842-1848.
[8]徐家淳,于臻,李强等.基于关联规则的针刺治疗血管性痴呆的穴位配伍规律[J].中国老年学杂志,2019,39(09):2156-2159.
[9]万安庆,鲍剑洋,胡孔法.基于Apriori改进算法的名老中医治疗糖尿病用药规律研究[J].中国中医药信息杂志,2017,24(12):97-101.
[10]张庆,刘婷.关联规则在小儿肺炎病案信息挖掘中的应用[J].中华医学图书情报杂志,2020,29(07):31-37.
[11]徐小兵,李迪,孙扬等.基于关联规则的中国老年人慢性病共病分析[J].中国慢性病预防与控制,2021,29(11):808-812.
[12]刘航江,朱慧,杨翠.基于Apriori算法的甲状腺恶性肿瘤患者高额住院费用关联规则分析[J].现代预防医学,2021,48(13):2479-2483.
[13]王志如,贾小芳,刘梦冉,等.2018年我国15省45~64岁中年人共病现状及其影响因素——基于关联规则分析[J].环境与职业医学,2024,41(07):768-773.
[14]李小凤,裴星童,杨春晖,等.老年人群慢性病共病模式与失能状况的关联研究:基于四川省抽样调查[J/OL].中国全科医学,1-10[2024-08-26].
[15]许珊,张书迎,谢文涵,等.生活方式与心血管代谢性共病发生发展轨迹的关联研究[J].现代预防医学,2024,51(12):2113-2120.