详情

人工智能嵌入家庭医疗场景的问诊系统研究

申报人:徐义泉 申报日期:2025-03-18

基本情况

2025创新项目
人工智能嵌入家庭医疗场景的问诊系统研究 学生申报
创新训练项目
工学
计算机类
学生来源于教师科研项目选题
二年期
随着人工智能技术的快速发展,其在医疗领域的应用日益广泛。本项目旨在将人工智能嵌入家庭医疗场景,开发一套创新的问诊系统,借助人工智能技术实现对常见疾病的初步诊断、病情评估以及个性化医疗建议,打破传统医疗问诊在时间和空间上的限制,让居民在家就能享受便捷、高效的医疗服务,提高家庭医疗保健水平,缓解医疗资源分布不均的问题。项目将整合海量医学文献、临床病历及问诊对话数据,利用 Traformer 架构搭建并训练大语言模型。通过多轮对话训练,模型将理解患者描述,精准识别症状,基于医学知识提供初步诊断建议与检查项目推荐。此研究成果不仅能缓解医疗资源紧张问题,还有望推动智能健康管理等领域的发展,让更多人享受到便捷、优质的医疗服务 。
参与研究《数字化技术驱动的高校教学评价标准创新研究——基于产教融合生态系统的多为分析》项目
在项目的推进过程中,指导老师从专业指导层面,凭借深厚的专业知识与丰富经验,为项目指明方向。遇到技术难题时,指导老师分享相关领域前沿研究成果,启发我们找到解决方案,使研究得以顺利推进
校级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
徐义泉 康复医学院 康复工程(本科) 2023 设计、开发、优化系统算法
俞书桓 康复医学院 康复治疗学(本科) 2024 进行系统测试,保证稳定性。
张泮文 康复医学院 康复工程(本科) 2024 对医学术语使用审核
董芳 康复医学院 康复工程(本科) 2023 提供专业医学知识支持
秦启越 康复医学院 康复工程(本科) 2023 数据收集与分工

指导教师

序号 教师姓名 所属学院 是否企业导师 教师类型
姚青 医学信息工程学院

立项依据

1.根据权威数据预测,我国慢性病患者总数已超过2亿人,《中国居民营养与慢性病状况报告(2020年)》指出2019年慢性病导致的死亡占总死亡率的88.5%,及时有效的问诊和广泛方便的对生活的指导有助于患者增加存活时间和生活幸福感,为了解决慢性病患者遇到问题频繁往来医院不方便、不及时的情况,构建一个智能化、精准化的家庭医疗问诊系统,能够准确识别用户症状,提供可靠的诊断建议和治疗方案便成了重要的研究的目的。
2.我国40岁以上人群针对慢性栓塞性肺疾病的筛查普及率不足10%,导致约70%的患者确诊时已进入中晚期,权威数据显示肺癌早筛使5年生存率从16%提升至70%,利用人工智能技术,对用户的健康数据进行长期跟踪和分析,实现疾病的早期预警和预防。
3.根据QYResearch《全球医疗人工智能市场研究报告2023-2029》,全球医疗AI市场规模到2029年将达到427.4亿美元,年复合增长率(CAGR)为26.1%[4],AI医疗市场广大,未来可期,因此探索人工智能与家庭医疗场景深度融合的模式是时代所趋,是提高医疗服务的可及性和质量,改善居民的就医体验的重大社会创新。
针对人工智能嵌入家庭医疗场景的问诊系统的医学与数据学问题,本项目基于机器学习与深度学习理论,探索新的个性化,高准确率,能长期分析数据的智能化医疗伴侣,用大量数据并结合实际分析病因,预测疾病发生风险、制定个性化治疗方案,具体研究如下:
①人工智能在家庭医疗场景下对病例数据的收集和分析
利用AI迅速精确的信息收集能力,收集大量的医疗文本数据、临床病例、医学影像等,对数据进行清洗、标注和分类,为后续的模型训练提供高质量的数据支持。通过云端平台整合家庭医疗设备、电子病历、基因数据库等多源数据,构建患者健康画像,融合自然语言处理和机器学习等技术,实现精准病情分析与智能化医疗服务。
②人工智能在家庭医疗场景下增加结果准确性的手段
引入语音、图像等多种输入方式,丰富问诊的信息采集手段,提高诊断的准确性。通过WebRTC等技术实现医患高清视频问诊,采用深度学习算法,如卷积神经网络、循环神经网络等,构建疾病诊断模型、病情评估模型和治疗推荐模型。
③人工智能在家庭医疗下的获取用户身体状况的方式
研究如何将人工智能问诊系统与家庭医疗设备(如智能手环、血压计等)进行无缝对接,利用时间序列模型(如LSTM)分析可穿戴设备采集的血压、血糖等数据,预测慢性病风险并触发预警,实现健康数据的实时采集和传输。另外设计友好、便捷的人机交互界面,方便用户输入症状信息,获取诊断结果和医疗建议。
国外,人工智能在医疗领域的应用已经取得了显著进展。谷歌、IBM等科技巨头积极布局,谷歌利用AI分析医疗数据助力疾病预测,谷歌和DeepMind的科研人员在《自然》杂志上发表了一项研究,不仅提出了MultiMedQA(美国医师执照试题)评估基准,用于评估大语言模型在编码临床知识方面的表现,还详解了谷歌医疗大模型Med-PaLM的进化过程最终的研究结果,一组临床医生对谷歌和DeepMind团队的医疗大模型Med-PaLM回答的评分高达92.6%,与现实中人类临床医生的水平(92.9%)相当。基准结合了六个现有医疗问答数据集(MedQA 、MedMCQA 、PubMedQA、LiveQA 、MedicationQA和MMLU),涵盖专业医学、研究和消费者查询等多个方面,以及一个全新的在线搜索医疗问题库数据集HealthSearchQA,力图从多方面把AI培养成一名合格的医生。
summernote-img
图1 Med-PaLM 对消费者医疗问题的回答逻辑及答案
英国的 Babylon Health推出了基于人工智能的移动医疗问诊应用,用户可以通过手机与虚拟医生进行对话,获取初步的医疗建议,伦敦大学学院与Babylon Health在《自然》杂志上发表了一项研究,提出了一种基于因果推理的 AI 系统,通过反事实问题缩小疾病范围,其诊断准确率在临床试验中优于传统 AI 模型(77.26% vs. 71.40% 医生平均准确率)。该系统尤其在罕见病(如非霍奇金淋巴瘤)诊断中表现突出,准确率比医生高 30%,同时在官网发表另一项研究,研究通过分析 44 名医生和 AI 系统的对比试验,发现因果 AI 在复杂病例中表现更优,且与医生形成互补。研究还指出,AI 可通过降低误诊率和优化资源分配,缓解医疗资源不均问题。IBM Watson for Health能与患者对话,提供初步诊疗建议,但在复杂病情诊断和跨领域知识融合上仍有不足。面对问题,国外已开展多项大语言模型在医疗领域应用的研究,部分成果已应用于临床辅助诊断。
在国内,也有多家企业和科研机构开展了相关研究。例如,
①科大讯飞利用语音识别和人工智能技术,开发了智能医疗辅助诊断系统,基于讯飞医疗人工智能核心技术、智能语音交互技术与智能外呼服务平台,按照家庭医生工作内容为不同人群制定外呼方案,帮助家庭医生完成慢病随访、考核与满意度调查、体检预约、通知宣教等日常随访工作。
summernote-img
图2 科大讯飞智能语音交互技术
②腾讯的觅影项目通过人工智能技术对医学影像进行分析,辅助医生进行疾病诊断,利用已标注的实体三元组在自然语言表述上的共性和差异,对多种医疗实体关系类内的数据分布进行联合编码,进而从生成模型的角度去发现未被标注的关系实体三元组。该方法减轻了传统判别模型对于外部资源的过度依赖,并且不依赖于医疗实体关系类间的差异进行建模。然而,目前将人工智能深度嵌入家庭医疗场景的问诊系统仍处于发展阶段,存在诊断准确率有待提高、与家庭医疗设备兼容性不足等问题。
1.多模态数据融合:使用各医疗大厂的医疗检测仪器,检测病人日常生理、病理变化,将引入图像、语音等多模态数据与文本数据融合,使问诊系统能更全面地获取患者信息,提升诊断准确性。
2.个性化医疗服务:根据用户的个人健康档案和历史问诊记录,结合人工智能获取的医疗大数据,普性与个性相结合,为用户提供个性化的医疗建议和健康管理方案。
3.实时互动与反馈:实现用户与人工智能系统的实时互动,及时解答用户的疑问,根据用户反馈不断优化系统,尽最大可能发挥AI的纠错与学习能力,为病人提供及时且精确的医疗建议。
4.家庭医疗设备联动:与常见的家庭医疗设备实现互联互通,自动采集和分析用户的健康数据,为问诊提供更丰富的信息。
5.隐私保护机制:设计安全可靠的隐私保护技术,确保患者数据在系统运行过程中的安全性和保密性。
技术路线:
首先对家庭医疗问诊语义编码模型进行了训练,其中包括数据集构建和模型训练两个环节,然后使用训练好的语义编码模型将疾病知识图谱编码成疾病知识向量库,最后训练了家庭医疗问诊对话生成模型,在知识库中通过向量相似度完成知识选择,将病患输入与知识拼接作为模型输入的增强,从而使模型利用相关的医学知识生成更可靠的回复。技术路线涵盖以下关键方面:
一、数据收集与预处理:与医疗机构合作和利用公开的医疗信息库收集大量医疗文本、图像、语音数据,进行数据标注等预处理工作,构建高质量数据集。
医学影像数据库
①NIH Chest X-rays包含10万+胸部X光片数据,涵盖肺炎、肿瘤等多种疾病
②UK Biobank - UK Biobank包含50万参与者的多模态数据(MRI、基因、生活方式等),支持心脑血管、肿瘤等疾病研究
癌症与基因组数据库
①portal.gdc.cancer.gov涵盖33种癌症基因组、转录组和大量癌症临床数据,为癌症的治疗提供数据
②Surveillance, Epidemiology, and End Results Program美国癌症统计数据库,提供全美70%以上新发癌症病例的流行病学数据,用于治疗与预后分析
③Home - GEO - NCBI存储全球研究者的基因表达数据,涵盖疾病机制、药物反应等领域,全球各种病例的数据采集为不同人种的治疗提供可靠的分析
二、模型选择与微调:选用合适的大语言模型,利用医疗数据集对其进行有监督和无监督微调,提升模型对医疗领域的适应性。
①可以利用国内大厂如科大讯飞和腾讯天衍的医疗自然语言理解系统的研究,通过自然语言处理、知识图谱等技术进行医疗文本理解,并提供医疗实体关系抽取、医疗事件抽取、医疗知识图谱构建、知识图谱计算与表示学习、医学术语标准化等基础NLP算法能力,为医疗意图识别、病历文档理解、疾病风险预测与传染病预警、辅助诊断与治疗、用药推荐助手的成功运用提供可靠的技术支持。
三、多模态融合:采用深度学习技术,实现图像、语音与文本信息的融合处理,提高模型对多源信息的综合分析能力。
①在智能家庭医疗的使用场景下,实现对图像、语音和文本的融合,是实现准确医疗的前提,因此可以采用采用卷积神经网络(CNN)这样适合图像特征提取的技术,实现对图像的分析,使用循环神经网络(RNN)结合结合梅尔频谱等声学特征提取关键语音信息这种一般手机都可以配置的语音识别技术,来实现对于语音的分析,对于文本,则直接连接deepseek的语音转文字功能,十分便捷。
四、系统集成与优化:将优化后的模型集成到问诊系统中,通过反复测试和优化,提升系统性能和用户体验。
①直接对比新旧模型版本效果(如诊断准确率、医生采纳率),逐步灰度发布新版本,前期邀请医生直接参与对智能医疗结果的评估,并靠此不断学习,帮助AI不断寻找针对某种疾病的思考路线,降低数据库负载,增加响应时间。
拟解决问题:
1.如何提高人工智能模型对疾病诊断的准确性和可靠性。
2.怎样实现家庭医疗设备与问诊系统的数据无缝对接和实时传输
3.如何设计出简单易用、符合用户习惯的人机交互界面。
4.如何保障用户的医疗数据安全和隐私。
预期成果:
研发出功能完备、性能优良的人工智能嵌入家庭医疗场景的问诊系统,发表一篇学术论文,阐述研究成果与创新点;培养一批掌握人工智能与医疗交叉领域知识的专业人才。推动大语言模型在医疗问诊领域的技术进步与应用推广。
1. 2025.5月-2025.8月:完成相关文献收集和分析,撰写研究现状分析报告,确定研究方案和技术路线。
2. 2025.9月-2025.12月:进行数据收集与预处理,完成大语言模型的选择和初步微调。
3. 2026.1月-2026.10月:开展多模态融合研究,设计并开发问诊系统。
4. 2026.11月-2027.5月:进行试验,收集反馈数据,撰写研究报告和学术论文,准备成果验收。
(1)项目团队成员涵盖医学、信息学、人工智能等领域的专业人才,具备一定的理论基础和研究分析能力。(2)具备完善的医疗数据采集渠道和合作医院,能为项目提供充足的数据支持和实验环境。
已经收集一定规模的医疗问诊对话数据,涵盖常见病症的咨询、诊断级治疗建议等内容,为模型学习问诊模式和医学知识提供数据基础。但数据多样性不足,罕见病、复杂病例的数据相对匮乏,缺乏高质量的多语言医疗数据,难以满足不同语言患者的问诊需求。所以应结合知识图谱信息,提高诊断建议的全面性和准确性。

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 6000.00 医疗数据收集、学术交流、出版费等 3800.00 2200.00
1. 业务费 4000.00 2800.00 1200.00
(1)计算、分析、测试费 1000.00 智能医疗需要的大数据计算租赁费 600.00 400.00
(2)能源动力费 0.00 0.00 0.00
(3)会议、差旅费 500.00 参加学术会议、交流及学术调研费等参加学术会议、交流及学术调研费等 400.00 100.00
(4)文献检索费 500.00 检索证明、科技查新等 300.00 200.00
(5)论文出版费 2000.00 论文出版费、著作权和专利申请费等 1500.00 500.00
2. 仪器设备购置费 1000.00 购置用于语音交互的设备 500.00 500.00
3. 实验装置试制费 0.00 0.00 0.00
4. 材料费 1000.00 教材、打印等耗材 500.00 500.00
结束