基于机器视觉血细胞检测的理论研究与系统开发

申报人：梁德荣申报日期：2025-03-18

基本情况

所属批次:

2025创新项目

项目名称:

基于机器视觉血细胞检测的理论研究与系统开发学生申报

项目类型:

创新训练项目

所属学科门类:

工学

所属专业类:

计算机类

项目来源名称:

学生自主选题

项目归属学院:

项目期限:

二年期

项目简介:

本项目基于团队在计算机视觉与深度学习领域的持续研究，致力于构建基于机器学习的血细胞检测系统，提升血液分析的自动化与精准度。依托先进的计算机视觉技术，我们构建高精度、低延迟的智能检测系统，将摄像头采集的显微镜视频流与优化后的深度学习模型相结合，以提高医学诊断的效率和可靠性，助力精准医疗的发展。在算法优化方面，我们针对现有目标检测框架的局限性，提出改进型YOLOv9算法，以提升检测精度与计算效率。经过实验验证，改进后的YOLOv9算法在公开血细胞数据集上的准确率已达到了91.4%mAP（平均精度均值）。为进一步提升模型的准确度和泛化能力，我们将在多尺度特征融合、动态感受野调整以及高效注意力机制等方面继续优化，确保本系统在复杂医疗环境下依然具备高稳定性和高检测精度。在系统开发方面，本项目采用软硬件协同优化策略，利用实时目标检测技术，实现血细胞形态的自动识别与分类。同时，为了提升系统的适用性，我们计划基于跨平台开发框架，实现移动端和网页端的同步部署。目前，该项目已完成核心技术的初步验证，计划在真实应用场景中进行优化测试。未来，我们将进一步拓展该技术的适用范围。

负责人曾经参与科研的情况:

在科研实践过程中，曾以项目负责人参与中国国际大学生创新创业大赛校级选拔赛，负责过项目设计与实施方案撰写；同时参与中国大学生计算机设计大赛等赛事，深入开展项目开发与技术应用研究。

指导教师承担科研课题情况:

孟凡彬，生物医学工程专业副教授，博士，主要研究方向为机器学习与智能医学。

个人科研方面，曾主持或参与各类课题20余项，其中国家自然基金3项，项目总经费超200万元，有4项研究成果转化应用于中华人民共和国日照海关等单位，且目前正与英国华威大学等国际知名高校课题组合作研究。发表SCI论文数十篇。

大学生创新创业项目方面，作为唯一指导教师指导国家级3项、省级6项，并合作指导国家级2项、省级2项。

大学生创新创业成果方面，以末位通讯作者指导学生发表本科生一作论文4篇（SCI论文平均影响因子超2.1）；指导学生获得专利30余项、软件著作权30余项，并在创新创业比赛中获国家级奖励50余项、省级奖励160余项。

指导教师对本项目的支持情况:

本项目的指导教师在计算机视觉与智能检测领域具有丰富的研究经验，并在高精度的影像采集设备目标检测及机器学习算法优化方面积累了深厚的理论与实践基础。为了确保本项目顺利推进，指导教师将在技术指导、项目管理、资源协调等多个方面提供全面支持。

在技术指导方面，指导教师将结合前沿研究成果，帮助团队深入理解计算机视觉领域的核心算法，尤其是目标检测技术在高精度的影像采集设备血细胞检测中的优化应用。针对模型训练、数据标注、算法改进等关键环节，指导教师将提供系统化的分析和建议，以提高检测精度，优化模型的泛化能力。

在项目管理方面，指导教师将严格把控项目进度，定期组织团队研讨，确保各阶段任务按计划推进。同时，针对研究过程中可能遇到的技术瓶颈和实验难点，指导教师将协助团队制定合理的解决方案，避免低效试错，提升研究工作的整体效率与科学性。

在资源协调方面，指导教师将积极推动团队与相关科研机构和企业的合作，争取更多实验数据和计算资源支持。同时，指导教师将结合实际需求，协助团队申请实验设备、软件环境及服务器算力，确保项目的实施条件充分。

此外，指导教师还将为团队提供专业的学术指导，包括论文撰写实验结果分析以及技术方案优化等，鼓励团队成员探索具有创新性的研究思路，并在学术交流平台上展示研究成果，提升项目的学术价值和行业影响力。

项目级别:

国家级

项目成员

序号	学生	所属学院	专业	年级	项目中的分工	成员类型
1	梁德荣	医学信息工程学院	计算机科学与技术（本科）	2024	桌面端的开发	第一主持人
2	袁浩宇	医学信息工程学院	生物医学工程（本科）	2024	硬件的开发	成员
3	王泽威	医学信息工程学院	生物医学工程（本科）	2023	算法模型的研究	成员
4	任佳涵	医学信息工程学院	计算机科学与技术（本科）	2024	辅助算法的优化	成员
5	李雨佳	医学信息工程学院	信息管理与信息系统（本科）	2024	移动端应用的开发	成员
6	滕璐	医学信息工程学院	生物医学工程（本科）	2023	项目相关视频的拍摄与制作	成员

指导教师

序号	教师姓名	所属学院	是否企业导师	教师类型
1	孟凡彬	医学信息工程学院	否	第一指导教师

立项依据

研究目的:

随着中国医疗事业及优质医疗资源推动了基层医疗机构的发展，提高了服务质量。然而在中国市场中，对于血细胞的需求呈指数级增长状态。其核心驱动力源于三种动因，其一，人口老龄化进程加速与疾病谱系演变叠加，恶性肿瘤、血液系统疾病及重大手术患者基数攀升，驱动红细胞、血小板等成分血临床细胞激增。其二，中国的医疗科技革新，催生了干细胞治疗、CAR-T免疫疗法等尖端技术，造血干细胞移植与基因编辑疗法对高质量血细胞提出超常规储备要求。其三，通过多种渠道落实了多级诊疗制度和基层医疗卫生服务，基层医疗机构血液制品可及性提升。这就需要提高分类并检测血细胞的效率从而为全民健康注入强劲动能。

依托智能工控引擎、显微镜与高精度影像采集设备的深度融合，智能视觉检测系统正以高精度实现血细胞形态学特征的精准捕捉与异常血细胞分类。该系统采用高通量显微成像技术，能够实时处理大量细胞样本并进行形态化分析，不仅突破了传统人工镜检的效率瓶颈，更构建了支撑精准医疗的细胞级数据基础。此外，智能工控引擎的强大计算能力与高精度影像采集设备的精确成像相结合，使微观结构细节得以清晰呈现，为医学科研与临床诊断提供更加精准、高效的影像分析支持。

在生物医学与机器视觉智能化结合的进程中，基于SML-YOLOv9架构构建的多尺度血细胞检测系统，实现了对不同类型的血细胞类型的精准识别。该模型通过动态标签分配机制优化稀有细胞类别的召回率，最终达成91.4%mAP的血细胞检测精度，其分层特征解耦能力不仅重构了血细胞形态学分析的数字化标准，更打通了从显微镜成像到智能诊断报告的端到端决策链路，为血液病动态监测与精准分型建立了可解释的深度学习。其搭载的高通量显微成像技术可同步完成百万级细胞样本的实时数字化表征，实现了对庞多异常血细胞的识别与检测。

依托桌面电脑如服务器强大的CPU/GPU，可处理高分辨率图像和复杂算法,如SML-YOLOv9大规模模型训练，通过USB3.0、GigE或PCIe接口实现高速数据传输，支持长时间、高负载运行。

通过智能工控引擎与显微镜和高精度的影像采集设备结合的视觉系统高分辨率成像技术和SML-YOLOv9的实时目标检测能力，可快速识别血液样本中的红细胞、白细胞、血小板等细胞类型及发生异常时的显著形态，如畸形红细胞、白血病细胞，减少人工显微镜观察的主观误差。结合APP端的远程传输功能，偏远地区可将样本图像上传至云端，解决了偏远地区在医疗资源分布不均的问题，并减少对昂贵检测设备的依赖，降低基层医疗机构的设备投入门槛，提高了对基层群众的医疗服务质量。通过改进后的YOLOv9大规模数据训练，可迅速识别罕见血细胞异常模式，辅助医疗人员及时发现疾病从而减小患者患病的概率。而在YOLOv9算法中加入MSDA注意力机制与MLCA注意力机制通过融合不同尺度的特征并扩大感受野，增强模型对关键区域的多层次上下感知能力，从而提升复杂场景下的目标检测精度，进而提高了整体精度。所提出的模型在BCCD数据集上达到了91.4%的平均精度(mAP)。利用SML-YOLOv9精准识别和分类血细胞（如红细胞、白细胞、血小板），能有效地减少因图像模糊或低对比度导致的误检。将医疗医学与机器视觉智能化相结合，对于医疗事业的发展做出了巨大贡献。

研究内容:

由于医疗事业和人工智能算法的持续发展，医学与人工智能相结合中，基于不同类型的血细胞检测在临床医疗、生物科技研究与流行病防控等多个领域展现出巨大的应用潜力。高速率的血细胞检测技术可以解决急诊大出血、败血症等需快速获取血细胞计数的问题；大量的血细胞检测也实现了快速感染筛查与分诊；改进的SML-YOLOv9算法高速识别异常细胞，准确率高达91.4%,减少误诊与重复检测。本文旨在研究一种基于智能工控引擎与显微镜结合和高精度的影像采集设备结合的视觉系统，自主改进SML-YOLOv9算法的高效目标检测系统，以满足各种复杂环境和场景中检测血细胞的需求。

高精度的影像采集设备与显微镜及智能工控引擎结合形成的智能检测系统具备灵活性高、检测精度高、成本较低等特点，在血细胞动态观察中显出显著优势。而SML-YOLOv9算法是一种基于深度学习的目标检测算法，从而达到高效、快速的目标检测异常血细胞的效果。本研究将机器视觉系统技术的灵活性和高效性与自主改进SML-YOLOv9算法的先进性相结合，同时优化智能检测系统检测血细胞的功能，实现对目标检测领域的创新应用，提升检测效率和准确性。

我们改进的SML-YOLOv9算法在保持检测速度、增强了主干特征提取网络与检测头的连接的同时，其主干中加入了新的SPD-Conv块，取代了传统的卷积和池化层。此外，SML-YOLOv9加入了MSDA注意力机制和MLCA注意力机制，MSDA机制通过融合不同尺度的特征并扩大感受野，通过有效地聚合不同尺度的语义信息，MSDA能够减少自注意机制的冗余，提高模型的效率和性能，从而提升复杂场景下的目标检测或图像分割精度。MLCA注意力机制通过分层整合局部细节与全局上下文信息，动态增强关键特征的表达力，有效提升模型对复杂场景中多尺度目标的识别与定位精度，两种机制在血细胞检测上提高了精确度。相比于标准的CNN，SPD-Conv能更有效地提取相关特征。在血细胞检测的背景下，SPD-Conv成为一种可行的替代传统卷积和池化层的方法，同时保持相似的参数计数。其主要目的是提高低分辨率血细胞图像和微小血小板物体的检测精度。通过利用其高效的矩阵处理能力，SPD-Conv在促进疾病诊断和进展监测方面具有广阔的应用前景，显著提升了工控机与显微镜和高精度的影像采集设备结合检测血细胞的性能。在实际应用中，系统得以实现实时分析图像数据，通过先进的目标检测算法，快速而准确地识别出不同类型的血细胞的体态与显著特征，从而达到加速医疗就诊的目的，为医疗事业提供了技术的支持。

与传统显微镜相比，智能检测系统具有低成本和高精度的显著优势。当该设备用于检测血细胞类型时，无需人员直接参与，进一步降低了成本。依托其高分辨率与实时成像能力不仅大幅提升了微观检测的精度和效率，也显著改善了图像捕捉的质量。因此，智能检测系统的应用，以及SML-YOLOv9目标检测算法的训练，为医疗诊断、医学科研和医疗资源分配等领域奠定了坚实的基础。

在APP端的研究上，我们深入探讨了Uni-app的跨平台特性，并基于其框架开发了一款能够远程连接检测设备的移动端应用。该APP支持实时图像采集、血细胞智能分析及存储功能，使用户能够随时随地进行检测操作。此外，我们优化了应用的界面设计，提高了用户体验，并引入了自定义组件和插件，以增强交互性和可视化效果，并加上血细胞学习内容方便医疗人员观察。通过数据同步功能，实现了跨设备的数据共享与远程操作，大幅提升了血细胞检测的便捷性与实用性。

下面是我们预期的研究内容（部分功能已经完成设计）：

（1）系统设计路线

本研究设计的系统包括由智能工控引擎与显微镜和高精度的影像采集设备结合的智能检测系统、数据采集模块、算法模块以及用户交互模块。智能检测系统负责现自动化检测血细胞，实现高精度检测与可量化分析突破传统人工镜检的效率瓶颈与主观误差限制。数据采集模块主要从GitHub中采取三分类、广域集的血细胞数据集，采集了白细胞、红细胞、血小板三类并且来自多个实验室、医院、研究机构或公开竞赛的数据集。并将数据集划分为训练集、验证集、测试集。训练集用于模型训练学习，验证集用于在训练过程中监控模型性能、调整超参数、进行早停，测试集用于在训练完成后最终、一次性评估模型的泛化性能。这样的高性能数据集为SML-YOLOv9算法奠定基础。算法模块采用SML-YOLOv9进行目标检测，实现高效精准的目标识别与分析。用户交互模块则负责将检测结果以直观的方式展示给用户。

summernote-img

图1 系统技术路线图

（2）SML-YOLOv9的改进

模块主要是以YOLOv9算法为基础对其进行改造，首先添加SPD-Conv卷积，增加通道数，在增加通道数的特征图上应用非步长卷积层，非步长卷积层不仅不减少特征图的空间尺寸，而是通过学习这些增加的通道中的信息来提取重要特征。这样，即使是在较小的空间分辨率上，模型也能有效捕捉到小物体的细节信息。这种结合使用SPD层和非步长卷积层的方法，使得CNN能够更好地处理小物体和低分辨率图像中的挑战，提高了模型在这些复杂场景下的性能和鲁棒性。其次加入了MLCA注意力机制，该模块可以同时结合信道信息和空间信息，以及局部信息和全局信息来提高网络的表达效果，来提升目标检测血细胞的性能。最后以MSDA注意力机制减少特征信息在深层次网络递进过程中的信息丢失，来达到重建后的血细胞图像具有更多高频信息、纹理细节丰富、观感上更接近原始高分辨率图像的效果。

（3）系统运行

在实际应用中，智能工控引擎结合显微镜和高精度影像采集设备，构建智能检测系统，实现实时视频数据采集，并将数据传输至处理与分析模块。改进后的YOLOv9算法对血细胞数据集进行目标检测，识别目标对象，并通过用户交互模块呈现检测结果。此外，系统具备高精度、高倍率、稳定性强的特点，能够实现血细胞的实时监测与精准识别。

国、内外研究现状和发展动态:

基于机器学习的血细胞检测主要衍生于机器视觉的目标检测，大多数的检测技术都以机器视觉作为基础。从二十一世纪初期，传统的目标检测技术就已经出现，而后十几年，研究者又提出了基于深度学习的目标检测算法。迄今为止，世界上已经涌现出了一大批优秀的目标检测算法，这些算法也被应用于各种领域。

1.国内研究现状和发展动态

中国机器学习在血细胞检测领域的发展历程始于20世纪90年代末期传统显微镜人工计数的数字化改造尝试，彼时基于边缘检测算法的细胞轮廓识别技术首次应用于血涂片图像分析，但受限于计算机视觉精度不足与硬件成本高昂，不能被完全应用，21世纪初期随着数字病理扫描仪普及与开源图像库构建，支持向量机（SVM）与随机森林算法开始用于白细胞五分类任务，2005年深圳迈瑞医疗推出首款融合形态学规则的半自动血细胞分析仪，通过灰度共生矩阵提取纹理特征使分类准确率突破85%^[1]。

2012年深度学习浪潮催生技术跨越，华中科技大学团队利用卷积神经网络（CNN）构建的血细胞亚型识别模型在百万级标注数据集上实现98.7%的敏感度，推动国家卫计委将AI辅助诊断列入《医学检验设备智能化发展指南》^[2]；2016年阿里巴巴ET医疗大脑与迪安诊断合作开发全自动推片染色-成像-分析一体化系统，集成迁移学习框架实现罕见病细胞（如疟原虫）检测特异性达99.2%；2018年《健康中国2030》战略实施后，腾讯觅影联合金域医学建立分布式血细胞病理云平台，运用联邦学习技术聚合全国300余家医疗机构数据训练抗染色差异模型，使基层医院诊断一致性提升至三甲水平的92%^[3]。

2020年新冠疫情爆发加速技术落地，华为云AI开发平台推出基于注意力机制的血小板聚集度量化算法，获NMPA三类医疗器械认证；当前阶段，多模态融合成为创新焦点，华大基因联合中科院研发的"血影"系统结合流式细胞术与高分辨率显微成像，通过Transformer架构实现循环肿瘤细胞（CTC）的纳克级捕获与基因组关联预测，而《人工智能医用软件产品分类界定指导原则》的出台正推动行业从实验室创新向临床合规应用全面转型，标志着中国机器学习在血细胞检测领域已形成"设备研发-算法优化-标准制定"的全产业链闭环生态^[4]。

2.国外研究现状和发展动态

国外机器学习在血细胞检测领域的发展历程可追溯至20世纪80年代初期计算机视觉技术首次与流式细胞术结合，美国BD公（Becton Dickinson）于1983年推出的FACS系统首次引入基于阈值的细胞聚类算法，实现淋巴细胞亚群初步分选^[5]；90年代欧洲核子研究中心（CERN）开发的ROOT数据分析框架被移植至医学图像处理领域，德国西门子医疗在1996年推出的ADVIA系列血液分析仪集成人工神经网络（ANN）进行红细胞形态学分类，通过傅里叶变换提取细胞散射光信号特征使异常细胞识别效率提升40%^[6]。

2007年哈佛大学团队在《自然-医学》发表突破性研究，利用支持向量机（SVM）结合高内涵成像技术实现白血病细胞的自动化分型，准确率达93.5%并获FDA 510(k)认证^[7]；2012年深度学习革命推动技术跃迁，Google DeepMind与英国牛津医院合作开发的CycleGAN模型成功解决染色差异导致的细胞图像域迁移问题，使跨国多中心研究的模型泛化能力提升至89%；2016年美国初创公司PathAI获得比尔·盖茨基金会投资，其基于Mask R-CNN架构的血涂片分析系统在疟疾检测任务中达到99%特异性，同年欧盟通过《体外诊断医疗器械法规》（IVDR）将AI辅助诊断纳入CE认证体系^[8]。

2019年以色列公司Sight Diagnostics推出完全自主化的YOLO血检设备，采用迁移学习框架适配全球30余种血细胞形态变异，通过微流控芯片与卷积神经网络（CNN）的协同实现5分钟完成18项参数检测^[9]；2021年Meta AI联合斯坦福大学提出Vision Transformer（ViT）在病理切片中的自监督预训练方法，仅需10%标注数据即可在罕见血液病细胞检测任务中超越全监督模型^[10]；当前阶段，生成式AI与量子计算正重塑行业边界，英伟达Clara平台集成Diffusion模型合成高保真血细胞图像以解决数据隐私难题，而剑桥大学团队开发的GNN系统已能通过单细胞RNA测序数据预测血液疾病进展轨迹^[11]，2023年《柳叶刀-数字健康》刊载的跨国研究表明，基于联邦学习的全球血细胞分析联盟（GHBCA）模型在107国数据集上的AUC值达0.987，标志着机器学习在血细胞检测领域正突破地域与技术壁垒，迈向全球化协作与伦理约束并重的精准医疗新时代^[12]。

参考文献

[1]何文军等. "基于血细胞形态识别的自动检测系统的研发." 现代检验医学杂志 34.2(2019):5.

[2]李一安. 全血细胞成像五分类算法研究. Diss. 华中科技大学.

[3]余农等. "红外成像自动目标识别技术研究-计算模型与数据流程." 现代防御技术 031.006(2003):52-59.

[4]软件工程. 基于注意力机制的YOLO算法在血细胞检测中的应用. Diss. 2023.

[5]Brinkman, Ryan R. , et al. "Automated analysis of flow cytometry data comes of age." Cytometry Part A the Journal of the International Society for Analytical Cytology 89.1(2016):13.

[6]Wang, Chien Yao , I. H. Yeh , and H. Y. Mark Liao . "YOLOv9: Learning What You

Want toLearn Using Programmable Gradient Information." European Conference on Computer Vision Springer, Cham, 2025.

[7]Levine, Martin D. . Advances in Computer Vision and Machine Intelligence.

[8]Tian, Zhi , et al. "FCOS: Fully Convolutional One-Stage Object Detection." IEEE (2020).

[9]Chen, Wei , et al. "A review of object detection: Datasets, performance evaluation, architecture, applications and current trends." Multimedia Tools and Applications 83.24(2024):65603-65661.

[10]Chen, Xinlei , S. Xie , and K. He . "An Empirical Study of Training Self-Supervised Vision Transformers." arXiv e-prints (2021).

[11]Ibragimov, Eldor , et al. "Automated Pavement Condition Index Assessment with Deep Learning and Image Analysis: An End-to-End Approach." Sensors 24.7(2024):17.

[12]Fathima, Afifa Salsabil , et al. "Federated learning based futuristic biomedical big-data analysis and standardization." PLoS ONE 18.10(2023).

创新点与项目特色:

1.产品创新点

1.1一体式端对端的创新应用

传统显微镜检测高度依赖人工操作，有着操作复杂、检测效率低和自动化程度低等一系列问题，难以满足现代的高检测精度及速率的需求。我们在硬件方面进行了创新，将显微镜、高精度影像采集设备和智能工控引擎通过高速接口（USB3.0）紧密集成，实现了硬件一体化设计，无需外接设备或其他的线，开机即用。我们的系统采用一体式端对端设计，一端是载玻片，一端是分析结果展示，解决了传统显微镜复杂的人工操作和多设备工作的问题，大大提高了检测效率。我们的智能算法平台部署在工控机上，与显微镜和高精度影像采集设备集成，实现了从图像采集、图像处理到目标检测再到分析结果输出的过程，使检测过程更高效和稳定。

1.2自主改进的YOLO目标检测算法

我们的目标检测技术采用了自主改进的SML-YOLOv9算法，该算法在YOLO系列的基础上进行了多项创新。在原有YOLOv9的基础上，我们对网络结构进行了改进，加入了MLCA注意力机制、MSDA注意力机制和SPD-Conv等模块，增强模型对血细胞重要特征的关注，显著提高了目标检测的准确度。为了解决临床中数据多样性不足的问题，我们引入了数据增强技术，包括随机旋转、缩放、颜色抖动等，增强了模型的鲁棒性。我们还优化了学习率调整策略，使用自适应优化器来加速模型收敛，提高模型在测试集上的泛化能力。通过这些创新，我们的目标检测技术提升检测精度，加快检测速度，更好地满足在临床环境实际应用的需求。

1.3可视化决策

传统AI模型在医学场景中的应用面对很大问题，模型给出结果，但医生不能理解判断依据，导致医生对AI模型的信任度不高。为了解决这一问题，本系统用了多种可视化分析工具，显著提高了医生对AI模型的可信度。系统自动生成每轮训练与验证的混淆矩阵图，展示各类血细胞的分类准确度。系统还提供F1-Confidence Curve、Precision-Recall Curve和mAP等性能评估曲线图，可以帮助技术人员优化模型性能，也可以帮助医生对模型判断的理解，有利于模型的可持续优化。

2.项目特色

本项目构建了基于机器视觉的血细胞检测的系统，将自主改进的SML-YOLOv9目标检测算法与图像处理技术结合，医生只需要将载玻片放在显微镜上，按下运行按钮，即可自动完成对血细胞的采集、计数与分类，准确高效。SML-YOLOv9模型有着高精度、低延迟和强泛化能力的特点，能准确检测红细胞、白细胞、血小板等血细胞。本系统采用混淆矩阵、F1-Confidence曲线等可视化分析，增强了临床可解释性，提升医生对AI诊断的信任度。系统支持在普通显微镜和嵌入式设备或工业电脑上运行，有低成本、易部署等优势，尤其适用于基层医院、移动体检车等资源受限的地方，加速基层医疗向智能化迈进，具有良好的社会价值。

我们项目将与市人民医院合作，由专业人员指导。日照人民医院作为市内医疗领域的核心机构，能够迅速提升产品在医疗市场的认可度与信任度，助力项目在行业内树立专业、可靠的形象，为后续推广奠定坚实基础。院汇聚了众多医学专家、先进医疗设备与前沿科研成果。通过合作，项目可深度整合这些优质资源，借助专业人士的临床经验优化产品设计，依托先进设备进行精准测试，实现产品性能与实用性的全面提升，专业医护人员可基于临床操作感受与患者使用效果，提出针对性改进建议，帮助项目团队快速发现产品潜在问题与不足，及时优化完善，确保产品契合临床实际需求，提升市场竞争力。合作过程中，项目团队与医院专业人士可开展深度技术交流与人才互动。医院专家能够为项目团队提供专业指导与培训，提升团队专业素养；项目团队也可为医院带来创新理念与技术。作为市内重点医疗机构，日照人民医院在政策解读、资源协调方面具备独特优势。与之合作可帮助项目及时了解医疗行业政策动态，在政策申报、资质审批等环节获得支持，提高项目合规性与政策适应性，为项目顺利推进保驾护航。

2.1数据增强

在训练过程中，SML-YOLOv9采用了更加丰富和多样的数据增强策略，显著提升了模型的泛化能力和鲁棒性。这些策略包括旋转、翻转、缩放、裁剪、颜色抖动等多种变换，通过模拟不同的拍摄角度、光照条件和背景变化，从而生成更加多样化的训练样本。这些增强策略扩大了数据量，提高了训练样本的多样性，还增强了模型对细胞在不同位置、尺寸和光照条件下的鲁棒性。特别是在有着复杂背景、模糊图像和不规则形态的医学图像挑战时，自主改进后的模型表现出更高的检测准确率，为系统在临床应用中提供了坚实的基础。

2.2 MLCA注意力机制

注意力机制是目标检测任务中必不可缺的一部分。绝大多数注意力机制只包含通道特征信息而忽略了空间特征信息，这导致了模型表征效果或对象检测性能不佳，而且空间注意力模块通常复杂且成本高昂。为了平衡性能和复杂性，我们加入了混合局部通道注意力（MLCA）机制。MLCA是一种即插即用的可扩展混合局部注意力机制，主要通过在多个层次上捕捉不同通道间的依赖关系，来增强网络对重要特征的关注。该模块结合了局部和全局特征以及通道和空间特征的信息，能够在增加少量参数量的情况下从而大幅度的提高检测精度。在本数据集上，MLCA相对于其他注意力机制更好地平衡了模型表示效果、性能和复杂度。

2.3 SPD-Conv卷积层

卷积神经网络（CNN）在处理低分辨率图像和小物体时性能低下，这一问题根源于使用步长卷积和池化层导致的细粒度信息丢失。SPD-Conv（空间到深度卷积）的基本原理是用于改进传统卷积神经网络（CNN）中对低分辨率图像和小物体处理的性能。当我们有一个包括小物体的低分辨率图像，对物体进行识别时，在传统的CNN架构中，如果我们直接应用步长卷积和池化层，随着网络层次的加深，图像的空间分辨率会逐渐减少，导致小物体的细节信息丢失，从而使得网络难以准确识别这些小物体。我们使用SPD-Conv代替步长卷积和池化层，应用SPD层后，降低空间分辨率，同时将这部分减少的空间信息转移到通道维度上，使通道数增加但没有信息丢失，其在高分辨率分散的细节信息被压缩和保留在更深的通道中；应用非步长卷积层后，这个卷积层不减少特征图的空间尺寸，通过学习这些增加的通道中的信息来提取重要特征，即使是在较小的空间分辨率上，模型也能有效捕捉到小物体的细节信息。这种结合使用SPD层和非步长卷积层的方法，使得CNN能够更好地处理小物体和低分辨率图像中的挑战，提高了模型在这些复杂场景下的性能和鲁棒性。

2.4 MSDA注意力机制

MSDA（多尺度扩张注意力）模块是近年来在目标检测和计算机视觉领域中的一个创新性模块，通过自注意力机制在不同尺度上有效地捕捉特征图的稀疏性，极大地提高了模型的性能和效率。传统的自注意力机制常常在全局范围内进行特征聚合，这虽然能够提取长距离依赖关系，但也常常带来计算上的冗余和高成本，特别是在处理高分辨率图像时。MSDA模块通过引入多尺度扩张策略，避免了这些问题。

MSDA的核心思想是通过对输入特征图进行线性投影，分别生成查询（Query）、键（Key）和值（Value），这些生成的向量通过自注意力机制进行信息交互和特征聚合。与传统自注意力机制不同，MSDA将特征图的通道划分为多个独立的头部，每个头部通过不同的扩张率执行多尺度的扩张卷积（SWDA）。这种操作能够使每个头部关注到不同感受野范围内的特征，使得模型能够更加灵活地捕捉不同尺度下的细节信息。通过这种多尺度的特征聚合，MSDA能够有效提升模型对目标的识别和定位能力。

扩张卷积的引入为MSDA带来了更大的感受野，使得每个头部在不增加计算负担的情况下，能够接收到来自不同尺度和区域的特征信息。这种多尺度的特征整合，尤其适用于处理具有不同尺寸、形态和细节差异的目标，使得模型能够自适应地调整其关注区域，从而增强对小目标、远距离目标以及复杂背景下目标的检测能力。

在YOLOv9中，MSDA模块的加入显著提高了目标检测的精度和效率。YOLOv9采用MSDA模块后，在多个标准数据集上的表现大幅提升，尤其在处理具有复杂背景和多尺度目标的图像时，MSDA能够有效降低漏检率和虚警率，提高模型对小目标和稀疏目标的检测能力。这种多尺度自注意力的策略，不仅增强了模型的语义理解能力，同时通过减少冗余计算，确保了更高的计算效率。

2.5 YOLOv9模型的改进

在本研究中，将数据集划分为训练集和测试集，作为后续处理的基础。然后，我们对基模型YOLOv9进行改进，以提升血细胞检测的性能。我们用SPD-Conv层替换了YOLOv9主干中的部分标准卷积层，并引入了MLCA和MSDA注意力机制，以增强特征提取能力。在模型训练阶段，我们对YOLOv9模型的关键参数（如学习率、批量大小和优化器）进行优化，以实现最佳性能。训练完成后，我们使用平均精度（AP）、mAP以及精度-召回曲线等指标评估模型性能，并基于参数数量分析框架的效率。最后，我们展示了所提出方法的视觉检测结果，以直观呈现改进模型的检测能力和实际效果。

2.6高效数据分析

高效数据分析是本系统的重要组成部分，结合高精度影像采集设备，大大地提高了检测精度、效率和智能化水平。系统通过自动的数据采集显微图像，并使用图像预处理对图像进行优化，增强目标的清晰度。核心检测部分采用自主改进的YOLOv9算法，通过结合多尺度特征提取与优化后的检测头结构，提高微小目标的识别能力。结合特征提取与目标分类，系统能够实现对细胞、颗粒或其他微观结构的精细识别，满足医学图像高精度识别的需求。

2.7模型部署与远程推理

通过对机器学习高效的部署，系统将显微图像处理和数据分析能力集成，来实现远程推理和实时反馈。模型线在本地的工业计算机上进行训练，采用深度学习框架(PyTorch）进行优化，增强了它对显微镜采集的高清图像数据的处理能力。模型训练完成后，我们将模型部署到工控机上，利用智能工控引擎强大的计算能力进行实时数据分析和图像处理，保障系统在实际应用中的稳定运行。

2.8总结

基于高精度的影像采集设备、工控机和自主改进的YOLOv9算法的目标检测系统，广泛应用于多个领域，尤其在医学检测、生命科学研究以及工业检测等方面展现出重要价值。

在医学领域，血细胞检测是基础医疗诊断中的关键环节，尤其在血液学、病理学和临床实验室中应用非常广泛。本系统能够高效、准确地识别和分类不同类型的血细胞，并通过图像处理和机器学习算法实现自动化血细胞计数、分类和异常检测，对于诊断疾病诊断、贫血、白血病感染等具有重要意义。在生物医学研究中，本系统可用于血液成分的深入分析。通过对血细胞形态和细胞群体的高精度检测，研究人员可以更好地理解血液疾病的发生机制。同时，使用高精度的影像采集设备进行实时监测和图像处理可以帮助科研人员在实验过程中快速得到数据反馈，提高实验效率，加速新药研发和治疗方法的发现。在制药行业，本系统用于药物开发的早期筛查。通过显微镜检测技术可以精确评估药物对血细胞的影响，包括是否引起血细胞的异常变化或损伤，从而为药物的临床试验提供可靠的支持。在半导体制造、材料科学等行业中，本系统被用来检测材料中的微小瑕疵或血液样本中的污染物，这在确保产品质量和安全方面起到了至关重要的作用。

基于高精度的影像采集设备的显微镜检测血细胞技术不仅在医学、半导体制造、材料科学、制药等多个领域中得到了广泛应用，还在提升检测精度、效率和自动化水平方面展现出巨大的潜力。它的广泛应用将推动血细胞检测技术向更高精度、更智能化的方向发展，持续为医学诊断、科研探索和工业质控等领域提供强大的技术支持。

技术路线、拟解决的问题及预期成果:

1.整体架构

本系统将智能工控引擎与显微镜和高精度的影像采集设备结合，对血细胞形态特征进行特征性分析，来完成对血细胞的目标检测任务。在本地运行的自主改进的YOLOv9算法可以实时处理采集到的图像，实现对不同类型的血细胞的目标检测。通过对检测结果进一步分析血细胞特征，如大小、形状、状态、颜色等，加强了对血液样本中生理病理变化的理解。在YOLOv9的改进中加入了MLCA注意力机制和MSDA注意力机制，提高了对小尺寸及重叠的血细胞的检测精度。还引入了新的SPD-Conv块，取代了传统的卷积和池化层，增强了特征提取能力，提高了总体精度。还引入了新的SPD-Conv块，取代了传统的卷积和池化层，增强了特征提取能力，提高了总体精度。还可以根据桌面端和APP端来使用本系统，便于用户使用高精度的影像采集设备来观察血细胞。

summernote-img

图2 SML-YOLOv9目标检测系统的工作原理

2.核心算法

本系统基于YOLOv9来构建核心目标检测框架。YOLOv9网络模型主要由主干网络BackBone、颈层Neck和解码预测端Head，BackBone的RepNCSPELAN4是YOLOv9主干网络的核心结构，同时还引入了CSP模块与ELAN模块用于特征提取。其中ELAN模块是YOLOv9新引入的特征，通过进一步优化网络的层次结构和特征聚合方式，提升了特征提取的效率和效果。此外，YOLOv9的主干网络还使用残差块来构建更深的网络，避免梯度消失问题。颈层是Neck网络的颈层采用特征图金字塔网络（Feature Pyramid Networks，FPN）进一步对高维度特征进行卷积池化，通过上采样并与浅层特征进行融合以保证网络对不同尺度目标的检测精度。YOLOv9的Head部分主要由预测层、分类和回归分支等部分组成。其中，预测层包括一系列的卷积层和激活函数，以生成最终的预测结果。每个预测层会输出预测框、置信度和类别概率。YOLOv9在保证检测性能的同时，也有着出色的推理速度和部署的灵活性，为血细胞识别任务提供了良好的基础。

summernote-img

图3 算法的整体技术路线图

（1）数据处理方面

项目采用GitHub开源平台上公开的BCCD血细胞图像数据集，数据集包含红细胞、白细胞和血细胞的图像及标签。数据集遵循MIT开源协议，内容符合ISO 15189医学检验标准要求，有效规避了数据隐私和合规性风险。我们制定了遴选标准，删除模糊、曝光不均、图像严重噪声等低质量样本，来保证图像清晰度；仅保留了拥有准确标签的样本，使标签更完整；去除重复图像、连拍图等样本，减少过拟合风险。为了提升模型的鲁棒性和对不同条件下的适应能力，我们引入了多种图像增强策略，包括色彩扰动（调整色调、饱和度、亮度）和随机旋转（±15°）等数据增强方法。我们在图像方面进行了尺寸统一、标准化处理。将标注格式转换为模型可识别的格式（YOLO格式：[class_id, x_center, y_center, width height]）。为了确保模型训练、验证和测试的科学性与公平性，我们将数据集按照8:1:1的比例划分为训练集、验证集和测试集，并确保三类细胞在各子集中分布均衡，避免分布不平衡对模型性能评估造成的影响。

summernote-img

（a）（b）

图4 (a)目标在图像上的分布图,(b)各种目标数量的分布图

（2）YOLOv9算法改进

YOLOv9是近年来提出的高性能的目标检测算法，具有结构轻量、检测速度快、精度高等优点，尤其适用于实时检测场景和密集小目标识别任务。我们自主改进的SML-YOLO模型在血细胞检测任务中取得了突破性性能：准确率84.7%、召回率86.9%、mAP@0.5达到91.4%。该模型采用1038层深度网络架构，参数量为32.68M，计算复杂度为35.2 GFLOPs。在保证实时推理速度（＞45 FPS）的前提下，整体性能有所提升。梯度参数比接近1:1（32,675,100 vs 32,675,132），显示出网络优化方面的优良特性。血细胞显微图像有着目标尺寸小、密集度高、轮廓模糊等特点，我们在YOLOv9的基础上，进行了以下改进。我们引入了MLCA（多级通道注意力）机制，MLCA作为一种新型的注意力机制，通过在多个层次上捕捉不同通道之间的依赖关系，显著增强了模型对血细胞图像特征的表达能力。我们还加入了MSDA注意力机制，MSDA同时利用YOLOv9特征金字塔如FPN中的多级高分辨率浅层特征与深层语义特征，通过跨尺度注意力权重分配，增强模型对不同尺寸目标的检测能力。显著提升小目标检测精度，同时保持对大目标的敏感性，解决YOLO系列在复杂多尺度场景中的漏检问题。MSDA在关键区域计算注意力权重，避免全局计算的高开销，保持YOLO系列的高推理速度。由于传统的卷积层Conv在处理低分辨率图像和小物体时性能低下，这一问题根源于使用步长卷积和池化层导致的细粒度信息丢失。相比之下，SPD-Conv（稀疏卷积）能更有效地提取相关特征。在血细胞检测的背景下，SPD-Conv成为一种可行的替代传统卷积和池化层的方法，同时保持相似的参数计数。YOLOv9通过加入MLCA、MSDA和SPD-Conv等模块，成功提升了血细胞检测任务中的精度和效率，为医学影像处理领域的应用提供了强大的支持，并展示了其在未来更多实际场景中的巨大潜力。

（3）MSDA注意力机制

MSDA（Multi-Scale Deformable Attention）是一种结合多尺度特征与可变形机制的注意力模块，有提升目标检测模型对复杂场景的适应性的效果。MSDA注意力机制具有多尺度融合的特性，MSDA同时利用YOLOv9特征金字塔如FPN中的多级高分辨率浅层特征与深层语义特征，通过跨尺度注意力权重分配，增强模型对不同尺寸目标的检测能力，显著提升小目标检测精度，保持对大目标的敏感性，解决YOLO系列在复杂多尺度场景中的漏检问题。同时MSDA具有可变形注意力机制的独特性质，MSDA通过引入可学习偏移量，允许注意力模块根据输入内容动态调整关注区域的位置，摆脱固定网格采样的限制。通过少量稀疏采样点覆盖目标关键区域，MSDA注意力机制有效应对遮挡、形变及非刚性物体如人体姿态，提升模型鲁棒性。MSDA让计算效率得以优化，MSDA的稀疏注意力设计仅在关键区域计算注意力权重，避免全局计算的高开销，保持YOLO系列的高推理速度。MSDA注意力机制结合YOLOv9的轻量化网络设计，减少重复计算，确保实时性。MSDA注意力机制不仅通过优化计算量，推理速度下降控制在10%以内，维持YOLO的实时性优势还能在遮挡、光照变化等复杂场景下，检测稳定性明显优于传统注意力。

MSDA注意力机制的计算:

summernote-img

在公式（1）中 summernote-img ,, 分别为第1个注意力头的查询（Query）、键（Key）、值（Value）矩阵，为动态窗口半径参数, ,.....为n个注意力头的输出，X为最终特征。

（4）SPD-Conv卷积层

在要求异常精度和对结构细微差别敏感的任务中，标准CNN的性能可能会下降，但SPD-Conv能更有效地提取相关特征。在血细胞检测的背景下，SPD-Conv成为一种可行的替代传统卷积和池化层的方法，同时保持相似的参数计数。其主要目的是提高低分辨率血细胞图像和微小血小板物体的检测精度。使用SPD-Conv代替步长卷积和池化层后，假设将空间分辨率降低（16x16），同时将这部分减少的空间信息转移到通道维度上，从而通道数增加但没有信息丢失。经过SPD层处理后，特征图的尺寸变为（16x16），但通道数增加，假设从原来的64通道增加到256通道。在这个增加通道数的特征图上应用非步长卷积层，这个卷积层不减少特征图的空间尺寸，而是通过学习这些增加的通道中的信息来提取重要特征。这样，即使是在较小的空间分辨率上，模型也能有效捕捉到小物体的细节信息。这种结合使用SPD层和非步长卷积层的方法，使得CNN能够更好地处理小物体和低分辨率图像中的挑战，提高了模型在这些复杂场景下的性能和鲁棒性。

SPD-Conv的计算公式如下：

summernote-img

在公式(2)中，I为输入信号/图像，K为卷积核/滤波器，为卷积操作，O为卷积后的输出, summernote-img 为输入信号I的傅里叶变换，为卷积核K的傅里叶变换，为逐元素乘法，为频域中相乘后的结果。

（5）MLCA注意力机制

MLCA（Multi-Level Channel Attention，多级通道注意力）是一种用于提升卷积神经网络（CNN）性能的注意力机制，主要通过在多个层次上捕捉不同通道间的依赖关系，来增强网络对重要特征的关注。MLCA注意力机制不仅具有多级特征融合的特点，在多个网络层如浅层、中层、深层提取不同粒度的特征，通过跨层连接或特征金字塔结构进行融合，更具有动态上文聚合的特征。MLCA通过多级特征融合与动态上下文聚合，在复杂场景中显著提升模型性能，尤其适用于需要兼顾细节与语义的任务如医学图像分析、自动驾驶感知。其设计核心是平衡局部与全局、效率与精度，是当前注意力机制演进的重要方向之一。

MLCA注意力机制的计算公式如下：

summernote-img

在公式(3)中，X为输入特征图，H和W分别为特征图的高度和宽度，c为通道索引， summernote-img 为特征图在位置(h,ω)处、第c个通道的像素值。对整个特征图在空间维度（H×W）上求平均，得到每个通道的全局平均值, 为最终的融合特征图，n为输入特征图的数量，为通道注意力权重，为第i个输入特征图，为逐元素乘法。

（6）RepNCSPELAN4模块

RepNCSPELAN4（Reparameterized Non-Causal Spatial Pyramid Learning Attention Network）是一种专为小目标检测任务设计的高效结构，通过精细的特征融合和对齐策略显著提升了目标检测的性能。首先，该模型通过多尺度特征提取，结合空洞卷积和空间金字塔池化（SPP）策略，在不同尺度上捕获细粒度的细节特征与深层的语义信息。这种多尺度特征提取能够提供丰富的空间上下文，有效支持小目标的检测。

在特征融合方面，RepNCSPELAN4引入了非因果空间金字塔学习（NCSPL）模块，该模块结合了空间注意力机制，能够在不同尺度上对特征进行增强。通过这种方式，模型能够强化细粒度特征，同时抑制背景噪声，使得对小目标的识别更加准确。检测头模块则通过改进的卷积结构整合不同层次的特征，并解耦边界框回归与目标分类的任务。回归支路专注于边界框回归，而分类支路则专注于目标类别预测。为了进一步优化小目标的检测，RepNCSPELAN4采用了焦点损失（Focal Loss）来处理类不平衡问题，确保模型更加关注少数的正样本。

为了进一步提升目标定位精度，RepNCSPELAN4将分类得分和IoU（Intersection over Union）得分的加权组合作为衡量锚点对齐程度的标准，确保在回归和分类过程中进行有效的对齐优化。这种复合损失函数能够动态调整网络的关注点，优先聚焦于高质量锚点，从而改善检测结果。在NMS（Non-Maximum Suppression）排序过程中，模型通过结合分类得分和IoU得分，确保低质量的负样本不会被误选为正样本，从而提高了小目标的检测精度。

RepNCSPELAN4通过动态样本分配和专为分类与定位对齐设计的损失函数，优化了训练过程。为每个锚点分配正负样本标签，模型能够专注于高质量的锚点，提高了检测准确性和鲁棒性。RepNCSPELAN4通过这些精细的设计，显著增强了模型在复杂场景下对小目标的识别能力。

（7）激活函数

引入非线性激活函数后，神经网络能够通过引入曲线变化来增强模型的表达能力，而不仅仅依赖于线性变换。激活函数通过引入非线性变换，使神经网络能够在复杂的输入空间中学习到更多样的特征，进而提高了模型的拟合能力。随着网络深度的增加，激活函数也可能带来一些训练问题。例如，sigmoid激活函数可能导致梯度消失，而ReLU激活函数则在某些情况下可能出现梯度爆炸问题。

为了缓解这些问题，现代神经网络通常采用改进版的激活函数，如Leaky ReLU、ELU（指数线性单元）或Swish等，这些激活函数可以在一定程度上缓解梯度消失问题，帮助模型更快地收敛和使训练过程更加稳定。例如，Leaky ReLU通过允许负输入值有一个很小的斜率，从而避免了ReLU在负区域“死亡”的问题。ELU则通过引入指数函数，使负区域的输出更加平滑，避免了梯度消失问题，还在一定程度上提高了模型的表示能力。

Swish激活函数是一种更为复杂的非线性激活函数，通过将输入与其Sigmoid激活函数的输出相乘，进一步增强了模型的非线性能力。Swish能够在正输入区域提供较强的非线性表达能力，也能在负输入区域保持较小的梯度，减少了梯度消失的风险。这些特点让它在深层网络中的表现通常优于ReLU和其他激活函数。

随着模型的深度增加，合适的激活函数有助于提高训练的稳定性，还能增强模型的表达能力，使其能够更好地拟合复杂的目标函数。

（8）图像输出

在模型推理阶段，SML-YOLOv9将显微镜采集的血细胞图像传入工控机后输出检测结果，包括每个目标的边界框坐标、类别标签及其对应的置信度分数。为了直观展示检测效果，我们对模型预测结果进行了图像可视化处理。具体流程如下：读取待检测图像，并将其输入已训练好的SML-YOLOv9模型进行推理，获取检测框集合。我们使用pyplot.imshow用于展示图像和标注，numpy库进行数据统计与数组管理，Scikit-Learn和sklearn.metrics.confusion_matrix进行指标的运算，Matplotlib和Seaborn等Python可视化库绘制评估图并将可视化后的图像保存至指定目录，作为检测效果的直观展示。该过程提升了检测结果的可解释性，也为后续的医生验证和系统集成提供了可靠的支持。保存的可视化结果是系统集成过程中调试和验证的重要依据。开发人员可以通过这些图像快速定位问题（如特定场景下的检测失败），并作为系统输出报告的一部分提交给最终的医疗人员。保存的可视化结果可作为模型在特定样本上表现的永久记录，用于大型生物科技研究的模型。

混淆矩阵是一种用于评估分类模型性能的重要工具，它以真实标签与模型预测结果之间的关系构建一个矩阵，清晰展现模型在不同类别上的分类准确度与混淆情况。混淆矩阵的对角线元素代表分类正确的数量，对角线数值越大越好。如图5所示，该模型有良好的分类能力，识别效果均衡。

summernote-img

图5 混淆矩阵

F1-Confidence是F1分数和置信度阈值之间的曲线关系图，通常用于评估目标检测模型在不同置信度阈值下的性能。曲线最高点对应的置信度阈值，就是该模型在任务下的最优点。如图6所示，模型在0.445的置信度阈值下达到0.86的F1分数，表明在该阈值下精确率与召回率达到了最佳平衡。

summernote-img

图6 F1-Confidence曲线

Precision-Confidence是精确率和置信度阈值之间的曲线关系图，用于展示模型在不同置信度阈值下的精确率。如图7所示，在0.839置信度阈值下，所有类别的预测精度为1.00。它表明模型在物体识别任务中表现良好。

summernote-img

图7 精度-置信度曲线

Recall-Confidence显示了不同置信度阈值下的预测召回率，是用于衡量模型召回率的指标。如图8所示，关于三种小物体检测该精度的置信度阈值为0.98，表明该模型有着较强了漏检能力，对医学图像任务有着重大意义。

summernote-img

图8 召回率-置信度曲线

Pcision-Recall展示了模型在不同置信度阈值下，精确率和召回率的变化关系。如图9所示，在IOU阈值为0.5时，检测出所有的类别的平均精度为0.914，它表明模型在物体检测任务中表现良好。

summernote-img

图9 mAP精度曲线

3.拟解决的问题

（1）桌面端和APP端界面响应速度不够流畅、部分功能模块布局不够合理，需进一步优化界面设计和数据通信逻辑，增强系统在不3.同终端之间的实用性。

（2）使用的摄像头分辨率较低，图像捕捉能力有限，需要引入更高清的影响设备，来获取更高质量的图像，提升模型检测的准确率。

（3）模型精度仍需优化，在保证检测速度和减少参数量的同时，将模型的检测精度进一步提升。

4.预期成果

参加相关的省级及以上比赛，并期望发表理论研究相关论文或申请软件著作权。

项目研究进度安排:

第一阶段(2025.4-2025.10)

项目首先通过需求分析明确核心目标，收集并整合技术文献，形成可行性方案，在此基础上，挑选高精度的影像采集设备，将智能工控引擎与高精度的影像采集设备结合成视觉系统，最终实现系统基本功能。通过设备采集图像，结合外部处理单元运行计算机视觉算法，完成对物体的检验和识别，然后呈现于智能工控引擎屏幕。

第二阶段(2025.10-2026.4)

通过将高精度的影像采集设备与光学显微镜集成，我们实现了对微米级生物血细胞的观测。针对血细胞大小只有几微米这一难点，传统图像处理算法识别精度不足的问题，采用以YOLOv9算法为主要模块，再次基础上添加了SPD-Conv卷积层，MLCA注意力机制MSDA注意力机制，使仪器在较为复杂背景下仍能稳定识别目标。

第三阶段(2026.4-2026.10)

我们对硬件进行优化和软件改进，增加了更多的功能，而且增大了检测范围，辨识度不受影响。建立了桌面端，为更方便的清晰地观察血细胞的形态与大小。我们让更多同学参与实操观察，采纳同学们的使用建议进行优化。我们将持续优化并进行改进，保持技术的前瞻性。

第四阶段(2026.10-2027.4)

我们寻找相关企业或医院并将进行合作，将该产品应用于相关领域，为其做出贡献，利用相关企业进行宣传，进一步推广高精度的影像采集设备的应用领域，使该产品不仅在医疗范围内发挥作用，也在其他领域发挥作用，实现技术的创新和应用的开发，为社会发展贡献绵薄之力。

已有基础:

与本项目有关的研究积累和已取得的成绩:

1.硬件端基础

1.1研究方法

首先，对现有的智能工控引擎与显微镜和高精度的影像采集设备结合形成的视觉系统的应用、YOLO目标检测算法以及其他相关算法进行文献调研，了解现有技术的优缺点和最新发展趋势。深入分析YOLO算法的原理、特点及其在目标检测领域的应用，明确改进的方向和目标，比如提高精度图像、提升对血细胞微小形态的检测能力或优化血细胞图像的清晰度。通过以上方法可以通过改进多尺度特征融合与感受野控制，增强对血细胞边缘形态、亚像素级结构的解析能力。以硬件基础为底座、改进后的YOLOv9为核心形成一套针对显微血细胞分析的闭环优化体系，兼具技术先进性与落地可行性。

根据文献调研和算法分析的结果，结合实际应用需求，对YOLO算法进行改进。可能的改进方向包括网络结构优化、损失函数调整、数据增强等。使用公开数据集或自行采集的数据集对改进后的算法进行验证，评估改进算法的性能，包括准确率、召回率、F1得分等指标。将改进后的YOLO算法进行部署到智能工控引擎内，是现在智能工控引擎上进行目标检测血细胞，调整后，将智能工控引擎与高精度的影像采集设备联通，最终在嵌入式边缘端完成精准、鲁棒的外部场景目标检测任务。

1.2智能检测系统

智能检测系统是由智能工控引擎与显微镜和高精度的影像采集设备结合形成的系统。通过将搭载SML-YOLOv9目标检测算法的工业级智能工控引擎与高精度的影像采集设备深度集成，再将高精度的影像采集与显微镜结合，构建多模态联动的智能显微分析系统，实现显微视野下血细胞图像的实时捕获、自适应光照补偿与多尺度特征增强，并依托YOLOv9的轻量化网络架构与通道重标定机制，在嵌入式边缘端完成亚像素级细胞形态解析、大小特征目标检测任务，最终输出可视化量化分析结果。

summernote-img

图10 智能检测系统

该系统内含SML-YOLOv9算法，增强了对血细胞目标检测的精度，采用标签分配策略，针对红细胞（7-8μm）、白细胞（10-12μm）等不同尺度目标优化正负样本比例。智能工控引擎通过高精度的影像采集设备直连高帧率显微相机，实现分辨率图像的无损传输。

1.3智能工控引擎

硬件部分主要有工业级主板、高性能CPU、加固机箱、光展接口、工业电源组成。工业级主板采用耐高温、抗振动的元件，支持宽温运行。高性能CPU多核处理器，满足实时计算需求。加固机箱为全金属外壳，具有IP防护等级，防尘、防水、抗电磁干扰的功能。扩展接口支持工业设备直连。工业电源宽电压输入，实现抗浪涌和短路的保护。

summernote-img

图11 智能工控引擎

1.4 SML-YOLOv9目标检测算法

SML-YOLOv9是一种经过深度优化的实时目标检测算法，特别适用于血细胞检测任务，结合了MLCA、MSDA注意力机制和SPD-Conv技术，有效提升了检测精度和鲁棒性。

MLCA通过多层次通道权重调整，增强了对血细胞形态、大小和颜色的敏感度，去除冗余信息，提升检测精度。MSDA自适应学习多尺度特征，优化了血细胞在复杂背景和重叠情况下的检测，确保高准确性。SPD-Conv融合空间和时间特征，提高了模型在动态环境中的鲁棒性，尤其在低光照、运动模糊等条件下，能够稳定运行。综合而言，SML-YOLOv9将三种创新技术结合，不仅在血细胞检测中实现高精度和高鲁棒性，还保持了实时处理能力，能够快速响应医疗检测和科研应用需求，确保高效且可靠的性能。为医疗事业发展提供了有效方案。

summernote-img

图12高精度影像采集设备检测血细胞效果图

1.5智能实时监控解决方案的背景技术

智能实时检测解决方案通过结合智能工控引擎、显微镜、高精度影像采集设备以及自主改进的SML-YOLOv9算法，实现了对血细胞独特特征和大小的精准检测。该系统的工作流程包括数据采集、目标检测、数据传输和实时观察。首先，智能工控引擎与显微镜及影像采集设备协同工作，形成强大的视觉系统。显微镜下的血细胞图像通过高精度影像采集设备传输至智能工控引擎，确保图像质量和细节的精确捕捉。接着，经过图像传输后的数据在本地智能工控引擎上进行高效计算和处理，利用自主改进的SML-YOLOv9算法，对采集的图像进行实时分析，快速识别血细胞的形态、大小及其他关键特征。该算法结合了多种先进技术，如多层次通道注意力（MLCA）和多尺度域注意力（MSDA），有效提升了血细胞检测的精度和鲁棒性。这一智能实时检测解决方案的优势在于其高效性、实时性和灵活性，能够迅速响应并处理海量数据，确保及时且准确的血细胞检测结果。其灵活的架构和强大的数据处理能力，使得它在不同的医疗和科研环境中都能提供可靠的支持，为血液检测和医学研究带来更多创新的可能性。

1.6移动端

（1）注册登录

summernote-img

（a）（b）

图13 注册登录界面

①图13中的a图为注册界面图，用户在此完成账号注册后，可直接跳转至首页，实现无缝衔接，提升使用体验。

②图13中的b图为登录界面图，用户可以输入手机号或电子邮箱和密码进行登录，若没有账号可以点击"注册新账号"跳转到注册界面。

（2）学习资料

为了方便用户进行各类研究，我们精心收集并整理了一系列高质量的专业资料，涵盖血细胞分析、显微成像技术等多个领域。学习资料界面（图14）支持高效浏览与精准点赞，让用户快速获取优质知识资源。浏览功能优化了界面交互，帮助用户一键直达精选内容，提升学习流畅度；点赞功能不仅能表达喜好，还可推动优质资料更靠前展示，使高价值内容触手可及。此外，界面支持a图（红细胞资料）与b图（显微镜资料）的分类管理，确保学习内容清晰有序，助力系统化学习与深入研究，帮助了医疗人员精准地完成了血细胞观察，提高了治疗效率。

summernote-img

（a）（b）

图14 学习界面

已具备的条件，尚缺少的条件及解决方法:

1.已具备的条件，尚缺少的条件及解决方法

1.1已具备的条件

（1）指导顾问

①胡冰，主任医师，现任日照市人民医院超声二科（心脏、血管）科室主任，毕业于泰山医学院，曾赴北京安贞医院研修。从事临床心脏、血管、妇产科、腹部、浅表等器官的超声诊断、教学、科研工作20余年。兼任山东省医学会超声医学分会心脏学组委员、山东省医师协会超声医师分会委员、中国民族卫生协会超声医学分会委员、山东省医院协会超声医学中心分会委员、山东省医学伦理学会超声伦理委员会理事等。以"精准治疗+人文关怀"理念深受患者信赖.专攻于成人心脏及大血管疾病的超声诊断：包括瓣膜病、冠心病、复杂先天性心脏病、心肌病等。主要研究方向为二维及三维经食管超声心动图。在心脏外科手术和微创介入手术术前精准诊断、术中引导监测及术后即刻效果评价中有较高的造诣。尤其擅长经食管超声心动图下诊断卵圆孔未闭。对颈部血管、下肢血管及腹部血管等复杂疾病的超声诊断有较高水平。

②朱笑笑，主治医师，专注呼吸危重症、肺癌、慢性呼吸系统疾病及中医领域。毕业于山东中医药大学基础医学院中医七年制，师从陈宪海教授。临床擅长中医辨证治疗各类疑难杂症。参编《临床呼吸诊疗指南》。山东省老年医学学会第一届肺部疾病与结核专业委员会委员、日照市预防医学会第一届呼吸专委会委员、日照市中西医结合学会委员。以"小方治大病"理念深受患者信赖。

（2）硬件端

通过以上研究内容规划，可以系统地开展基于视觉系统的搭建和使用自主改进的SML-YOLOv9目标检测系统，实时检测血细胞的研究，为客户提供智能实时检测解决机制。智能实时检测解决机制基于智能工控引擎、显微镜、高精度的影像采集设备和自主改进的YOLOv9目标检测系统，能够实时检测血细胞状态以及特点，该方案为血细胞检测提供了一个高效、智能的手段。

（3）智能检测系统

该视觉系统由智能工控引擎、高精度显微镜及影像采集设备构成，智能工控引擎作为核心控制器，与影像采集设备相连接，驱动显微镜进行微米级血细胞成像，智能工控引擎上的SML-YOLOv9算法将显微镜中的血细胞进行目标检测，不仅展现了血细胞图像的高清晰度，高精度，更区分了血细胞中不同类型的形态特征。系统结合AI算法实现细胞形态、数量及异常特征的自动化精准检测，兼具工业级稳定性和医学检测灵敏度，可适应实验室复杂环境下的长时间连续作业。

（4）改进的SML-YOLOv9目标检测算法

传统的YOLOv9算法在目标检测领域已展现卓越性能，但本研究团队在此基础上进行了深度优化与改进，显著提升了检测精度、速度及适应性，使其更适用于血细胞检测。通过引入MLCA（多尺度通道注意力）和MSDA（多尺度数据增强）等关键机制，我们将模型改进为SML-YOLOv9，大幅增强了模型对不同血细胞特征的识别能力。改进后的模型能够实现对红细胞、白细胞、血小板等目标的高精度、低延迟检测，并在高倍率显微环境下保持稳定可靠的性能。这一改进为智能医学影像分析的未来发展奠定了坚实基础。

1.2尚缺少的条件

（1）APP端还需要进一步的美化与功能的完善，如赋予血细胞场景、跨平台式交流功能等还未完全实现。

（2）血细胞样本较少，不能全面检测血细胞的不同功能与状态，不能完全符合医疗技术的要求。

1.3解决方法

（1）小组部分成员继续学习Uni-app的相关知识，完善移动端的功能和界面的美化。

（2）血细胞检测项目组的负责人及其成员应多与老师讨论，筹集资金，购买大量的血细胞样本。

经费预算

开支科目	预算经费（元）	主要用途	阶段下达经费计划（元）
开支科目	预算经费（元）	主要用途	前半阶段	后半阶段
预算经费总额	20000.00	平台研究开发	10000.00	10000.00
1. 业务费	11000.00	业务综合	5000.00	6000.00
（1）计算、分析、测试费	2000.00	系统配置	1000.00	1000.00
（2）能源动力费	3000.00	硬件支持	1000.00	2000.00
（3）会议、差旅费	2000.00	参加校外比赛与会议	1000.00	1000.00
（4）文献检索费	2000.00	文献检索	1000.00	1000.00
（5）论文出版费	2000.00	著作权与论文等相关费用	1000.00	1000.00
2. 仪器设备购置费	0.00	仪器购买	0.00	0.00
3. 实验装置试制费	6000.00	实验装置	3000.00	3000.00
4. 材料费	3000.00	材料购买	2000.00	1000.00

结束

大学生创新创业训练计划管理系统

创新创业管理系统

详情

基于机器视觉血细胞检测的理论研究与系统开发

基本情况

项目成员

指导教师

立项依据

经费预算