详情

基于transformer_Yu的《温病条辨》英文精准翻译模型构建与应用研究

申报人:张慧斌 申报日期:2025-03-29

基本情况

2025创新项目
基于transformer_Yu的《温病条辨》英文精准翻译模型构建与应用研究 学生申报
创新训练项目
文学
外国语言文学类
学生自主选题
二年期
近年来,随着世界卫生组织(WHO)对中医药的认可以及“一带一路”倡议的推进,越来越多的国家开始接受中医理论与实践。然而,中医典籍的翻译问题一直是中医学术传播的一大瓶颈。以《温病条辨》为代表的中医经典文献,其文言文表达方式、复杂术语体系及独特的医学逻辑,使得传统翻译方法难以准确表达原意及其学术研究,本项目基于Traformer和YOLO结合优化模型Traformer_Yu,针对《温病条辨》构建精准的英译AI模型,提升中医古籍的翻译质量,致力于实现从“文本转换”到“文化转译”的跨越。本课题研究成果有利于弥补现有翻译工具对《温病条辨》适配不足的缺陷,建立《温病条辨》英文精准翻译语料库,为《温病条辨》翻译提供标准化数据支撑,助力中医药理论与国际医学体系接轨。
暂无
指导老师朱敏:主持省级科研课题2项,厅级1项,指导校级大创项目2项。
指导教师李红琳:主持省级科研课题1项,厅级1项,校级大创项目3项。

      指导教师在本项目中能够提供全方位的支持:在学术指导方面,指导教师对项目的研究方向进行了细致把控,推荐了相关文献,并在模型构建过程中提供了技术指导;在资源支持方面,指导教师提供了高性能计算设备和数据集获取的协助;项目前期推进过程中,指导教师定期组织讨论会,及时解决项目中的难题。此外,指导教师还鼓励学生参加学术会议,协助论文撰写与发表,并推动项目成果的实际应用与推广。

省级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
张慧斌 外国语学院 英语(本科) 2023 负责项目的整体规划和进度安排,协调团队成员之间的工作,负责翻译语料库的构建;管理项目所需的资源,做好与指导老师的沟通工作。
江丹棋 管理学院 公共事业管理(医院财务方向) 2023 收集温病条辨已有资料,辅助构建翻译语料库。使用验证集对模型进行评估,将训练好的模型应用于实际翻译任务,开发一个温病条辨英文翻译系统,提供用户友好界面。对开发的翻译系统进行测试,参与项目材料撰写等。
刘飞宇 医学信息工程学院 计算机科学与技术(智能AI方向) 2023 对收集到的数据进行清洗标注,将数据划分为训练集、验证集和测试集,为模型训练提供合理的信息。负责计算软件方面的模型构建,基于 Transformer 架构设计翻译模型,使用训练集对模型训练,调整优化模型

指导教师

序号 教师姓名 所属学院 是否企业导师 教师类型
朱敏 外国语学院
李红琳 外国语学院

立项依据

       研究目的
      1.整合《温病条辨》多个版本的原文、注释及权威译本,建立结构化双语平行语料库,为精准翻译提供标准化数据支撑。确保译文的准确性和一致性,还能为未来中医典籍的翻译提供可复用的基础资源。
       2.基于 Transformer_Yu 结构优化,打造高精准度的中医古籍翻译模型,显著提升《温病条辨》英译的准确性和可读性。不仅关注字词转换,更强调文化转译,力求让译文既忠实于原意,又符合国际医学语境,实现从“文本翻译”到“文化传承”的跨越。
      3.结合大数据分析与人工智能优化,使译文风格更符合国际医学标准,确保全球医学界能够准确理解和学习中医理论。助力中医药文化的国际化传播,为 AI 在传统医学领域的应用提供创新范式,让人工智能真正赋能人类智慧遗产的全球共享。
      4.为中医经典纳入联合国“世界记忆遗产”提供标准化语言支持。同时为“一带一路”倡议下的中医药文化传播提供重要助力。
      研究背景
      中医作为中国传统医学的核心,承载着数千年的医学智慧,对全球健康事业具有重要价值。近年来,随着“一带一路”倡议的推进,中医药逐渐走向世界。截至2023年,中医药已传播至196个国家和地区,全球超过30亿人接受过中医治疗。然而,中医经典文献的翻译质量却成为中医国际传播的一大瓶颈。
      首先,现有中医翻译错误率较高问题。根据《中华中医药杂志》2022年的研究,市面上主流的中医翻译文本错误率在15%-30%之间,其中术语误译率高达40%。例如,“气”常被直译为“Qi”或“Energy”,但其本质涵盖生理、病理等多层含义,简单对应无法准确表达原意。此外,病症术语“郁证”在部分翻译中被错误等同于抑郁症(Depression),但其实中医“郁证”包含多种病因,而不仅限于精神疾病,这种翻译缺陷可能影响国际医学界对中医的正确理解。
      其次,翻译标准缺乏统一规范。目前,世界卫生组织(WHO)虽发布了《国际中医术语标准》,但覆盖范围有限,仍有大量术语未规范化。研究表明,目前全球使用的中医术语翻译版本超过300种,且缺少权威性指导,导致同一术语在不同文献中可能存在多种译法。因此,开发基于人工智能的精准翻译模型,以提升翻译质量、构建标准化中英对照语料库,已成为中医国际化传播的迫切需求。
      理论意义
      1.推动中医古籍翻译理论的发展:通过基于Transformer-Yu的深度学习模型,提供一种新的翻译方法,突破传统翻译中的语言局限性,特别是对于中医古籍这种复杂的文化遗产,能够更准确地表达其深厚的医学知识和文化内涵。
      2.深化人工智能在中医领域的应用研究:本项目结合了最新的人工智能技术(如Transformer和YOLO),为中医古籍翻译领域提供了全新的技术支持,推动了人工智能与传统文化领域的融合,拓展了AI技术应用的新方向。
      实践意义
      1.提升中医古籍翻译质量:通过构建精确的翻译模型,显著提升《温病条辨》等中医经典的翻译质量,推动中医药知识在国际医学界的传播与应用,助力中医药文化的全球化发展。
2.支持中医药国际传播和“一带一路”倡议:为中医药文化的国际化传播提供精准、高效的语言支持,推动中医药经典文献进入全球医学体系,促进“一带一路”倡议下的文化交流。
      1.理论基础与技术研究。首先,从语言学与技术两个维度入手,深入剖析中医古籍的语言特点,重点包括生僻词汇、古汉语句式结构、典籍用语的模糊性及文化内涵的多义性,全面识别其在机器翻译中的难点与挑战。同时,系统研究Transformer-Yu架构的基本原理与技术优势,特别是其在序列数据处理中的并行计算能力、长距离依赖建模能力等方面的表现,以及其在应对中医古籍特有语言结构上的局限性,为后续模型优化与创新设计提供坚实的理论支撑。
      2.数据收集与预处理。本研究将广泛收集中医古籍文本,重点整理《温病条辨》原文、注释、译本等不同版本,结合国家中医药术语标准库、历代注释资料以及权威中英文医学词汇表,构建多层次辅助语料体系。在此基础上,开展高质量数据清洗工作,识别并剔除噪声信息,修正错标与歧义标注,提升数据准确性与规范性。合理划分训练集、验证集和测试集,确保数据在训练与评估过程中的科学性与代表性。
      3.模型训练。借助构建的大规模中英双语中医古籍平行语料库,对Transformer-Yu翻译模型开展系统训练。通过调整学习率、优化器策略、正则化方法等参数,进行细致的模型调优与迭代优化,以增强模型对古汉语表达结构、医药术语语义及文化隐喻的精准捕捉能力。探索引入知识增强机制,如中医专有词汇嵌入、术语对齐机制等,进一步提升模型的专业性与鲁棒性。
      4.性能评估。采用自动化与人工结合的多维度评估体系,对训练后的模型进行系统性能测试。自动评价方面将采用BLEU、ROUGE、METEOR等主流指标,评估译文的准确度、覆盖度与一致性;人工评价方面将组织中医专家、语言学者进行质量打分与对照分析,考察译文在语义还原、术语规范性、文化内涵表达等方面的表现。通过评估结果指导模型结构与参数的进一步优化,不断迭代提升模型翻译质量与实用性。
      5.应用实践。为推动科研成果转化,本项目将开发“温病条辨英译助手”系统,构建网页版与小程序端口,支持文本输入、段落翻译和术语解释等功能。系统将集成“术语点击释义”“原文注释参考”“双语并排显示”等交互设计,提升用户使用体验。应用场景涵盖中医药院校教学、国际医学会议及中外医学交流。通过内置用户反馈与错误标注机制,建立模型优化闭环;采用轻量化部署技术,实现模型在移动端和离线环境下的高效运行。最终,通过用户增长率、使用频率与满意度等指标评估应用成效,确保科研成果高效落地。
     1.国外机器翻译研究进展
      近年来,机器翻译(MT)研究取得了显著进展,主要集中在神经机器翻译(NMT)、大规模预训练模型、多语言翻译、少资源翻译、可解释性和语音翻译等方向。自Transformer架构提出以来,NMT已成为主流,并通过自监督学习、优化训练方法等进一步提升翻译质量。Google、Meta等科技公司推出了诸如T5、mBART、SeamlessM4T等大规模多语言模型,这些模型在多语言翻译、零样本翻译等方面表现出色,并逐渐取代传统的双语翻译系统。同时,AI大模型(如GPT-4、PaLM)展现出强大的通用翻译能力,特别是在低资源语言上取得突破。研究者们还关注NMT的可解释性和鲁棒性,探索如何提高翻译系统的透明度,同时增强其对输入扰动的耐受性。交互式翻译和AI辅助翻译在专业领域(如医疗、法律、金融)得到广泛应用,并且社交媒体、会议软件等也开始集成实时翻译功能。
     2.国内古籍翻译研究进展
      近年来,人工智能领域已经取得了显著进步,机器翻译技术已经开始应用在了较多领域,比如:中国现当代文学作品英文翻译,以及中国古籍英文翻译,翻译结果越来越准确、专业。
      在基于实例的机器翻译(EBMT)方面,郭锐等(2008)设计了古今汉语自动句对齐及相似古文句子检索算法,基于人工对齐的所有20296对句对的实验结果,平均检索时间110ms,F值达到0.9911。王爽等(2009)构建英汉机器翻译系统,建立机器字典,使用 Visual Studio.NET2005 开发环境中 VB 语言进行软件的设计开发,对于选用的《论语》中50个句子进行翻译测试,结果表明:简单陈述句翻译效果的满意度可以达到 90%,简单疑问句和复杂句的满意度为82%左右,而反问句的处理效果不够理想。随着算法的升级,许乾坤等(2023)提出无监督词库构建的方法,在UniLM 模型的基础上,分别与BERT、RoBERTa、RoFormer 和 RoFormerV2 预训练模型相结合,利用预训练模型学习上下文相关的语言表示,增加语义之间的关联性,从而提升了古现机器翻译的性能。宋熹玥等(2024)通过构建句子级别的平行语料数据集,建立建注意力机制Seq2Seq模型(Seq2Seq+Attention)并使用Seq2Seq预训练模型(Pre-Training+Seq2Seq)对80万首古诗词进行训练,结果构建的Pre-Training+Seq2Seq模型F1值达到65.72%,为中医古籍智能机器翻译提供了新思路。
      综上所述,可以看出目前中医古籍机器翻译仍有很大研究空间,古籍涉及种类较少,识别精度待提高。本研究将借鉴上述国外机器翻译所运用的技术、使用的模型以及研究思路和方法,并结合国内古籍机器翻译的最新研究结果,从机器学习角度对《温病条辨》英文精准翻译模型进行设计研究。
      3.Transformer与YOLO的发展现状
       在如今的 NLP 领域,几乎每项任务中都能看见“基于 Transformer 的预训练语言模型(T-PTLM)”成功的身影。Transformer 的关键优势可以归结为以下几点:突破了RNN模型不能并行计算的限制;相比CNN,计算两个位置之间的关联所需的操作次数不随距离增长;自注意力可以产生更具可解释性的模型。可以从模型中检查注意力分布。各个注意头(attention head)可以学会执行不同的任务;在输出序列与输人序列“顺序”不同的情况下表现较好,如翻译、阅读理解;相比RNN可以编码更长的序列信息。
      近年来,基于深度学习的目标检测算法是计算机视觉研究热点。YOLO系列是单阶段目标识别领域中的一种对象检测算法,由Redmon等2015于年提出。其核心思想是将对象检测任务转化为一个回归问题,通过思想上对YOLO模型进行改进优化,提升目标检测过一个卷积神经网络直接在图像上进行推理,实现的速度和精度 。 YOLOv9(2024)可编程梯度信息(PGI),用于在深层神经网络中保持数据的完整性和稳健的梯度,防止数据退化;广义高效层聚合网络(GELAN),有效地整合了多尺度特征。但同时,可能需要更多的计算资源来实现最佳效果;在非常复杂或遮挡严重的场景中,检测精度会下降;需要大量高质量的标注数据来训练,以保证准确性。YOLO 作为目标检测模型,能够快速检测并框选图片中的文字区域,为 OCR 识别提供更精准的文本区域。YOLO在文本识别方面有极大优势,文本区域检测。YOLO 训练时可以使用带有文本标注的数据集,使其能够识别图片中的文字区域,并在图像中生成一个或多个边界框(bounding boxes),框选出可能包含文本的区域。这比直接使用 OCR 进行全图扫描更加高效和精准。同时提高 OCR 的输入质量。YOLO 只提取文字区域,并将其作为 OCR 的输入,使 OCR 只需处理这些区域,而不需要遍历整个图像。这样做的好处是:减少 OCR 计算量,提高识别速度。减少噪声,提高文字识别准确率(OCR 仅对文本区域进行处理,减少背景干扰)。适应多种文本布局(如海报、漫画、UI 界面),确保 OCR 处理正确的内容。YOLO还可以适应复杂的文本排列。YOLO 还能检测不同方向的文本,如:水平文本、垂直文本、弯曲文本、倾斜文本。这使得 OCR 处理更加灵活,不再局限于固定排版的文档或直排文本。
      参考文献
      [1]郭锐,宋继华,廖敏.基于自动句对齐的相似古文句子检索[J].中文信息学报,2008,(02):87-91+105.
      [2]王爽,熊德兰,王晓霞.古文翻译系统的设计与实现[J].电脑知识与技术,2009,5(04):855-856+867.
      [3]许乾坤,王东波,刘禹彤,等.基于UniLM模型的古文到现代文机器翻译词汇共享研究[J].情报资料工作,2024,45(01):89-100.
[4]宋熹玥,周净,刘伟.中医古籍智能机器翻译模型构建研究[J].中国中医药图书情报杂志,2024,48(06):130-135.
[5]洪季芳. Transformer研究现状综述 [J]. 信息系统工程, 2022, (02): 125-128.
      [6]杨子房,袁家政,徐成,等. 基于YOLO系列的目标检测研究进展综述[C]// 中国计算机用户协会网络应用分会. 中国计算机用户协会网络应用分会2024年第二十八届网络新技术与应用年会论文集. 北京联合大学北京市信息服务工程重点实验室;北京联合大学机器人学院脑与认知智能北京实验室;北京开放大学;, 2024: 263-267.
[7]徐彦威,李军,董元方,等. YOLO系列目标检测算法综述 [J]. 计算机科学与探索, 2024, 18 (09): 2221-2238.
 创新点:
      1.技术创新。首次采用transformer和YOLO进行中医古籍文本分析与翻译 ,可以弥补两者的缺点,可以发挥Transformer在语义理解和文本翻译上的优势,同时利用YOLO的高效计算能力优化处理流程。借助中医知识图谱,通过位置编码的针对性调整,使搭建的 Transformer - Yu 模型能够更好地理解中医概念之间的关联性,能够精准地捕捉中医古籍文本的语序信息和逻辑关系,提升了中医古籍翻译的准确性和专业性。
      2.视角创新。本项目以中医古籍翻译模型和中医古籍翻译特性为研究对象,从国内外两个视角入手,系统探究中医古籍翻译方法与《温病条辨》英文精确翻译的特点,研究既具有针对性,又具有国际化视野。
项目特色
      1.Transformer – Yu 模型的构建本项目独特之处在于创新性地结合 Transformer-Yu 和 YOLO 进行文本区域检测,精准高效地将中医古籍翻译为符合现代英语表达习惯的文本,既可以弥补transformer模型计算量较大、对局部特征提取能力不足等问题,也可以解决YOLO 全局信息建模不足、小目标检测困难等困扰,突破传统翻译模型在中医古籍翻译中的局限性,确保术语翻译的准确性,使模型能更好地理解古汉语结构,实现精准翻译。
      2.引入中医知识图谱,让模型能够识别术语间的关联:避免简单字面直译,如“气”不仅是“Qi”,还涉及生理、病理等多重含义。知识图谱的融入,使模型不仅关注字词转换,更能结合医学语境,提供符合国际医学表达的高质量译文,真正实现 从文本翻译到文化传承的跨越,
      3.项目引入多源数据融合技术:广泛收集中医古籍、医学文献等数据资源,并对数据进行深度预处理,确保模型训练数据的高质量和高可靠性。
      4.项目建立了全方位的性能评估体系:从自动评估指标到人工评估相结合,确保翻译结果在语义准确性、文化适应性和医学专业性方面达到高标准。
      5.项目还注重实际应用与优化反馈,建立用户反馈机制:持续优化翻译模型,既能精准解决中医古籍翻译的难点,也为专业领域机器翻译提供新的研究思路,推动科研成果向实际应用转化,为中医文化的国际传播提供有力支持。
      1.深入研究与理论基础构建:知识储备方面,深入剖析中医古籍语言特点,包括生僻字词、古汉语句式、独特文化内涵、语法结构与语义逻辑等基本内容。在技术层面,系统研究Transformer-Yu架构,剖析其在序列建模、上下文捕捉与跨语言迁移方面的优势,识别其在应对中医文本歧义、术语多义性等方面的局限,为模型优化提供理论支撑。
      2.数据收集与数据预处理:以《温病条辨》为核心,整合原文、注释、译本三类文本资源,构建标准化中英对照语料库。同步收录《伤寒论》《黄帝内经》等经典文献,结合中医术语库与世界卫生组织术语标准,构建多层级标注体系。对语料进行去噪、分词、术语标记、词性标注等处理,确保训练数据高质量与专业性。
      3.Transformer-Yu 结构优化:在原有Transformer架构基础上,融合BERT和T5模型提升语言理解深度;设计多头注意力机制增强对复杂文言句式的建模能力;引入YOLO模块用于术语区域检测,提升术语识别与语境匹配能力,实现“检测+翻译”协同机制,确保医学术语译法的准确性和一致性。
      4.模型训练与参数调优:在模型训练阶段,使用大规模中英双语中医古籍语料对 Transformer-Yu 进行深度训练,并采用双模型协同优化,使 Transformer 能更精准地解析中医术语、句法与语义。此外,引入 强化学习(RLHF),结合专家反馈持续优化模型,使翻译结果更符合专业需求和实际使用场景。
      5.模型性能评估与反馈:通过自动化评估指标(如 BLEU) 量化模型的翻译性能,并结合人工专家评审,建立综合评估矩阵,确保模型不仅在算法层面表现优异,同时也能生成符合中医逻辑和语境的高质量译文。
      6.翻译应用与反馈机制建立:开发“温病条辨英译助手”系统,支持PC端和移动端访问,集成原文翻译、术语释义和双语对照等核心功能,并提供语义对齐辅助工具。内置用户评分、术语纠错与建议提交通道,构建动态反馈机制,同时结合用户满意度等,确保模型在实际应用中的有效性和实用性反馈成果继续投入优化,不断改善。
     技术路线:
summernote-img
     拟解决的问题:
      术语翻译问题:中医术语具有独特的文化背景和专业含义,传统翻译方法常因缺乏专业语料而导致翻译不准确。本项目通过引入中医药术语标准库,提升术语翻译的精准度。
      语言风格问题:中医古籍语言风格古朴,句式复杂,传统翻译方法难以完整保留其语言特色和文化内涵。本项目通过优化Transformer-Yu架构,提升模型对古汉语句式的适应性,确保翻译的通顺性和文化内涵表达。
       翻译效率问题:传统人工翻译效率低,难以满足大量中医古籍翻译的需求。本项目通过构建高效的翻译模型和用户友好的系统,提升翻译效率,为中医古籍的国际传播提供有力支持。
     预期成果:
      1.构建一个基于 Transformer 的专业翻译模型:实现翻译准确度提升20%以上,BLEU评分从传统翻译模型的35%提升至55%以上,显著优化《温病条辨》的英文翻译质量。
      2.开发一款基于 Transformer-Yu 的在线中医古籍翻译工具:供不少于 500 名 中医专业学生、研究人员及翻译学者进行测试,并收集用户反馈,持续优化模型。
      3.总结项目经验,项目成果将以开源工具+学术论文的形式发布:推动基于 Transformer 的语言模型在中医古籍翻译领域的研究发展,为中医古籍国际传播提供标准化翻译方案。
   第一阶段:项目准备与理论研究
      1.项目启动与团队组建:组建团队,明确分工。
      2.文献调研与技术选型:调研Transformer、YOLO等模型,确定技术方案。
      3.中医古籍语言分析:剖析古籍语言特点,形成分析报告,为后续研发奠定基础。
   第二阶段:数据收集与预处理
      1.数据收集:收集中医古籍文本,获取双语对照语料。
      2.数据预处理:清洗数据,统一格式,划分数据集。
      3.数据标注与审核:邀请专家标注审核,建立标注规范。
   第三阶段:模型构建与优化
      1.模型架构设计:设计Transformer-Yu架构,融入中医知识图谱,编写设计文档。
      2.模型实现与初步训练:搭建训练环境,初步训练模型,调整超参数。
      3.模型优化与微调:大规模训练,采用迁移学习优化结构。
   第四阶段:模型评估与应用开发
      1.模型性能评估:使用独立测试集对模型进行全面性能评估,并结合专家人工评分,对译文的术语准确性、语义还原度与文化适应性进行评价。
      2.翻译应用开发:开发翻译软件或平台,集成翻译、术语释义、双语对照及语义可视化功能,界面兼容性强,交互体验良好。
      3.用户反馈与优化:构建反馈采集与分析机制,定期更新优化模型,提升翻译准确性与用户体验,推动系统迭代升级与成果转化。
   第五阶段:项目总结与成果展示
      1.项目总结与展示:撰写结题报告,整理资料,展示成果,发表论文。
      2.后续工作规划:持续维护,探索模型在其他领域的应用。
      1.与本项目有关的研究积累和已取得的成绩
      (1)中药古籍知识储备。项目团队成员已广泛搜索中医古籍翻译相关论文,并整理了国内外知名的中医古籍数字翻译库资源,如中国国家图书馆中医古籍数据库、国际中医药翻译研究平台等。这些资源的整理和分析为项目提供了丰富的知识储备,帮助团队深入理解中医古籍的语言特点和翻译难点,为后续研究奠定了坚实基础。
summernote-img
      (2)使用独立的中医古籍测试数据集。团队已具备使用独立中医古籍测试数据集对模型进行多维度性能评估的能力。通过自动评估指标(如BLEU、ROUGE、METEOR等)和人工评估(专家评分、翻译质量对比、文化内涵表达准确性等),对Transformer-Yu模型的翻译性能进行了全面分析。这一经验为本项目中模型的优化和验证提供了科学依据,确保模型在实际应用中的可靠性和实用性。
summernote-img
      (3)团队采用大规模双语中医古籍语料对Transformer-Yu模型进行了系统训练。并在初步测试中取得了显著成果。通过优化学习率、调整模型超参数、改进位置编码等手段,模型在中医术语翻译和古文内容表达的准确性上有了明显提升。这些成果不仅验证了团队的技术路线的可行性,也为本项目的顺利推进提供了有力支持。下图为Transformer - Yu模型架构调整位置编码的技术实例:
summernote-img
      已具备的条件
      技术基础:项目团队已具备扎实的程序开发基础,能够熟练进行模型的基本调用、库的基本调用与安装,能够快速搭建和运行基于Transformer架构的翻译模型,为项目的技术实现提供了有力保障。
      数据资源:项目已经收集了大量中医古籍文本,并整理了相关的双语对照语料库,为后续的模型训练和优 化奠定了坚实基础。
      尚缺少的条件及解决方法:
      (1)翻译难题
问题:中医古籍语言复杂,传统模型翻译不准确。
解决方法:深入剖析中医古籍的语言特点,如生僻字词、古汉语句式、文化内涵等,并融入中医知识图谱,将中医术语和概念与模型相结合,提升翻译的专业性和准确性。
      (2)模型局限性
问题:传统模型对中医概念理解不足。
解决方法:优化Transformer-Yu架构,调整位置编码和注意力机制,使其更好地适应中医古籍的逻辑结构和语言特点。通过引入领域知识和专家指导,进一步提升模型对中医概念的理解和表达能力。
      (3)评估不全面
问题:自动评估无法衡量文化适应性和专业性。
解决方法:结合人工评估,构建全面的评估体系。除了自动评估指标(如BLEU、ROUGE等),还引入专家评分、翻译质量对比、文化内涵表达准确性等人工评估维度,确保模型输出的高质量和专业性。 

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 20000.00 进行模型构建,论文出版,及材料费用。 15000.00 5000.00
1. 业务费 15000.00 计算分析数据,测试模型,差旅费以及论文出版费用。 10000.00 5000.00
(1)计算、分析、测试费 7000.00 用于云计算资源租用(如GPU服务器)以训练Transformer_Yu翻译模型,模型测试集与验证集生成的算力开销,精度评估及BLEU值计算所需工具使用费用。 7000.00 0.00
(2)能源动力费 0.00 0.00 0.00
(3)会议、差旅费 3000.00 项目成员参加自然语言处理、医学翻译等相关学术会议,前往合作单位进行专家访谈和项目调研,获取更精准的中医术语翻译建议。 3000.00 0.00
(4)文献检索费 0.00 0.00 0.00
(5)论文出版费 5000.00 项目完成后,拟在国际中医药与自然语言处理交叉领域期刊发表论文,涉及版面费、审稿费等。 0.00 5000.00
2. 仪器设备购置费 0.00 0.00 0.00
3. 实验装置试制费 0.00 0.00 0.00
4. 材料费 5000.00 用于收集和打印《温病条辨》多版本中英文资料、人工校对辅助工具,项目中期成果的展示材料印刷及装订费用,购置中英对照语料标注工具许可证。 5000.00 0.00
结束