详情

神经管缺陷和Bardet-Biedl综合征中关键串扰基因的生物信息学研究

申报人:薛健康 申报日期:2025-03-27

基本情况

2025创新项目
神经管缺陷和Bardet-Biedl综合征中关键串扰基因的生物信息学研究 学生申报
创新训练项目
医学
临床医学类
学生自主选题
二年期
神经管缺陷(NTD)与Bardet-Biedl综合征(BBS)是两类临床异质性显著的发育障碍性疾病,二者虽可能共享纤毛功能障碍及遗传易感性,但其分子互作机制尚不明确,且针对非叶酸依赖性NTD缺乏有效干预靶点。本研究聚焦于解析NTD与BBS的共有分子网络,综合运用多种生物信息学分析方法,构建“差异表达分析(limma)-共表达网络(WGCNA)-机器学习(LASSO-SVM)”三级筛选体系,系统性筛选关键串扰基因,揭示其交叉调控机制。研究旨在开发新型分子诊断标志物及靶向治疗策略,为两类疾病的联合诊疗提供理论依据,推动发育障碍精准医学的临床转化。
   负责人熟练掌握R语言等数据分析技术,了解GEO,TCGA等数据库的查找方法,参与指导教师所在课题组的科研工作,具有较强的文献查阅及数据收集等能力。
  指导教师近5年曾主持济宁市科技课题1项、校级课题1项,参与省级课题1项、校级重点课题1项,以第一作者发表科研学术论文3篇(1篇SCI)。在本课题的实施中,充分协调资源,提供指导与帮助。
讲解专业知识,指导过程设计,全力帮助学生解答疑问,并提供高水平实验室。
校级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
薛健康 临床医学院(附属医院) 临床医学(圣地卓越医师班) 2022 数据分析
刘孟棋 临床医学院(附属医院) 临床医学(圣地卓越医师班) 2022 查找文献,论文写作
鲁统源 临床医学院(附属医院) 临床医学(本科-临床医学院) 2022 数据分析

指导教师

序号 教师姓名 所属学院 是否企业导师 教师类型
魏红 基础医学院

立项依据

     通过多种生物信息学技术,分析神经管畸形(NTD)与Bardet-Biedl综合征(BBS)的共同致病机制,筛选关键串扰基因,探索其作为早期诊断靶点和治疗干预的潜在价值。
2.1 数据下载和预处理
   从GEO数据库(https://www.ncbi.nlm.nih.gov/geo)下载以下两个基因表达谱数据集。①GSE4182(神经管缺陷,NTD):基于GPL570平台(Affymetrix Human Genome U133 Plus 2.0 Array)生成,包含 4例NTD胎儿羊水细胞样本 和 5例同期健康胎儿对照样本。所有样本通过羊水穿刺术获取胎儿mRNA,用于分析NTD相关基因表达特征。②GSE62936(Bardet-Biedl综合征,BBS):基于GPL16791平台(Illumina HiSeq 2500)生成,选取3例BBS患者来源的诱导多能干细胞(iPSC)分化的神经元样本和2例健康供体iPSC神经元对照样本。iPSC由患者体细胞重编程获得,保留BBS相关致病突变(如BBS1、BBS10),可以模拟疾病表型。
2.2 NTD和BBS中差异表达基因(DEGs)的鉴定
   利用 R 语言中的“limma”软件包对标准化后的GSE4182与GSE62936基因表达谱中的关键差异基因DEGs进行筛选,筛选条件为:|log FC|≥1,P<0.05。使用“g gvenn”R包(https://cran.r-project.org/ web/packages/ggvenn)对NTD及BBS相关 DEGs取交集,绘制Venn图,以获得两种疾病的重叠DEGs。
2.3 NTD和BBS的加权基因共表达网络分析
   应用R中的“WGCNA”包进行加权基因共表达网络分析。利用pickSoftThreshold函数获得了邻接函数加权参数的最优值,并将其作为后续网络构建的软阈值。然后,构建加权邻接矩阵,并根据拓扑重叠矩阵(TOM)和差异度量(1-TOM)使用分层聚类构建相关基因模块。最后,计算每个模块与疾病的相关性,并将相关性最高的模块定义为关键基因模块。筛选出关键模块中的基因进行后续分析。
2.4 整合重叠DEGs和重叠模块基因及功能富集分析
   将limma分析筛选出来的重叠基因DEGs与WGCNA分析筛选出的重叠模块基因再次取交集,最终得到关键基因,认为这些基因可能是同时参与NTD和BBS发病过程的关键串扰基因。随后通过 R 语言("org.Hs.eg.db "软件包和 "clusterProfiler "软件包)进行了基因本体(GO)功能和京都基因组百科全书(KEGG)通路的富集分析。
2.5 进行蛋白互作网络构建
   为了识别重叠DEGs之间的相互作用,使用STRING数据库构建重叠DEGs的PPI网络该数据库,将“最小交互得分”参数设为0.4,得到重叠DEGs的交互网络。随后,将网络导入到Cytoscape软件中进行可视化。使用MCODE插件过滤连接性高的簇,将PPI网络划分为多个簇(默认参数:Degree Cutoff = 2;Node评分Cutoff = 0.2;K-Core = 2;和最大深度= 100)。对评分为>10的基因群进行功能富集分析。CytoHubba是一个Cytoscape插件应用程序,可以筛选PPI 网络中的关键串扰基因。在四种算法(Degree、EPC、MCC和MNC)中通常排名前20的基因被确定为PPI关键串扰基因 。
2.6 机器学习筛选诊断基因
   使用R语言对GSE4182和GSE62936两数据集进行最小绝对收缩和选择算子 (least absoluteshrinkage and selection operator,LASSO)算 法 和 支 持 向 量 机 (support vectormachine,SVM) 算法,筛选出最终的关键串扰基因。
2.7 在独立的外部数据集中验证关键的串扰基因
   为了提高置信度,我们验证将关键串扰基因在GSE33111和GSE164891数据集中的表达。数据集GSE33111基于GPL6884 [Illumina HumanWG-6 v3.0 expression beadchip]生成,该数据集包含12例受NTD影响的胎儿样本和12例对照组同期正常发育胎儿样本。数据集GSE164891是基于GPL17303 Ion Torrent Proton (Homo sapiens) 生成,该数据集包含 7例BBS患者来源的iPSCs分化视网膜组织样本,和23例健康对照个体来源的iPSCs分化视网膜组织样本。病例组与对照组关键串扰基因mRNA表达水平的比较采用独立t检验,p值小于0.05认为具有统计学意义。通过“ggplot2”R包的boxplot显示病例组和对照组中关键串扰基因的相对表达水平。最后通过受试者工作特征曲线(ROC)检测关键串扰基因的治疗价值。
2.8关键串扰基因转录因子(TFs)的鉴定
   通过NetworkAnalyst 3.0平台(https://www.network-analyst.ca)预测关键串扰基因的TFs。然后,筛选出与至少两个关键串扰基因相互作用的转录因子。随后,我们将用独立的t检验验证了测试集(GSE4182和GSE62936)和验证集(GSE33111和GSE164891)中这些TFs的mRNA表达水平。最后,确定病例组中普遍上调的TF为NTD和BBS中潜在的关键TF。
     Bardet-Biedl综合征(Bardet-Biedl syndrome, BBS)是一种罕见的纤毛相关遗传疾病,由纤毛结构和功能异常引发。BBS患者常表现为视网膜退化、肥胖、多指(趾)畸形、肾功能障碍及认知缺陷等表型[1],其致病机制与至少26个已知的BBS基因(如BBS1-BBS21)突变导致的纤毛功能障碍密切相关[2]。纤毛作为细胞表面的信号传导枢纽,在胚胎发育、细胞极性建立及组织稳态维持中发挥核心作用,而BBS相关蛋白复合体(BBSome)的缺失会破坏纤毛的组装与信号传递能力,进而影响发育进程[3]
 神经管缺陷(neural tube defects,NTDs)最常见,最严重的出生缺陷之一,发病率高,临床后果严重,也是中国儿童出生缺陷的重要问题[4]。近年来,我国逐渐完善生育政策,高龄产妇数量增多,大大增加了NTDs发病风险,迫切需要更多的生物靶点作为研究依据[5]。 目前,该疾病的发病机制尚未阐明,是出生缺陷领域研究的重点难点之一。母体妊娠期补充叶酸已被证明是一种非常有效的策略,常用于部分NTDs的初级预防。但仍有一部分NTDs患者对叶酸治疗具有抵抗性[6]。研究表明,非叶酸缺乏因素如肌醇代谢障碍,化学物质接触(5-氟尿嘧啶),射线,基因突变或遗传缺陷等可能引起初级纤毛基因表达异常,影响初级纤毛发育,从而导致神经管闭合障碍[7]。值得注意的是,有研究显示非叶酸缺乏型NTDs发生与纤毛的发育有关[8],这也为研究非叶酸缺乏型神经管畸形机制与纤毛病的发病机制提供了新的思路。
  NTDs(如脊柱裂、无脑儿)是胚胎神经管闭合异常引发的先天性畸形,其病因涉及遗传与环境因素共同作用。研究表明,纤毛驱动的“左右不对称流”(nodal flow)对神经管形态发生至关重要,而BBS相关基因(如BBS4、BBS6)的缺失可导致纤毛结构异常,破坏Shh、Wnt等信号通路的时空分布,最终干扰神经管闭合[9-10]。所以,我们推测BBS的纤毛缺陷与神经管缺陷(NTDs)的发病机制存在潜在关联。
  BBS与NTDs的关联性源于二者共享的纤毛依赖性发育调控机制。BBS相关基因突变可能通过损害纤毛介导的形态发生素信号传递,增加神经管闭合失败风险,这为理解NTDs的分子病因提供了新视角,同时也提示靶向纤毛功能修复或成为干预相关畸形的潜在策略。
参考文献
[1]林娇,徐鑫星,王传凯,等.Bardet Biedl综合征的诊治进展[J].临床儿科杂志,2024,42(02):157-163.
[2]Dollfus H, Lilien MR, Maffei P, Verloes A, Muller J, Bacci GM, Cetiner M, van den Akker ELT, Grudzinska Pechhacker M, Testa F, Lacombe D, Stokman MF, Simonelli F, Gouronc A, Gavard A, van Haelst MM, Koenig J, Rossignol S, Bergmann C, Zacchia M, Leroy BP, Mosbah H, Van Eerde AM, Mekahli D, Servais A, Poitou C, Valverde D. Bardet-Biedl syndrome improved diagnosis criteria and management: Inter European Reference Networks consensus statement and recommendations. Eur J Hum Genet. 2024 Nov;32(11):1347-1360. doi: 10.1038/s41431-024-01634-7. Epub 2024 Jul 31. PMID: 39085583; PMCID: PMC11576898.
[3]李文娟.解析货物蛋白-BBSome纤毛顶端偶联的复杂分子机制[D].天津科技大学,2023.DOI:10.27359/d.cnki.gtqgu.2023.000013.
[4]石英飞.肌醇代谢障碍在神经管畸形发生中的作用机制研究[D].北京工业大学,2015.
[5]Journal | [J] Reproductive and Developmental Medicine. Volume 6 , Issue 2 . 2022. PP 67-78
[6]任文彬,李建婷,解军.神经管闭合的新见解:叶酸不应答型神经管畸形(英文)[J].中国生物化学与分子生物学报,2024,40(05):575-587.DOI:10.13865/j.cnki.cjbmb.2024.03.1012.
[7]石英飞,王建华,钟儒刚.肌醇代谢通路与神经管畸形关系的研究进展[J].中国优生与遗传杂志,2014,22(10):1-3+6.DOI:10.13404/j.cnki.cjbhh.2014.10.001.
[8]毛宏梅,石丽丽,霍军生.个性化叶酸补充预防神经管缺陷研究进展[C]//亚洲营养学会联合会,中国营养学会。2023:9.DOI:10.26914/c.cnkihy.2023.071481.
[9]Eguether T,Cordelieres FP,Pazour GJ.Intraflagellar transport is deeply integrated in hedgehog signaling.Mol Biol cell,2018,29:1178-1189.
[10]修阳晖.Bardet-Biedl综合征致病基因筛查及发病机制研究[D].福建医科大学,2018.
1.应用“差异表达+共表达网络+机器学习”三级筛选体系,避免单一方法的漏筛问题。
  本研究突破传统单一组学分析的局限性,创新性整合差异表达分析(limma)与加权基因共表达网络分析(WGCNA),构建多层次数据筛选框架并引入支持向量机递归特征消除(SVM)与最小绝对收缩与选择算子(LASSO)回归算法,从PPI网络筛选的枢纽基因中进一步优化候选基因。
2.纤毛发育通路的关联性突破
  针对临床中30%~60%叶酸干预无效的神经管缺陷(NTD)病例,本研究首次提出其致病机制可能与纤毛病(如BBS)共享的纤毛发育缺陷相关。

                                                      summernote-img

   拟解决的问题:分析神经管畸形(NTD)与Bardet-Biedl综合征(BBS)纤毛病的共同致病机制,筛选关键串扰基因,探索其作为早期诊断靶点和治疗干预的潜在价值。
   预期目标:发表论文一篇


2025年6月—9月:数据获取、limma分析。
2025年10月—12月:WGCNA模块构建。功能富集。
2026年1月—6月:PPI网络分析、机器学习建模。
2026年 7月—12月:外部数据集验证、转录因子预测。
2027年1月—6月:论文撰写与发表
(1)与本项目有关的研究积累和已取得的成绩
  7.1 NTD与BBS差异表达基因的筛选
  7.1.1 limma分析结果
  对NTD数据集GSE4182及BBS数据集GSE62936进行分析,与NTD相关 DEGs共有2818个,其中上调基因1690个,下调基因1128个。BBS相关DEGs 共557个,其中上调基因305个,下调基因252个;差异基因火山图(图1),可以直观地识别变化较大且具有统计意义的基因。利用Venn图对两种疾病相关的DEGs取交集,共获得23个重叠基因,其中上调重叠基因15个,下调重叠基因8个(图 2),并对这23个重叠基因绘制热图(图3)。
summernote-img
summernote-img
summernote-img
已具备的条件:
  1、专业指导:有指导老师指导并监督课题进展。
  2、研究条件:本项目科研团队构成合理,分工明确;临床医学院完善的科研平台为课题进展提供了支持。

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 10000.00 2500.00 7500.00
1. 业务费 10000.00 2500.00 7500.00
(1)计算、分析、测试费 5000.00 数据分析费 2500.00 2500.00
(2)能源动力费 0.00 0.00 0.00
(3)会议、差旅费 0.00 0.00 0.00
(4)文献检索费 0.00 0.00 0.00
(5)论文出版费 5000.00 版面费 0.00 5000.00
2. 仪器设备购置费 0.00 0.00 0.00
3. 实验装置试制费 0.00 0.00 0.00
4. 材料费 0.00 0.00 0.00
结束