目的:采用数据挖掘方法,基于Matlab平台对基因网络扰动可视化,以直观显示短时高血糖状态下动脉血管转录组改变.方法:在美国国立卫生研究中心(NCBI) GEO数据库下载数据集.利用Matlab将数据转化为计算机可识别的结构体,经过数据筛选,获得短时高血糖后表达模式扰动最明显的基因谱.利用三种聚类算法分析,基于DAVID进行基因本体学(GO)注释及富集分析,把相关通路标定在KEGG通路中,形成基因—表达谱系统分析.结果:经过对数据集的筛选、聚类将基因的变化模式归为9类,在该模型中有效地反应出短时高血糖对动脉血管的急性早期效应.GO富集分析显示,在急性炎症反应、心肌重构、维持细胞内钙离子稳态、细胞周期调控、细胞趋化作用等方面的基因显著富集;其中以与粘多糖、糖蛋白结构相关基因、脂肪分解代谢、肌原纤维组装相关基因显著富集.这些发现与以往研究的结论相吻合.K-均值聚类方法显示,在高血糖环境下基因表达上调,且不随血糖恢复正常表达的基因,主要有参与细胞周期调控、心肌重构、维持细胞内钙离子稳态的基因.结论:利用数据挖掘方法,实现急性高血糖对小鼠动脉基因表达谱波动模式的可视化描述,并为糖尿病的“代谢记忆”机制提供新的解释,即早期的高糖效应带来的动脉血管的不可逆的损伤,是导致冠心病患者降糖治疗
作者:张心月;俞梦越
来源:中国循环杂志 2017 年 32卷 9期