基于目标和症状的计算模型,用于miRNA与疾病的相关性预测

文章来源:健康时报 2021-11-10 16:11

【字号 打印分享收藏

高通量测序技术的出现揭示了microrna (mirna)在包括癌症和神经退行性疾病在内的广泛疾病中的主要作用。理解mirna与疾病之间的新关系可能会揭示复杂的发病机制,从而导致有效的诊断和治疗。然而,目前研究新型mirna与疾病的相关性是费时费钱的。多年来,已经提出了几种计算模型来优先考虑潜在的 miRNA 疾病关联,但可用性或预测能力有限。

为了填补这一空白,作者引入了TSMDA,这是一种新的机器学习方法,利用靶标和症状信息以及阴性样本选择来预测mirna与疾病的关联。TSMDA显著优于同类方法,在5倍交叉验证和盲检验下,受试者工作特征曲线(ROC)下面积(AUC)分别为0.989和0.982。作为案例研究,作者也证明了该方法能够揭示乳腺癌、前列腺癌和肺癌中潜在的mirna与疾病的关联。

microrna (mirna)是一种典型长度为2125个核苷酸的小型非编码调控rna。人类成熟mirna通过与30个未翻译区域的部分互补碱基配对来控制靶信使rna (mRNAs)的基因表达。这种相互作用通常会导致转录后抑制,偶尔会导致miRNA降解。各种生理过程,如细胞增殖和细胞死亡,都是由一个复杂的mirna网络调控的。

随着高通量测序技术的出现,越来越多的证据表明mirna与疾病之间存在关联。一些mirna的放松管制与多种疾病的发展相关,如癌症、脑和心血管疾病。例如,胰腺癌的发生可能来自miR-21、miR-155、miR- 181、miR-221和miR-222的上调。

因此,理解mirna与疾病之间的关系可能有助于阐明发病机制,促进基于mirna的生物标志物或药物的应用。目前,大量与疾病相关的miRNAs已被实验证实并在多个数据库中收集。尽管做出了这些重大的努力,但大规模探索潜在的疾病mirna关联是不可行的,因为实验验证是费力和昂贵的。在这种情况下,迫切需要有效的计算方法来提出潜在的关联并指导实验工作。

广泛应用了各种机器学习模型,以协助探索mirna与疾病的关系。从广泛接受的假设,表型相似的疾病和功能相同的mirna倾向于关联,实验证实的关联可以用来识别新的关联。一个特别的模型,miRNA靶点失调网络(MTDN),已经建立,以揭示潜在的癌症相关miRNA。之后的研究进展之一是miRNA-疾病关联随机森林(RFMDA),它基于miRNA功能相似性(MISIM)和疾病语义相似性,作为miRNA-疾病关联预测的特征。

尽管目前已有的方法做出了显著的努力,但模型性能仍然受到miRNA和疾病相似性估计的限制,不能直接反映miRNA机制和疾病发病机制。通过两种附加方法获得的性能改进,miRNA 疾病关联的潜在特征提取 (LFEMDA) 和 miRNA 疾病关联的基于距离的序列相似性 (DBMDA),强调将生物特征,如 miRNA 序列,引入相似性计算是重要的。缺乏实际的阴性样本也是一个重要的挑战,各种方法随机从mirna -疾病对中选择阴性样本,但没有证实相关性。

这种方法可能会导致假阴性结果。之前的两个模型,非负样本提取(NSEMDA)和负样本选择策略和多层感知器(NMLPMDA),提出了选择可靠负样本的替代方法。NSEMDA通过正向无标记(PU)学习迭代过滤未知样本,这是一种用于处理标记问题的算法,其中只有一个类可用。另外,NMLPMDA利用mirna基因疾病网络来消除可能的关联。

在这里,作者提出了一种新的机器学习模型,采用基于靶标和症状的相似性用于mirna -疾病关联预测(TSMDA)。在本研究中,引入miRNA靶基因和疾病症状,增强相似性计算,并基于扩展miRNAgene-disease网络和改进的PU学习进行可靠的阴性样本选择。(生物谷 Bioon.com)

Copyright © 1999-2016 HealthTimes All Right Reserved
温馨提示:如果您有任何健康问题均可到网上咨询,向全国专家提问!
本站信息仅供参考_不能作为诊断及医疗的依据 ┊ 本站如有转载或引用文章涉及版权问题_请速与我们联系