生物信息数据挖掘与应用
文章出处:大数据联盟 文章作者: 发布时间:2018-01-20 浏览次数:50
 

1.研究领域

主要为生物信息学和数据挖掘,主要方向包括:高通量测序数据的分析挖掘、选择性剪接、智能机器人以及农业数据的分析挖掘等。

2. 研究项目进展

1)“AtCircDB”拟南芥环形RNA组织特异性数据平台

环形RNA不仅起着miRNA的潜在竞争目标的作用,而且还调控转录并与RNA结合蛋白相互作用。 由于环形结构的稳定性,这些分子有望在许多生物途径中进行干预,可能是人类药物研究和植物光合作用的高价值工具。

团队用622个拟南芥RNA测序数据集由87个独立的研究和开发atcircdb托管在NCBI SRA系统 识别、存储和检索的环形RNAs。通过对剪接位点的分析,团队发现69707个环形RNAs25715个组织特异性环状RNA1650miRNA循环RNA相互作用。此外,团队利用一个度量(检测得分)来评价环形RNA的检测能力。通过实验验证,我们证明了该度量提高了检测算法的准确性。团队还定义了富集圆形RNAs作为超环形RNA区域的区域。结果表明,这些区域与选择性剪接和叶绿体浓度相关。最后,团队开发了一个综合的组织特异性数据库(atcircdb)帮助查看、检索、可视化和下载拟南芥环形RNA。这个数据库将大大扩展我们对环形RNAs及其相关监管网络的理解。



2)“AtNAGNAG”拟南芥选择性剪接组织特异性数据平

NAGNAG剪接是广泛存在于动物的基因组。在植物中,也出现了大规模的勘探NAGNAG剪接点,甚至在拟南芥等模式植物。为了解决这个问题,团队在这里描述的NAGNAG图案及其表达率两剪接在拟南芥中,并组织数据库。利用435RNA-seq数据集,系统地确定和量化189个独特的NAGNAG图案以及两剪接位点从六个组织中的表达率的变化,包括200个包含两个新的剪接位点和1208图案包含至少一个新的剪接位点。利用这个数据库,可以浏览、搜索、下载拟南芥NAGNAG图案。所收集的信息也可用于检索相关组织特异性转录和氨基酸信息。数据库在很大程度上扩展了我们对NAGNAG现象的认识。