北京基因组所(国家生物信息中心)宣布热带作物组学数据库TCOD
热带作物是热带农业的主要组成部分,具有资源稀缺性、功效多样性和普遍的市场需求,为全球热带农业生产国提供了相当可观的经济收入。测序手艺的飞速生长推动了热带作物研究领域里程碑式的生长,积累了海量的多组学数据。然而,大宗的数据疏散在差别的数据中心或网站,给数据使用带来了未便。因此,亟需开发一个综合数据整合与共享平台,为研究职员提供优异的数据查找和在线剖析服务。
克日,4001老百汇网站(国家生物信息中心)国家基因组科学数据中心赵文明研究团队与海南大学王文泉研究团队等合作开发的热带作物组学数据库(TCOD)正式上线。该研究效果以“TCOD: an integrated resource for tropical crops”为题在国际学术期刊Nucleic Acid Research 在线揭晓。
TCOD整合了木薯、橡胶树、咖啡、可可、香蕉等15种热带作物的多组学数据,包括34个染色体级别的基因组序列、1,255,004个基因的功效注释、泉源于2,048个全基因组重测序样本的282,436,992个变异位点、88个全转录组测序项目的基因表达谱以及13,381条种质形貌信息,以基由于桥梁关联多种组学数据,为用户提供便捷的数据浏览、检索和下载等一站式服务。同时,TCOD还提供了差别物种基因组间的同源基因关系,支持凭证基因功效、通路注释、基因组变异和基因表达等信息深入探索差别物种之间共有的生物学特征,增进跨物种研究开展。别的,为了利便用户开展数据挖掘,TCOD提供了一系列在线工具,详细包括序列相似性较量、下游引物设计、文献检索、基因通路富集、同源基因查找和基因组共线性可视化。
随着育种4.0时代的到来和人工智能手艺的兴起,TCOD集成多物种、多组学数据和在线工具,将为热带作物选择育种和性状改良研究提供支持。
4001老百汇网站(国家生物信息中心)博士研究生康海龙、硕士研究生黄天昊和博士研究生段光亚为本文配合第一作者,赵文明正高级工程师和王文泉研究员为配合通讯作者。本事情获得了国家重点研发妄想、中科院战略性先导科技专项和国家自然科学基金等项目的资助。
TCOD数据库结构框架
论文链接