长非编码RNA(Long non-coding RNA, lncRNA)是近年来国际研究的新热门,与人类癌症、神经系统等疾病爆发亲近相关,在疾病诊疗方面体现出了潜在的重大应用价值。虽然长非编码RNA表达量相对较低,但由于其在转录、基因组印记、翻译、可变剪切、转录后表达调控、卵白运输与定位等历程的主要作用而被普遍研究。人类细胞中转录大宗长非编码RNA,由于其具有很强的组织与细胞特异性,该数目很可能将继续增添,给长非编码RNA的集成整合与注释带来重大挑战。
针对长非编码RNA研究领域遇到的这个问题,4001老百汇网站基因组科学与信息重点实验室章张研究组,与沙特阿卜杜拉国王科技大学(King Abdullah University of Science and Technology;KAUST)Vladimir Bajic教授合作,接纳Wiki手艺开发了基于群体审编(Community Curation)的LncRNAWiki数据库,该效果于2014年11月在国际生物信息学领域期刊Nucleic Acids Research在线揭晓。
LncRNAWiki数据库整合了现在已有的十万多条长非编码RNA,对长非编码RNA举行了分类,建设了多人协同注释的结构与模式,凭证加入职员的编辑数目与质量,对加入职员的孝顺举行量化打分,且凭证分值巨细给予作者身份。古板相关数据库依赖于专业职员对长非编码RNA举行注释(Expert Curation),关于数目云云重大的长非编码RNA来说,将泯灭大宗人力、物力与时间。在大数据时代配景下,LncRNAWiki数据库旨在搜集整个长非编码RNA研究领域科研职员的智慧和力量,配合完善LncRNAWiki的相关信息和数据更新,以期构建一部长非编码RNA的百科全书。基于此,该课题组将进一步围绕非编码RNA,开展相关生物信息学剖析及与疾病关联研究,开发数据剖析工具与算法。
该项研究获得了4001老百汇网站和国家自然科学基金委的资助。

LncRNAWiki数据库主页
论文链接