9月15日,中国农业科学院、阿里云计算有限公司、华智水稻生物技术有限公司、北京聚道科技有限公司四方举行新闻发布会,宣布共同推动“云之稻项目“——3000份绿色超级稻基因组原始测序数据将首度揭开神秘面纱,向外界共享和使用。阿里云表示,这是云计算技术推动大规模基因组学研究的一次尝试。未来,阿里云将借助自身在大数据方面的积累,为生物大数据行业变革提供关键平台技术,促进生物大数据行业的快速发展。
此次,四方共同合作的“云之稻项目“,源自比尔梅琳达盖茨基金“为非洲和亚洲资源贫瘠地区培育绿色超级稻”和国家国际合作专项资助的3000份水稻基因组项目的成果。根据协议,基于3000份水稻基因组测序数据和种质资源的“云之稻项目”将无偿共享,同时项目组还将建立水稻最全面的“水稻功能基因组和育种信息数据库”,为基础研究和育种应用提供可供参考的重要信息。
绿色超级稻项目首席科学家、中国农业科学院作物科学研究所黎志康博士介绍说,该项目简称为绿色超级稻项目,由中国农业科学院牵头组织实施,项目总体目标是培育能够广泛适用于灌溉和雨养地区生态环境,并具有氮磷高效利用、抗病、抗虫、高产、优质、抗逆(干旱、盐碱)等特性的水稻新品种,在目标国家进行示范和推广,推动杂交稻种子的生产能力,并为撒哈拉以南非洲国家、亚洲和中国的西南地区水稻分子育种建立一个高效水稻基因型分析技术平台。
据透露,3000份水稻核心种质基因组测序项目是迄今为止全世界最大的植物基因组测序项目。这项研究将加快规模化发掘水稻优良基因,突破水稻复杂性状分子改良的技术瓶颈,加快高产、优质、广适性新品种培育的进程,全面提升我国及全球水稻基因组研究和分子育种水平。
在回答记者提问时,黎志康博士表示,“对3000份水稻核心种质基因组测序分析,能够回答‘水稻有多少的遗传多样性可以应用,从哪里获取所生物育种需要的遗传资源’的问题,分析得到的数据将为水稻的基础认识和生物育种提供基础信息资源。这项研究将揭示全球栽培稻资源的基因组多样性,和每个水稻资源的遗传特点和其应用价值。”
他进一步补充说,这项研究将3000份水稻种质资源带入水稻育种应用中,将为水稻育种创新提供材料和新思路。3000份水稻核心种质重测序项目的分析结果还将填补人们对水稻甚至各个物种在基因组学方面的一些知识空缺。后基因组时代结合功能基因组学新的方法和策略进行生物育种,将贡献于粮食安全,食品健康的发展。
黎志康告诉记者,3000份水稻基因组测序项目分析得到的数据量达到几百T,生物学研究进入了大数据时代,需要全世界所有科学家和有兴趣的人士参与进来分析挖掘,阿里云将提供一个很好的平台,同时阿里云平台结合众多的科学研究人员也会促进生物大数据行业的快速发展。
业内专家指出,当基因研究进入大数据时代,传统的数据共享模式和分析工具已经遭遇到瓶颈,成为阻碍行业发展的一大痛点。
阿里云高级专家林河山表示,"水稻基因数据公益云平台构建在阿里云的对象存储服务和批量计算服务之上。阿里云的对象存储服务(简称OSS)是阿里云自主研发的分布式存储系统,具备海量的存储空间和几乎无限的扩容能力,并且通过多重数据冗余备份和自动的故障恢复机制保证数据安全。通过OSS提供的免费存储和下载服务,Rice 3K项目的水稻基因组数据可以随时为全球科学家所用。“
他还表示,“阿里云批量计算服务为数据的分析和解读提供了海量的计算资源。批量计算服务是专门针对基因数据分析等计算密集型应用设计的分布式云服务,其自动的资源管理、灵活的任务调度和工作流支持大大简化了在云上搭建水稻基因分析平台的过程。"
阿里云方面表示,阿里云希望未来可以和更多的公共基因组项目合作,通过阿里云大数据相关服务与业界专家领域知识的紧密结合,共同推动基因测序行业的变革。目前,阿里云已经与贝瑞和康、中科院计算研究所等国内领先的基因公司以及研究机构展开合作。