中国科学报 发表于:14年10月15日 11:00 [综述] DOIT.com.cn
为了驯服生物实验室辛苦得出的数据洪流,美国国立卫生研究院(nih)近日宣布,今年投资3200万美元设立一个奖项,以推动研究人员开发分析和使用生物学大数据库的方法。
该奖项出自nih去年启动的大数据知识(bd2k)创新计划。nih认为应当投入更多资源帮助使用不断增长的数据集——生物医学研究者积累的基因、蛋白质和患者档案等数据。例如,在一个“干生物学”项目中,研究人员将细胞基因表达的公共数据和患者档案混合在一起,预测现存药物的新用途。
bd2k奖项“将帮助我们克服最大化利用数据洪流面临的障碍,而且目前数据积累速度正在加速。”nih院长franciscollins在新闻发布会上说。他表示,这些奖金将资助开发计算工具、软件、标准和方法,用于分享和使用大数据集。
在未来4年里,11个卓越创新中心每年将收到200万~300万美元,开发从建模癌症细胞信号到整合移动传感器数据等各个方面所需的方法和工具。另一个奖项将资助名为enigma的全球脑数据收集工作,从而发掘精神疾病的遗传根源。
最近加入enigma项目的佛蒙特大学认知神经学家hughgaravan表示,长期以来,神经影像研究也在与数据不足作斗争。他提到,约“95%的影像学研究可能每组有20个参与者”,主要原因是脑扫描成本——每人约为500~600美元。garavan研究小组则计划使用数据池探索成瘾性的基因和神经生物学基础。
另一方面,尽管大数据集增加了获得假阳性结果和错过稀有变体的概率,但总体而言,数据池策略“非常有意义”,西雅图儿童医院精神病学家jackmcclellan说。
bd2k项目还将资助加州大学圣迭戈分校建立一个“数据探索”协调中心,该中心将与其他8个机构联合开发,从而帮助研究人员更容易地发现和使用数据集。
这一举措不仅有利于生物学研究,对医疗的推动也将产生巨大贡献,为未来生物学、医学发展提供更加快捷的道路。