11月7日,北京,微软研究院发布了《第四范式:数据密集型科学发现》论文集中文版,该书是迄今为止为数不多的从科学研究模式角度来分析大数据及其深远影响的著作。本书扩展了开创性计算机科学家、图灵奖获得者、微软研究院技术院士吉姆•格雷(Jim Gray)的思想,基于e-Science提出了科学研究的第四范式:以大数据为基础的数据密集型科学研究(Data-intensive Science)以及学术交流。该书从地球环境、健康医疗、科学的基础架构以及学术交流等四大部分,对数据密集型科学研究愿景进行了探讨,就如何充分利用科学发展的第四范式提供了深刻见解。
e-Science这一术语最早由英国科学家于2000年提出,用以概括在信息化基础设施支持下所开展的科学研究活动所需要的一系列工具和技术。如今,随着大数据时代的到来,科学发展正在迈入一个新阶段,科研的方法也从之前的实验型科研(Experimental Science)、理论型科研(Theoretical Science)、计算型科研(Computational Science)推进到第四范式——数据密集型科研(Data-intensive Science)。而早在大数据流行之前微软就开始对之加以研究和利用,微软研究院的部分基础研究通过基于云的大数据处理和分析完成,并基于及与其它高校、科研机构的相关合作成果,汇编了《第四范式:数据密集型科学发现》论文集的英文版。这对于发掘研究人员新的科研方式、加速科学发现,以及实现消费者与数据间更自然的交互等方面都将产生重要影响。
本书中文版的编译和组织者、中国科学院副秘书长潘教峰认为:“《第四范式:数据密集型科学发现》为我们打开了通向新的科学研究范式的大门,极大地提高了对数字科研和信息网络革命的巨大影响的认识,也极大地促进了科研人员站在新的高度认识和思考科技革命的机制与方式的能力。科学革命还在提速,大数据及其革命化影响还在深化。例如,以开放互联的大数据为基础的新型知识基础设施,不但是科学家开展科学研究的有力工具,而且也是协同创新的开放服务平台,是开放科学、开放创新、用户端创新的基础支撑设施。这样,当知识成为每一个人可方便应用的工具,当知识成为可以被及时更新、广泛连接、灵活计算的活的生命体的时候,当知识可以个性化地、动态地、交互地、智能化地嵌入到我们的研究、学习、管理和生活中时,我们将拥抱无穷的可能性。许多激动人心的潜力将被进一步开发,许多未知的领域和方向将呈现在我们面前。我们期待着‘科学研究第四范式’继续它对科学研究和社会发展的巨大贡献,也期待微软公司继续和科技界一起推动‘科学研究第四范式’的发展,我们也愿意继续参与在这个领域的探索。”
《第四范式:数据密集型科学发现》一书是由微软研究院学术合作部的三位资深研究员共同合作编撰而成,其中一位编者是学术合作部的全球资深副总裁托尼·海(Tony Hey)博士,他表示:“任何学科的进步都取决于研究人员相互之间以及他们与计算科学领域技术专家的合作水平。微软研究院作为计算机基础研究发展的推动者,一直努力探索如何更好地将计算机技术应用到医疗、环境、生物、天文、人文等多个领域。我们希望通过《第四范式:数据密集型科学发现》中文版的发布,帮助中国各领域科研人员和领导者理解和把握科研环境与方法的革命性变化,为从事信息与知识管理的人士提供未来的战略视角,同时也帮助有志于科学研究的学生了解未来的挑战和需求,推进中国的计算机科学研究水平。”
微软研究院一直致力于在eScience领域的探索,努力寻求进一步了解各领域科研所面临的与计算数据相关的挑战。目前,微软研究院已将eScience项目延伸到基因组与机器学习、医疗健康、生物、天文物理、生态环境、人文和海洋等多个领域,例如,通过基于机器学习了解儿童哮喘、通过非侵入技术检测血糖值、以及感知相机等。其eScience项目帮助众多科学家轻松执行计算,最大程度地实现资源共享及利用。
为推动计算机技术在各学科的应用,微软研究院与世界各地的众多科研机构进行了密切的学术合作。2011年12月,微软研究院与中国科学院签署合作备忘录,为中国的科研人员提供先进的云计算资源。根据合作备忘录,未来两年微软将每年向中国科学院计算机网络信息中心的研究项目捐赠200万小时的Windows Azure云资源,以及15TB的Windows Azure存储空间。此外,微软还将向科研人员提供额外的300万小时的Windows Azure资源和25TB的存储空间。
目前,微软提供的Windows Azure资源已由中国科学院计算机网络信息中心完成测试,可以通过Windows Azure接口为中国的科研人员提供云资源平台,从而让他们将精力集中在各自学科的科学发现上,帮助他们更高效地完成研究工作。根据合作备忘录,近期双方将联合发布Windows Azure云资源的学术合作计划,向高校和科研机构征集云计算领域的相关项目,并通过评审最终资助6至12个研究项目。