SAS:当大数据遇到生物多样性,“以术治数”将成关键

中国北京,2020年5月11日——近期,就在全球为新冠肺炎大流行而诚惶诚恐之时,熟不知另一更可怕的危机正不断酝酿着——“生物多样性”破坏。作为“生物多样性超级年”的2020年,我们不禁期待得知联合国《生物多样性公约》缔约方大会第十五次会议改期为何时之际,联合国《生物多样性公约》代理执行秘书伊丽莎白·姆雷玛于上月致信,通知已正式确定5月22日的国际生物多样性日的口号“以自然之道,养万物之生”。

为何说生物多样性破坏比病毒传播更可怕?设想一下,即便水是干净的,空气是清新的,但是如果地球上只有人类将是怎样的情形?或者对比一下,一个免疫系统丧失的艾滋病人和一个被因车祸被截肢的人,哪个更让人绝望?

生物多样性遭到破坏比眼前新冠疫情更让人恐惧,联合国生物多样性首席官罗伯特·沃森在4月发布了关于生物多样性和生态系统的报告,并表示:“生物多样性的持续性破坏将使人类社会变得贫困,影响粮食产量和水质安全,甚至会影响健康。”

坐拥数据“金矿”,反而使生物多样性分析举步维艰

减缓生物多样性破坏速度和实现环境目标需要了解威胁生物多样性的原因是什么?这些风险发生在什么地方?威胁将如何变化?采取什么措施可以预知或避免这些变化?

随着海量数据的不断涌入,数据已成为驱动创新的重要势能,大规模收集的数据正改变着人类的科研、生产和生活。传统的生物多样性研究也逐渐向数据密集型的科研方式过渡,随着创新分析和人工智能的发展,越来越多的人正参与现代化公民科学行列,人类社会已逐步孕育出数据分析的智能生态。

包括国际自然保护联盟等绿色组织手中都握有大量濒危物种的相关数据,但同徒有金矿却不知挖掘的道理一样,针对这些威胁可用于分析的数据寥寥可数。虽然积累了一些对生物多样性保护的数据,但这些数据如果不进行挖掘分析,便不会为保护政策提供合理的建议。

如何确定威胁对物种或生态系统的影响是一个独立过程,一般包括保护评估结果。对各种威胁进行划分,也广泛应用于成千上万的物种、站点和项目的保护评估中。随着各种数据集和元数据源源涌入,会导致评估过程变得异常复杂,分析周期漫长且结果缺乏价值。根据曾发表在《科学》上题为《时序数据集揭示生物多样性变化规律,未发现生物多样性系统性丧失》的文章中提到“在国际自然保护联盟的濒危物种红色名录中,海洋或陆地以及内陆水体中受威胁物种的频率与可提供的威胁数据集不成比例:生物资源的使用是对物种最常见的威胁,但在威胁数据集中仅占5%。由于缺乏正式的元数据,要确定其准确属性值往往是比较困难的,满足所有五种属性标准(容易获取、空间分辨率足够、近10年的新数据、有重复、对准确性进行过评估)的数据集在绝对数量上具有不确定性,只有5%的数据集满足所有这五个属性。” 因此,看似海量的数据对于庞杂多变的生物体系而言存在误导性。

拥抱智能分析,中国视其为破局新势能

亚洲是生物多样性最丰富的地区,具有突出的独特性和很高的保护价值。与此同时,亚洲又是人口最多的洲和全球经济发展的一大引擎,对生物多样性造成的威胁也是最为严重的。根据全球生物多样性在线数据资源分布,在全球生物多样性信息网络的植物分布数据中,亚洲只占4%,可见大多数亚洲国家都没有比较完整的数据库。

近年来,我国生物学家正着力国家的大数据战略加紧科研,一方面为经济发展奠定基础学科方面的技术根基,另一方面也希望带动整个亚洲生物学迈向创新。例如,由我国带领的“亚洲植物多样性数字化计划”,旨在针对亚洲各地区目前已有的植物信息资源开展全面调研,也为亚洲植物多样性保护建立综合信息和跨学科数据挖掘环境。

虽然数据已在,但是分析数据的“术”则成为破局的利刃,我国相关领域专家也纷纷将课题聚焦在“分析之术”,主要是如何连接数据孤岛和通过智能技术赋能分析。入侵外来种使全球生物多样性匀质化,并对本土物种构成重大威胁。如果有全面的数据就可进行早期监测并作出快速响应,这就需要将每个独立的数据孤岛打通实现高度整合。此外,多变的环境因素、复杂的数据都会给研究带来巨额的时间和人力投入,唯有通过智能分析方可实现自动化并提升结果的准确性和参考价值。

践行“数据为善”,SAS以智能分析“数”造美好世界

人工智能和机器学习势必成为推动自然保护革新的关键引擎。不仅是数据,如果同属地球村的我们能利用这些创新技术做出更好的决策,包括处理非法贸易、跟踪资源的使用等,那么运用这些信息和数据的工具将为整个世界提供帮助。

作为全球数据分析领域的领导者,SAS自初创至今始终将企业社会责任视为业务决策过程中的重要考量,这也帮助SAS实现44年的业务持续增长。SAS将“数据为善”纳入业务拓展的核心,并持续寻找改善人们生活方式的契机,通过创新让数据的价值最大化,协助解决自然保护等问题。

前不久,为进一步履行“数据为善”,SAS特别成立社会创新部门,旨在与全球合作伙伴、非营利组织和政府机构开展合作,通力以创新分析赋能生物多样化、气候变化等环境利好研究。特别是当下濒危物种问题不断威胁着地球环境和人类社会,SAS与多年致力于生物多样化保护的NatureServe强强联手,在SAS人工智能和高级分析的支持下,NatureServe一改原先传统的评估方式,向自动化和智能化成功转型,这不仅帮助NatureServe能够在人力和财力受限的情况下,对700万种已知物种的数据进行分析,更让原先人工审核流程从每个物种上百小时缩减至仅需几小时。

不仅如此,针对气候环境对物种多样性造成的快速影响,为更快地采取决策的正确响应,NatureServe凭借SAS文本分析将耗时的学术论文审核流程实现自动化和高效化,配合SAS视觉分析NatureServe可以将多来源、多形式的数据进行整合,借此从庞杂的数据中挖掘价值。基于SAS的高级分析和人工智能技术,NatureServe可从海量数据中快速定位错误和遗失数据。特别是在一份数据样本量高达85.000的分析过程中,SAS成功协助定位并善用多达50.000个险些被遗漏的数据。

NatureServe总裁兼首席执行官Sean O’Brien表示:“在SAS的鼎力相助下,我们成功制定了全新的全球生物多样性评估标准体系,让我们彻底告别以往低效、滞后和成本高昂的分析流程,带来高效、可靠且精准的智能体验。这不仅将成为生物科学和数据科学双领域的跨界标杆,更对生态环境、物种保护乃至人类社会的绿色发展提供创新驱动力。”

SAS副总裁兼大中华区董事总经理何伟信表示:“40多年的业务增长印证了SAS坚持履行企业社会责任的价值,保护地球和回馈社会也是我们的业务之本。与NatureServe等绿色组织协力共进不仅为我们践行‘数据为善’提供平台和机遇,更印证了我们企业社会责任战略的正确性。SAS将持续利用自身技术优势,积极开展社会创新举措,履行社会企业责任,在不断拓展业务的同时,积极与环境利好组织展开合作,向着‘将数字世界变革为智能世界’共同迈进,为世界和全人类造福。”