2023年8月8日:近日,IBM与开源AI平台 Hugging Face 共同宣布,基于美国宇航局(NASA)卫星数据构建的IBM watsonx.ai地理空间基础模型现已在Hugging Face 发布。它将成为Hugging Face上至今最大的地理空间基础模型,也是首个与NASA合作构建的开源AI基础模型。
获取最新数据仍然是气候科学研究面临的主要挑战,因为环境条件几乎每天都在变化。尽管数据量不断增加(NASA预估到2024年,其新任务将产生25万 TB的数据),但科学家和研究人员们在分析这些大型数据集时仍面临障碍。作为与NASA签署的空间行动协议(Space Act Agreement)的一部分,IBM今年早些时候构建了一个用于处理地理空间数据的AI基础模型。现在,双方联手业内公认的开源领导者和Transformer模型库Hugging Face,共同发布上述地理空间基础模型,以扩大气候和地球科学研究中对AI技术的访问和应用,从而加速创新。
IBM研究院人工智能副总裁Sriram Raghavan表示:”在加速气候变化等关键领域的研究发现上,开源技术的角色越来越重要。IBM的基础模型旨在创建灵活、可复用的AI系统,通过将其与NASA的地球卫星数据库相结合,并发布在领先的开源AI平台Hugging Face上,我们可以利用协作的力量,实施更快速、更有影响力的解决方案,改善地球环境。”
Hugging Face产品和增长业务负责人Jeff Boudier表示:”AI仍然是一个以科学为驱动的领域,而科学进展必须通过信息共享和合作取得。这就是为什么开源AI、开放数据集和模型对于AI的持续发展如此重要,从而让更多人受益于技术。”
NASA首席科学数据官Kevin Murphy表示:”我们相信基础模型有潜力改变观测数据分析的方式,帮助我们更好地了解我们的星球。我们希望通过开源这些模型扩大其影响力。”
该基础模型由IBM和NASA共同训练,使用了过去一年在美国大陆范围内的Harmonized Landsat Sentinel-2(HLS)卫星数据,并基于洪水和焚烧区域的标记数据进行了调优。相比于目前的领先技术,该模型仅使用同等条件下一半的标记数据,便实现了15%的效果改进。通过进一步的调优,该模型还可以应用于追踪森林砍伐、预测农作物产量、检测和监测温室气体等新任务。IBM和NASA的研究人员还与克拉克大学合作,将该模型用于时间序列分割(time-series segmentation)和相似性研究等领域。
此次发布紧随双方在今年早些时候联合发布的AI模型,后者旨在加速卫星图像分析、推动科学发现。这也是NASA为期十年的开源科学倡议的一部分,该倡议旨在建立一个更为开放、包容、协作的科学共同体。
此次发布的地理空间模型借助了IBM基础模型技术,是IBM创建和训练可用于不同任务、实现多情境下信息应用的AI模型的一部分。今年7月,IBM宣布其AI和数据平台watsonx开始正式上市,它旨在基于可信任的数据,帮助企业扩大和加速领先AI技术的影响力。作为IBM watsonx的一部分,该地理空间模型的商业版将于今年晚些时候通过IBM Environmental Intelligence Suite(IBM环境智能套件,EIS)推向市场。