有数,有底,让教育科技创新绽放

 转型有数,发展才能够有底。数字化转型的今天,这已经成为一种普遍共识。

让我们聚焦到教育科研领域,这里的转型有数到了什么程度?有哪些经验可以分享呢?

数据超越想象 应用异彩纷呈

中国农业大学网络技术中心副主任兼总工程师劳凤丹分享了一个农学方面的案例。

“目前的农业和我们传统理解农村农业已经不是一个概念了。现在的农业已经实现了机械化转型,并结合大量信息化技术。以中国农业大学农机大数据平台应用项目为例,它将全国30多万辆农机数据通过物联网平台,全部收集起来,进行数据分析,从中了解农机分布规律、作业情况,分析它们的工作效率,了解农田分布、作物种植等数据信息。相关管理部门,可以以此数据作为依据,作为各种农机补贴的参考指标,从而提高农机补贴的精准和有效。” 劳凤丹介绍说。

据了解,如今大量的农业机械都装上北斗GPS定位,相关数据会实时返回到生产制造的企业,农大农机大数据平台与之进行数据对接,然后通过智能算法对数据进行分析,了解农机是在道路上运行还是在田间作业等,大数据平台会展示农机热力图,辅助主管部门决策。

苏州大学基础医学与生物科学学院特聘教授、博士生导师李玉梅博士分享了生物医学领域的案例。

李玉梅表示:基因测序经过十多年发展,如今已经迎来了第二代测序技术,也就是高通量基因测序数据,其主要特点是速度非常快,几个小时基因组就可以测完,价格也非常低。以新冠病毒测序为例,可在10分钟内输出新冠病毒变异位点的基因注释、变异支系鉴别、全长序列等。

高通量基因测序数据量非常大,24小时就能产生20TB以上的数据,这些数据需要被完整保存,用于临床检测和医药科学研究使用。

“我们不希望数据出现问题,如果数据有什么问题,也希望能够通过技术手段能够进行恢复。” 李玉梅说。

浪潮信息存储产品线分布式存储总经理姜乐果也分享了清华大学小鼠实验的案例。

“清华大学某个项目涉及到小鼠大脑的实验分析,透过28个1200万像素摄像头高速捕捉小鼠大脑的神经元映射信号,每1秒钟拍摄30帧,连续拍摄48个小时,不能丢失任何一帧信号的图片。现在国内设备很难达到这样的要求,为此,浪潮信息搭建了一个存储镜像系统,完全一比一模拟实验环境,系统持续运行了3个月,最终获得了清华大学课题组的认可。与此类似,复旦大学的内脑研究、华中科大的机器研究项目,都采用了类似的存储方法,满足了科研的需求。”他说。

人工智能推高数据存储需求

当今时代是一个人工智能的时代,也是一个大模型算法流行的时代。作为科研创新的主导力量,高校在人工智能的研究和使用上始终走在行业的前列。

劳凤丹在此分享了人工智能在畜禽养殖方面的应用案例。

“我们透过人工智能猪脸识别技术,对个体进行识别;结合音视频,结合猪的具体情况,采取区别对待的策略,例如我们能够知道哪些猪是偏弱小的,我们通过一些方法提供额外的饲喂等。此外,透过人工智能数据分析,可以掌握猪的瘦肉率。” 劳凤丹介绍说。

她表示:“以往测猪的脂肪含量,需要把猪屠宰了,这样你没有办法选择适合的猪进行育种。但如今不同了,借助人工智能等额外技术手段,就可以活体获得这些数据,从而赋予了行业更加广阔的市场空间。”

人工智能技术的广泛应用,必然加剧对算力、低成本存储的迫切需求,高校业不例外。那么,有哪些有效技术手段可以缓解这些矛盾呢?

“采用大容量的单盘,这是一个最简单的办法。” 姜乐果肯定地说。

姜乐果表示:“我们可能用20TB单盘,这是目前磁盘单盘的极限容量。此外,还可以考虑融合架构,比如某些课题数据总量有50GB,但会有很多人会使用这个数据,很多时候,他们会把这50GB拷贝出来自己用,从而带来了数据10、100倍速的增长,造成存储资源的浪费。如今,融合架构的方式,用户就可以共享底层同一份数据,可以用文件去读,也可以用对象、用大数据去读,一份文件多种用途,数据操作产生的新数据,仅仅保留增量的部分,从而把整个实际的采购成本大大降下来。”

对于高校而言,降本增效的关键是存储。

如果存储配备不合理,性能调整不到位,计算就会出现卡脖子的问题。堪称一招不慎,则全盘都处于被动,应该引起足够的重视。

小结

有数,有底,原本以为只有互联网,可以把持。没有想到,教科研领域超越想象,数据创新应用异彩纷呈。没有最好,只有更好,展望未来,从农业、到健康;从饮食,到养生,超越学科的数据创新,会带来怎样的美好世界。有数,有底,精彩超越想象。

     (受篇幅限制,文字所能够呈现的内容,也只是冰山的一角,更多精彩内容,请收看“有数、有底,让教育科技创新绽放”视频专题栏目。)