数字科技正逐渐渗透到经济、商业、社会生活方式等方方面面,人们对于数据智能时代的 来临充满了期待。然而,从现阶段的发展来看,我们距离真正的大数据时代仍有距离,各行各业的数字化转型进程未能如期落地。
数据的力量究竟该如何激发?
基于这一问题,在大数据系统软件国家工程实验室的指导下,和鲸科技携旗下中国领先的第三方数据竞赛平台“和鲸社区(Kesci)”,联合AWS,共同发布《数据竞赛白皮书》(以下简称“白皮书”),分析全球市场数据竞赛发展趋势,提出对数据竞赛推动前沿技术落地的创新价值思考,并在业界开源优质数据竞赛运营方法论与最佳实践。
和鲸科技搜集并整理了1000场全球竞赛数据、1000余份参赛者问卷调研、几十位行业专家及企业办赛负责人的访谈、超过1200小时的分析研究,共同打造并发布了这份《数据竞赛白皮书》。白皮书分为《数据竞赛白皮书·上篇·1000场竞赛的深度分析》和《数据竞赛白皮书·下篇·办好一场竞赛的实操手册》两部分。
全球数据竞赛市场已经历了20余年的探索,其发展起点可追溯至1997年由国际顶级学术会议KDD(Conference on Knowledge Discovery and Data Mining,知识发现和数据挖 掘会议)推出的KDD Cup。此后,一系列国际顶尖学术会议也陆续牵头组织数据竞赛。
国际顶会数据竞赛往往会积极兼顾市场应用的需求,通过与企业、政府机构合作,聚集当 下技术与数据应用中的难点寻求解决思路,不断缩短科研成果与落地应用之间的距离。创立于2010年的Kaggle作为目前全球最大的数据科学技术分享社区,更是为数据竞赛的平 台化发展奠定了模式化基础,其合作伙伴除了Google、Facebook、Airbnb、Yelp等互联网时代诞生的独角兽,亦不乏Walmart、Airbus、Genentech等声名日久的传统行业领头羊。
放眼中国市场,数据竞赛自2014年萌芽以来,数量每年以翻倍之势增加,主导者不乏权威的科研机构与高校,亦有来自各行各业的领军企业。身担城市管理与民生重任的政务机构也在“大众创业、万众创新”的政策驱动下,开始意识到数据的力量,牵头组织了多场型数据竞赛。 在这样的大背景下,2015年,和鲸科技的前身Kesci科赛网创立开始,这是中国最早的数据竞赛平台之一,很快就发展成为中国最活跃的数据科学社区。
此次,在大数据系统软件国家工程实验室的指导下,和鲸科技通过《数据竞赛白皮书》这一载体,系统性地梳理了“数据竞赛”这一持续二十年,并在大数据时代迅速窜红的数字化创新模式。
白皮书指出,数据竞赛绝不仅仅只是“主办方发布赛题、传播品牌美誉,参赛者参与开发、收获丰厚奖金” 的公关活动。对双方而言,数据竞赛已经成为了数字化转型的“云端实验室”。赛事主办方紧跟数据智能的发展趋势,通过挖掘数据价值的场景和树立“数据+算力+人才+算法” 的价值闭环,积累数据科学研发的核心能力;参赛选手能够积累如何在真实业务场景中应 用先进技术的实际经验,在与众多高手的交流切磋中不断成长。