7月19日,历时3个月的中国大数据算法大赛京东赛区——京东JDATA算法大赛正式进行决赛及答辩。本次大赛各界算法精英能够通过创新为业界贡献价值,应用算法推动实体经济的发展,使大数据的价值真正落地到推动电商战略发展,从而真正实现数据的落地。
中国大数据算法大赛可谓是国内顶尖、高规格赛事。大赛由京东联合中国信息通信研究院、联通大数据有限公司、中国高等教育学会、中关村加一战略新兴产业人才发展中心共同举办。参赛人员上涵盖了211、985大学以及国外选手参与,共计4801支参赛队伍,5182名选手参与本次大赛。入围前十的队伍分别为Trident、DANT、朵拉公波鲁、WTF、皱眉可达鸭、何以解忧、D国反击战、WhyK、珞珈山第一菜鸡、最后一波咯。
据介绍,专家评委依据选手在JDATA智汇平台上提交的数据成绩,并结合其现场表现予以评分。最终Trident团队斩获大赛冠军,独得50万大奖,朵拉公波鲁、DANT分获亚军和季军,分别获得10万和5万奖金。
京东作为中国最大的自营式电商,拥有中国电商领域最完整、最精准、价值链最长的数据,这为大数据、算法等新技术提供了大量的实际应用场景。本次大赛赛题也是基于京东的真实数据和真实场景设计赛题,体现了大赛的专业性和独特性。京东希望携手广大参赛者一起,用技术的力量为实际应用落地提供创新思路,为更多的消费者提供极致用户体验。
“京东一直致力于成为一家真正的技术和创新驱动的企业,利用技术使零售效率更高,成本更低,用户体验更好。”京东集团高级副总裁马松表示,中国大数据算法大赛京东赛区——京东JDATA算法大赛正是希望借助这一舞台,激发算法创新、释放数据价值,引爆新生代的技术力量,为实际业务落地提供更多创新、卓越的算法模型和思路,也为中国零售行业变革挖掘更多优秀的技术人才和中坚力量。
激发算法创新
本次大赛的赛题也是紧贴实际场景,让算法为实际业务带来价值。“如期而至”是今年的赛题,参赛选手要判断出消费者大概率会再次购买的商品,通过京东用户在线一年以上的购买数据来预测未来一个月是否会购买相同产品,甚至预测哪天进行购买。
赛题对于电子商务和京东而言,都是具有深远意义和帮助。通过大数据分析可以在用户正需要复购商品时给予提醒,提高京东商城的用户体验,带来用户粘性和用户购买的价值增长。
今年的赛题和去年赛题在语言描述上颇为相似,但从解题思路和结构上都有很大差异,如果用去年的思路来解题会出现一些偏差。京东交易平台高级算法工程师李凯东表示,去年的赛题更看重购买决策前一段时间的用户行为,以至于进行决策购买,而今年的赛题更看重买了再买,也就是复购,其实是两个完全不同的题目。
我们知道一个智能算法模型并不能解决所有的问题,上一届的赛题更适合3C产品,这一届更适合消费品,两者拥有完全不同的特性,所以针对不同的品类做用户感知需要使用完全不同的算法模型。
京东基础架构部首席研究员郑志彤认为,针对每一个品类进行的数据探索,最终的目的都是整体的推荐系统,推荐系统是一个整体的模型,对交易行为进行探索最后纳入整体推荐系统。
到目前为止,京东已经使用了大量的算法模型,所以单纯从算法的角度所做的优化并不是很多,但从运营角度还有很多优化空间。因为算法和传统功能是不同的,其是一个无限不断趋近于一的过程。
释放数据价值
复购是针对某一消费品,预测用户多长时间会再次购买,用户则希望电商网站把最需要的商品展示在最希望看到的位置,这也是赛题设计的初衷,让用户在京东的购物体验会更加自然和流畅,不是强迫而是需要。
最终用户在京东App上看到的都是他希望购买的商品,甚至可以让用户养成习惯,打开App就能了解我现在有哪些商品需要进行复购,当然除了App还有短信等方式触达到消费者。例如京东App提醒您您家的醋还有两天就要用完,应该进行采购。
对于京东而言,在复购上已经有了一套完善的算法,本次大赛京东更希望看到一些不同思维方式。李凯东指出,复购是一个多元化的思维方式,并不能说只有一个模型能做到最好,所以我们要做的是把好的思路融合和吸收到现有模型中。
当然一旦产生优秀的算法京东通过优化后也将使用到现实的生产环境中,因为复购的场景是多元化的,App之外也有很多渠道可以让用户去感知。本身京东内部的算法迭代速度很快,以李凯东所在的团队为例,根据实际情况一、两周就会进行模型的迭代。
未来京东也将以中国电商领域最完整、最精准、价值链最长的数据,持续为大数据、算法等新技术提供大量的实际应用场景,通过算法的迭代优化,让数据更有价值,实现消费者购物体验的提升。同时以成熟落地的技术应用为行业、为合作伙伴赋能,让更多消费者感受到大数据算法带来的便利。
培养数据人才
中国大数据算法大赛也是一个选手和企业交流沟通的桥梁,所以在比赛之初京东就建立了两个QQ讨论群,同选手进行深入的沟通和交流。通过不定时收集问题,进行部分问题的解答,同时京东的算法大牛也进行了两期视频直播帮助参赛选手理解赛题。
不同于其他比赛的一点在于,中国大数据算法大赛是一个综合能力展现的比赛。所有数据并不能直接在模型中跑出结果,需要经过数据的探索对业务进行结合,这也增加了比赛的复杂度和变化,选手可以通过多种方式解题,进一步考验了选手的思考能力,以及对数据模型的把握。
冠军队伍Trident选手龚毕经虽然没有参与过相关比赛,但他经常观看国际比赛,对于大赛中的分享他尤为关注。他认为,中国大数据算法大赛京东赛区是国内比赛中非常重视分享学习的平台,最开始团队也并没有太多的经验和想法,但通过两次直播辅导反复理解赛题,也让他们获得了此次大赛的冠军。
“今年的赛题非常有意思,是一次不同的体赛体验。”亚军队伍朵拉公波鲁选手吴远皓说,大赛给出的是原始数据,需要去做一些探索才能得到解题的数据,之后还要做特殊工程,整个链条会比普通比赛长。而且赛题还与企业的具体业务结合,让我们可以真实的体会电商的业务场景。
季军队伍DANT选手王昊天非常兴奋可以通过中国大数据算法大赛理解真实的电商数据,这也是平时不曾接触的领域,从实际场景出发对数据进行分析,然后实现自己的想法。
未来京东还将持续举办算法大赛,实现比赛和业务、人才引进之间的有效联动,JDATA智汇平台将成为京东未来持续对外输出算法能力,赋能行业与算法爱好者,打造技术影响力的重要渠道。京东将与合作伙伴一道,利用JDATA智汇平台,引入更多高水平算法比赛,为中国大数据、算法、人工智能领域挖掘出更多更好的优秀人才。
同时为客户提升消费体验是京东甚至所有电商企业在不断追求的,这就要求不断对算法的迭代优化,体现数据真正的价值,并且将这些成熟的技术落地,为行业持续赋能,为更多消费者带来更多便利。