先声教育on AWS:只为更稳定的服务

人工智能应用遍地开花是迟早的事儿,让机器来开车是难度非常大的事儿,现阶段,让机器玩游戏倒是一个不错的主意,AlphaGo大战李世石其实本质上也是一个游戏,游戏数据非常规则容易生成,容易控制,玩家玩游戏的过程就是机器在学习的过程,过程中,玩家的水平也会越来越高,哪怕水平再次也无伤大雅,我能想到的最理想的应用场景就是将机器学习应用于教学。

资本界和产业界非常看好AI在教育行业的发展前景,鲸媒体梳理的数据显示,2018Q1在投融资数量、投融资金额方面已远远超出2017Q1,其中,投融资数量为2017Q1的近2.5倍,投融资金额为2017Q13倍左右,市场逐步升温中,另外需要注意的是,本季度收并购事件27起。 

教育市场按类别分为早幼教、K12、职业教育,按学科分,有数理化、英语和幼儿编程,市场火热,先声教育是做K12市场英语的人工智能创业公司,先声教育CTO秦龙对笔者说,如今的市场已经是淘汰了一部分竞争者之后的格局了。 

先声教育成立于2016年,是一家教育领域的AI技术服务商,做的是智能语言学习,AI技术服务能力主要包括:智能语音评测技术、智能写作批改技术、自适应学习技术、智能对话技术以及情感识别五个方面,以云服务的形式把技术提供给B端企业用户,比如一些教育企业或者教育机构。而不是直接面向最终用户的,这是与许多AI教育创业公司的不同之处。 

秦龙表示,之所以提供2B的服务,一方面是因为我们对技术更专业一些,技术我们可以做得很好。另外一方面还在于,做2B的服务,可以通过教育机构把技术应用交付给学生来用。我们都知道,机器学习需要大量的数据,让用户快速用起来对于产品的升级迭代有很大的积极作用。

凭借对行业的认知,他坦言,如果做2C业务,很难在两年时间内达到100万日活。目前来看,很多国内大的教育企业的产品也没有100万日活。然而,先声教育已经做到了。 

先声教育是一家技术驱动的公司,先声名字源于在语音技术上的积累,有技术自信,先声做的业务是先从语音技术入手。

先声教育的核心竞争力在人工智能语音服务,做的是语音测评而不是简单的语音识别,语音识别有很多开源的框架和模型,而先声教育做的测评则是更深入而且有广泛应用场景的技术路线,语音评测涉及发音的方方面面,对语速,连贯性,流利度,语调,音量,停顿,韵律,语气内涵的情绪、态度都会记录,用技术模型来打分评判,而且可以给出改进的意见。

CTO秦龙与语音智能技术结缘已久,在中国科学技术大学上学期间就曾进入了科大讯飞的实验室,如今科大讯飞在中国乃至全球的语音处理方面都有领先地位,当时,他在实验室里做一些语音合成方面的工作,从中国科学技术大学毕业之后,他又去到卡内基梅隆大学读博士,所学专业也是语音识别,毕业之后加入到美国的语音教育平台Duolingo(多邻国)。 

然而,当他看到国内市场的机遇之后,毅然决定回国,开始加入先声教育。秦龙表示,我们看到国内人群在口语方面问题很大,绝大多数学生很难获得口语上的指导和提升,因为绝大多数英语老师没办法做出好的指导。

酒香也怕巷子深,2B的方向是为了让好酒走的更远,先声教育的这一做法已然奏效。 

据介绍,先声教育的客户列表中已然有了好未来集团、新东方在线、全通教育、等各种不同类型的教育公司和企业,全国加起来有数百家家企业用户,先声教育现每天服务数百万万学生,每天处理一万小时的语音数据,相当于416天不间断的时长,更大的挑战是需要应对几千甚至上万的并发请求,对稳定的服务质量有很高需求。 

虽然是在2016年才成立,但先声教育的发展速度非常快,飞速成长中的先声教育在IT基础架构上自然会考虑上云,为了向用户提供稳定的服务,先声教育选择了AWS,秦龙对AWS的易用性和稳定性非常认可,希望用比较成熟的云服务来向企业用户提供稳定的服务。

在实际应用中,先声教育主要用的是AWS的一些基础服务,计算,存储,网络资源。 

当学生发音朗读之后,系统把音频文件传输到AWS的服务商,过程中会用到CDN加速,然后数据主要的存储空间是S3对象存储,先声教育的AI系统调用的计算资源主要还是CPU,为了应对汹涌而来的高并发,自然还需要用到EBL负载均衡服务,当然,配套的还需要用到Autoscaling自动扩展的服务,计算会输出模型,最后通过API向用户提供服务,为了进一步降低数据存储的成本,先声教育还使用了AWS的归档存储Glacier来存放音频。 

秦龙本人对AWS还是比较熟悉的,除了这些基本的服务以外,先声教育还在尝试一些新的服务,比如使用了AWSPolly语音合成服务,该服务能提供多种语言的发音,在计算资源上,先声也在考虑使用GPU服务,另外,在图像识别方面,先声教育也在尝试AWSOCR服务,对新技术保持着非常开放的态度,只做自己最擅长最专业的那部分。