音智达孙晓臻:Amazon SageMaker解决了人力和技术架构方面的挑战

上海音智达信息技术有限公司(音智达)是一家在数据领域耕耘了近二十年的老兵,主要为企业提供大数据和机器学习的具体实施和落地服务,随着人工智能的快速发展和应用,一些新的问题开始显现,比如人才的问题、技术架构复杂的问题、运维管理成本高的问题等。

音智达有多年的数据服务经验,非常了解企业的应用现状和需求,也看好数据平台在云上的优势,在使用亚马逊云科技机器学习服务Amazon SageMaker之后,有效解决了音智达在提供务过程中遇到的问题,对于音智达提升自身服务能力起到了明显作用。

企业对于数据服务的认识在变化

大数据和机器学习这类数据服务本身非常的高大上,但实施落地起来却总绕不开一些具体问题,比如什么是真正的需求、对应需求应该选择什么样的方案、如何一步步落地实施,最后与业务结合并用起来。

音智达帮助企业落地大数据和机器学习,其主要工作内容就是方案的具体实施和落地,同时也提供大数据软件产品和数字化转型的咨询服务。作为数据领域的一个老兵,音智达有接近二十年的从业经验,音智达见证了许多应用中的变化和面临的新挑战。

首先,企业数据构成在变化。音智达CEO孙晓臻表示,五年前,即使是500强头部客户,他们的平均数据量大约也只有10TB,基本都是ERP、CRM这类数据。五年后的今天,平均数据量基本上都在200TB以上,部分公司甚至有1PB数据。

原来,真正增长的数据量既不是ERP,也不是来自CRM,而是非结构化数据。许多企业正在往互联网电子商务发展,因此,企业收集了越来越多的与客户相关的行为数据,企业的数据构成渐渐有了互联网公司的特点,数据量的积累为数据服务的应用打下了基础。

企业应用人工智能的新阶段

企业数据构成变化的同时,数据能力与业务的结合也越发紧密。

孙晓臻表示,随着大数据和AI技术的逐步落地,对于行业知识的要求也越来越高,行业知识不仅越来越细分,这些业务知识本身也在发展,需要不断学习。这是在落地过程中发现的另外一个非常重要的问题。

同时,在落地过程中,由于做的分析越来越多,使得企业对于数据价值的期望值也越来越高,当一些分析无法满足期望值时,部分企业对于数据服务的信心在下降。作为数据服务落地的服务商,音智达有时候还需要向用户证明数据分析的价值。

在孙晓臻看来,企业人工智能的应用正在从试错和实验阶段向普及阶段发展。

音智达于2016年成立数据科学家团队,过去几年有大量项目都是验证性质的,企业在验证项目是否符合其需求,一些企业也看到了其中存在的价值。在疫情的影响之下,企业开始正视在这些项目上的投入,期望项目能为其带来真正的价值。

孙晓臻表示,现在企业不满足于看到一些个亮点,而是需要真正高质量的方案,需要在丰富的业务场景下为其带来真正的业务价值,会用一个个具体的KPI来衡量这些价值。

在意识到数据服务的价值后,企业数据平台的架构也在发生着变化,企业看到了云上丰富的服务类型,也看到了云计算对于数据合规和数据隐私方面的作用,越来越多的企业认为把数据应用到云上可以给自己带来更多价值。

音智达所面临的挑战

作为入行二十多年的数据服务供应商,音智达深知行业的痛点,它所面临的挑战也是不为人所知的,孙晓臻表示音智达的挑战主要有以下这四个方面:

首先是人才的挑战,人才招聘和培养都很难,虽然每年都有大量毕业生,但想要将这些人培养到能做有意义的工作,并且长期留在公司效力其实很难。

其次是技术难度的挑战,大数据和人工智能技术在快速发展,相关的技术方案越来越多,解决一个问题可能有多种方式可用,多种工具可选。同时,要解决的问题也越来越多,服务的规模越来越大,对于平台的挑战也越来越大。此类问题都归类于技术难度的提高。

第三个问题在于部署和运维的成本,许多企业并不想在部署和运维上花太多精力,同样对于音智达来说,也不想耗费太多精力。

最后一个问题在于没有高性价比的,缺乏可扩展性的服务平台,而在有了亚马逊云科技的Amazon SageMaker之后,这个问题得到了解决,而且,解决的不只是这一问题。

孙晓臻表示,当人才的问题、技术架构的问题以及部署运维等问题无法在短时间内自行解决,不如找一个像亚马逊云科技这样的合作伙伴。

亚马逊云是全球最大的公有云服务商,同时提供了功能完备的数据服务平台,孙晓臻认可数据平台云化的种种优势,看好数据平台云化的发展趋势,在2017年就开始与亚马逊云科技展开合作,其AI能力也很快得到了亚马逊云科技的能力认证。

与亚马逊云的合作应对挑战

音智达对于亚马逊云的机器学习服务AmazonSageMaker非常满意,在孙晓臻看来,这不只是一个一站式的数据科学平台,而且是一个能快速构建用户所需机器学习能力的平台。

音智达在服务过程中,首先会去了解企业为什么需要人工智能,要用在什么场景,要解决什么业务问题,然后再关注具体实现的问题。搞清楚用户需求之后能在亚马逊云上用SageMaker快速构建机器学习服务架构,即使是面对不断变化的需求,都能快速构建这种服务架构。

孙晓臻坦言:“某种程度上我们是通过亚马逊云平台提供的AI/ML能力,才真正掌握了怎样服务客户和怎样实施落地的办法。”

SageMaker节省了音智达的人员使用成本,或者说是提高了人员的工作效率。

通常而言,一个机器学习服务要落地需要这样几类人,一类人负责消化需求,一类负责数据工程相关工作,一类人负责主攻算法,还有一类负责机器学习应用的开发、运维和调试,还要有人负责工程实施落地。

而在有了SageMaker之后,算法专家可以专做算法,数据工程人员可以专心准备数据,应用开发人员无需关注如何实现高并发,运维人员无需过渡关注如何配置和优化资源,也无需特别关注如何保证数据安全性。对于音智达来说,无疑是减少了人员成本。

当效率提升之后,音智达就可以将更多精力去了解用户需求,把更多精力放在更多细分场景中,去消化和满足更多样化的需求,通过亚马逊云科技机器学习平台,成功解决来自人才、技术难度等方面的挑战。

结语

笔者也曾亲手体验过Amazon SageMaker,它提供丰富全面的机器学习能力,即使是对机器学习并不熟悉的人,也能在短时间内训练出一个机器学习模型,当然,想要训练一个有意义的,有价值的模型自然需要做许多有针对性的优化。

如孙晓臻所言,SageMaker提供的服务梳理了机器学习的一套落地流程,它提供各种代码和计算资源,能让人在准备好数据之后,快速将算法转变成可用的模型,如果用户需要速度,那云平台将能提供最快的速度。

从实施的角度看,如果用户要的是数据安全,那么云上关于数据安全合规有一套非常成熟的体系,能满足绝大部分用户对于数据安全的需求。

最后,对于任何想要尝试,并考虑将机器学习作为业务能力的一部分的话,SageMaker都是现阶段最不错的选择,能让企业在很短的时间内看到新的可能。