掌阅科技与亚马逊云科技合作,以生成式AI重塑阅读生态

奈非版《三体》上线后又引起了人们的热议,电视剧的评价褒贬不一,有的观众认为剧情节奏慢,有的则认为还原度很高。作为看过原著小说的读者,我也看了一下这部热门剧。当我发现其中有些剧情和人物关系有点记不清的时候,我开始求助生成式AI工具来进行解答。

这是目前我所意识到的,生成式AI对我看书这件事的影响。对于专业从事图书领域工作的专家来说,他们是怎么看待生成式AI,怎么看待大语言模型技术对读书这件事的影响的呢?近日,掌阅科技CTO 孙凯介绍了他对于大语言模型重塑阅读这件事的看法。

阅读行为的两次主要变迁

掌阅科技成立于2008年,是一家专注于数字阅读领域的互联网公司。自成立以来,掌阅科技致力于为用户提供高质量的数字阅读服务,并在2017年成功在上海证券交易所上市。经过16年的深耕,掌阅科技已经成为数字阅读行业的领军企业。

掌阅科技的业务覆盖国内外市场,产品形式多样,包括多种类型的APP和小程序,除了各种软件产品,也有硬件阅读器产品。掌阅科技不仅提供广泛的阅读内容,还拥有自己的原创文学平台,致力于内容的精品化和多样化。

孙凯提到,过去十余年间,人们的阅读行为发生了两次主要变迁。

第一次变迁,从纸质书到电子书。

十多年前,大家主要看的都是纸质书。2010年左右,技术的发展解决了阅读介质和存储问题。以前,每本书都得准备书架和书房,随着电子书的出现,一个小小的硬盘就能存储大量书籍。这种介质的变化不仅解决了存储问题,还带来了更多便捷的阅读体验。

第二次变迁,从PC阅读到移动阅读。

2015年和2016年,随着智能手机的普及和APP的流行,电子阅读开始从PC端转向移动端。以前,读者需要安静地坐下来看书,现在则可以在很多碎片化时间进行阅读。移动阅读的兴起显著提升了人们的阅读频率和阅读量,使得阅读市场得到了显著提升。

但在孙凯看来,这两次变迁并没有对阅读内容的可读性、体验以及可理解性,做比较触达本质的改造,只是给愿意读书的人提供了更多阅读的机会和便利。然而,随着生成式 AI时代的到来,他认为可以用生成式AI改善用户的阅读体验。

生成式AI如何重塑阅读体验

根据公开统计数据,有70%-75%的用户其实是有阅读意愿的,但最终坚持下来的不到30%。孙凯介绍称,掌阅科技通过长期的用户洞察,总结了三大主要原因。

第一,选择困难。很多用户在阅读初期不知道该选择什么书。无论是朋友推荐还是社交媒体上的信息,往往发现选的书并不符合自己的兴趣,导致很难坚持阅读。

第二,内容枯燥。即便选对了书,很多用户发现书籍内容过于枯燥,需要极强的自律才能完成阅读。类似于健身,虽然大多数人认可其好处,但能够长期坚持的人寥寥无几。

第三,难以应用。即便完成了阅读,很多用户在实际应用中发现自己对书中的内容记忆模糊,无法有效利用,导致阅读的价值大打折扣。

针对这些问题,掌阅科技认为,生成式AI技术可以提供有针对性的解决方案。

首先是读前推荐。通过对内容本身的深度理解和用户行为信号的结合,生成式AI可以提供更加精准的书籍推荐,并附带详细的推荐理由,帮助用户找到真正感兴趣的书籍。这比单纯看别人写的书评和推荐帖子要靠谱的多。

第二部分是对于读数过程中体验的优化,这部分又可以分为两大类人群。

第一类,对于追求知识密度的读者,生成式AI可以对阅读过程进行规划,缩短阅读时间,提高知识获取效率。规划后,原本可能需要读50个小时,现在可能只需要3个小时。同时,它会启发和引导读者带着问题去读,助力其提高精读能力,在单位时间获得更多信息。

第二类是出于娱乐目的来读书的人。这部分读者本身就是为了放松娱乐一下,针对这部分用户,生成式AI将图书内容以视频、有声书、图片等多元化的呈现方式,提供一些领读和导览性的内容,从而提升阅读的愉悦度和沉浸感。

第三部分叫做读后管理。帮助用户构建书籍的知识网络,便于日后回溯和复习,帮助读者更好地应用所学内容,提升阅读的实际价值。比如,我可以询问它《三体》小说里的人物关系,剧情走向等等,快速回顾和重温精彩内容。

孙凯介绍称,目前,掌阅正在努力探索应用生成式AI技术构建上述三方面的能力。这些技术手段可以解决用户在阅读前、阅读中和阅读后遇到的各类问题,使阅读变得更加便捷、高效和有趣。

掌阅科技选择与亚马逊云科技在生成式AI方面合作

看得出来,掌阅科技对于“大模型重塑阅读”这一问题经过了深入调研和思考的。从孙凯的介绍中了解到,掌阅科技与亚马逊云科技围绕掌阅科技的业务出海展开了持续合作,现在又开始利用生成式AI技术来打造新的阅读体验。

掌阅科技自2015年起与亚马逊云科技合作,将大部分海外业务部署在其云平台上。利用亚马逊云科技提供的存储、计算等服务,在全球100多个国家顺利开展业务。孙凯表示,与亚马逊云科技的合作不仅提升了业务效率,也为掌阅科技在技术探索和创新上提供了有力支持。

这次双方通过风格化模型训练,实现了“文生图”功能,根据书的内容生成有独特风格的视频。这种“一书一风格”的方式,使得用户能更好地沉浸于书籍中,提升阅读体验。此外,双方还尝试在章节中生成视频,展示前沿介绍和高光片段,为用户提供更多元化的内容呈现方式。

具体方案中,基于亚马逊云科技机器学习平台Amazon SageMaker,以及开箱即用的关于Stable Diffusion的亚马逊云科技插件解决方案,掌阅科技在文生图解决方案的开发效率上获得很大提升,具有安装便捷、可扩展性强、可协作性强的应用优势。并且基于掌阅科技图片应用量级的多少,亚马逊云科技可以为其提供弹性、可伸缩的解决方案,大幅度降低成本。

孙凯表示,之所以选择亚马逊云科技作为合作伙伴,最看重的是其丰富、安全和可靠的技术服务。长期合作中,亚马逊云科技在基础设施、合规性等方面都提供了专业支持,使掌阅科技能够自信地推进各项技术创新。

亚马逊云科技大中华区解决方案开发中心总监徐海表示,亚马逊云科技可以帮助应对落地生成式AI过程中遇到的挑战,不仅能解决数据隐私与安全方面的问题,还能帮助企业快速部署和降低成本,降低技术门槛使其更易于实施。

结束语

生成式AI对于文字,尤其是长文本的理解能力是一项非常强大的能力,它在电子阅读以及其他领域都带来了很大的想象空间。掌阅科技结合自身业务特点进行思考和创新,积极探索生成式AI的场景的做法值得称赞。

相信在未来,还会涌现出更多类似的创新场景,在各行各业落地开花。对于很多企业来说,其实不需要自己成为AI技术领域的专家,完全可以借助亚马逊云科技这样的第三方合作伙伴来快速进行创新,抢抓风口。