亚马逊云科技Matt Wood:Amazon Bedrock可显著减少大模型幻觉,解锁生成式AI的价值

当用户输入一张草图,AI模型就能在提示词的帮助生成图片,或是一张张装饰效果图,或是一堆精美的游戏道具图标,或是可以启发设计灵感的参考图。这是Stable Diffusion爱好者都非常熟悉的,类似的Midjourney也是可落地的生产力。

不可否认,基于大语言模型的AIGC已经可以作为生产力了,但大模型的幻觉问题阻碍企业在生产环境中落地AIGC,生产力距离真正落地仍差一步。

ChatGPT凭借超强的理解输入文本的能力,还有超强的推理能力,顺理成章成了AIGC界的顶流。它可以回答很多知识性的问题,可用在教育领域,它能做翻译,能写代码,能创作各种文字相关内容,可以替代或者辅助很多人类的智力劳动。

以前,当有什么不懂的问题时,总会优先考虑求助搜索引擎,而现在,很多人,包括我的第一反应都是求助ChatGPT。当我想初探某个领域时,会听听ChatGPT的介绍,当我对某领域有较多认知时,也会看看ChatGPT是怎么说的。

显而易见,AIGC已经表现出了生产力,然而,这距离企业需要的生产力还有一点距离。

首先,以GPT-4为代表的大模型本身,由于缺少对企业业务相关数据进行训练,所以,很可能无法帮助企业解决很多具体问题。

同时,大语言模型的“幻觉”问题会自信地杜撰很多不存在的东西或者根本是错误的信息,其根本原因是,模型并不真正理解它们正在处理的语言,它们只是在模仿训练数据中的模式。

当然,除了这两大类问题,企业在使用大语言模型时候,还应该注意数据的隐私和安全问题,要遵守相关的数据保护和隐私法规。

在2023年的亚马逊云科技中国峰会上,亚马逊云科技全球产品副总裁Matt Wood博士表示,如果用户使用Amazon Bedrock的话,这种自信满满回答全错的情况发生的概率会被大大降低,因为用户可以使用自定义数据。

Amazon Bedrock是一项托管大语言模型的Serverless服务,用户通过API来使用这些模型,用户可以自己选择要使用的模型,也可以使用用自定义数据微调过的模型。此外,亚马逊云科技的用户可以配合原来就有的Amazon SageMaker相关功能。

Amazon Bedrock是2023年4月宣布的新服务,它有选择地支持AI21 Labs、Anthropic、Stability以及亚马逊自己的Amazon Titan模型,这几个都是支持负责任的运行,都可用于微调的底模型,企业在使用时候灌入自定义数据。

当企业使用自己自定义的数据时,用于训练的数据会相对更充足一些,企业可以提高数据质量、提高数据的多样性来提高输出质量,多样性和代表性的训练数据可以帮助模型更准确地学习和预测,都有助于减少大模型的“幻觉”。

从Matt Wood博士的介绍中了解到,亚马逊云科技非常注重负责任地运行这些人工智能模型,以确保它给出的答案和解决方案不会对用户产生伤害。既会对输入的内容进行筛查和过滤,也会认真地核对模型产生出的答案,以确保给出的回复是健康无害的。

为了实现安全和私密的模型微调(Fine-tune),亚马逊云科技发布了自己的大语言模型Amazon Titan,Amazon Titan包含一系列不同的模型,可实现文本归纳总结、搜索结果嵌入、有害内容删减等,用户可以非常安全、隐私地对这些模型做优化和微调。

在亚马逊云科技的客户群中,大语言模型已经落地成了生产力。某国际智能营销服务商在广告内容分发服务中使用了Amazon Bedrock,使用后,该企业在电商视觉产品成本方面节约了50%的成本,广告点击率提高了45%,实现了明显提升。

2023年前后爆发的大语言模型技术潮流,让科技互联网领域的厂商争相进入大模型备战模式,国内外的大型科技互联网公司都推出了大模型或者基于大模型的应用。

对于亚马逊云科技来说,作为云服务提供商,它想在大模型上取得的成功,终究还是要落在公有云业务的成功,换句话说,就是要让用户更便捷地用上AI和大模型技术,这就要提到一个个具体的服务。

除了刚才提到的大模型托管服务Amazon Bedrock、大语言模型Amazon Titan,亚马逊云科技还有Amazon SageMaker在线机器学习训练平台,还有为提高机器学习模型训练和推理效率的定制芯片,以及多种基于英伟达、英特尔等AI芯片的Amazon EC2实例。

在Matt Wood博士看来,将亚马逊云科技的多种服务联合在一起,亚马逊云科技提供的便是“从未有过如此简单、低成本的,借助机器学习进行代码构建的方式”。

亚马逊云科技技术部门的一位产品经理,利用Amazon Bedrock在很短的时间里就开发了一个个人理财的APP,开发过程中完全不需要写代码。

这款APP有很强的归纳总结能力,在获知用户收入和支出情况的前提下,用户可以直接向APP提问,它可以基于上下文进行对话并返回一些结果。比如,可以找出交易中的异常,能向用户提供财务状况和趋势的信息,预测某项支出的趋势,给出理财建议等。

在帮助企业落地生成式AI方面,亚马逊云科技还有一个备受关注的AI编码服务Amazon CodeWhisperer,它支持以写自然语言的方式写出注释,基于注释内容操控机器学习模型生成对应的代码。

Amazon CodeWhisperer支持15种编程语言,支持检查软件的许可信息,支持做代码安全检查,可以帮助节省开发时间并提高代码质量,而且,这一切对个人用户而言都是免费的。