行业怎样结合大模型,Oracle Database 23ai带来新的思路

“五一”小长假期间的5月3日,Oracle发布了 Database 23ai,也意味着Oracle数据库从此告别23C,迎来23ai的时代。

从Oracle Database 23ai的命名上,就彰显了拥抱AI,或者说拥抱GenAI(生成式)AI的主题。

拥抱GenAI,不能简单理解为“Database + GenAI”,在+ GenAI之外,Oracle Database 23ai还有更重要的思路。

甲骨文公司副总裁及中国区董事总经理吴承杨指出:如果把GenAI大模型看作是电,大模型要产生价值,还是需要借助应用,就像电报、电话、电灯一样,核心在于数据价值的挖掘与应用。

如何挖掘数据价值?从应用着手,还是从数据入手,前者会比较复杂,Oracle则选择了后者。

既然从数据入手,我们可以看看从哪些数据着手:

第一个是从向量数据入手,在去年的2023 甲骨文全球云大会(Oracle CloudWorld 2023)期间,介绍过向量数据和数据库机构数据的结合,最典型的就是房地产图片,局部特征(如屋顶类型)和售价的结合(参见:《Oracle集成向量数据库新用法》一文。)

第二个是JSON格式数据。如今,以MongoDB为代表的一些NoSQL数据库,以及Web 前后端应用之间,多采用JSON(JavaScript Object Notation, JavaScript 对象表示法)这种轻量级数据交换的格式,以键值对的方式,用文本形式来表示结构化数据。新应用的不断增加,JSON数据格式是企业的数据财富。

第三个是类似图数据库所处理的图谱数据的检索和查询。

一句话,数据类型是多种多样,所谓业务创新就是对不同类型数据进行组合、挖掘和使用。

接下来的问题,我们采用什么样工具或者手段来使用这些数据。

大模型会是我们的手段吗?现在一种流行的说法是:一切尽在大模型,大模型解决一切问题。但是对于企业而言,数据就是企业的财富,安全性是首要的问题。大模型与企业数据的结合,或者企业训练大模型,都是比较复杂的问题。这就是从应用层面解决数据的问题,这会比较复杂,需要专业人才和经验。

另外一种使用数据的方法就是Oracle Database 23ai的用法,简单说就是结合了大模型的融合数据库的用法,也可以简单立即为用SQL对各种数据进行组合和查询,用SQL查询向量数据、JSON数据,以及各种图谱数据,各种方式的组合查询。不同方式的组合查询需求,会支撑起不同的业务应用和需求。如果不会用SQL怎么办?在这里大模型就派上了用场,你可以使用自然语言,大模型会帮助你生成SQL。

Oracle Database 23ai中的大模型生成SQL,SQL生成数据或者说找到数据,数据创造价值,是不是非常符合中国道教“一生二,二生三,三生万物”的思想。Oracle Database 23ai就给我们带来了这样的一种思路。

简单说,就是一个数据库解决各种数据创新使用的需求,这个就是所谓融合数据库。

除此之外,还有很多使用中的具体问题需要解决,如SQL的安全性问题,防范未经授权的 SQL以及SQL 注入攻击;如数据主权所要求的数据本地驻留的问题,确保数据在本地,同时公开给多个应用使用的问题;如利用内存高速缓存数据中间层的问题,……,这些都是具体应用场景中使用时遇到的问题。

在最新发布的Oracle Database 23ai中,提供超过 300 个新功能。

据甲骨文公司中国区技术咨询部高级总监李珈介绍,这些功能可以分为三类:面向数据的 AI、关键任务数据、面向应用的加速开发。其中,用户可以重点关注Oracle AI Vector Search、Oracle Exadata System Software 24ai、OCI GoldenGate 23ai、JSON Relational Unification、Graph Relational Unification、Oracle Globally Distributed Database with RAFT、Oracle True Cache,以及In-Database SQL Firewall。这些功能对应以上所说的数据,以及数据的使用。

我认为最有价值的就是Database 23ai 引入的AI Vector Search,这不仅仅是一项强大的新技术,帮助用户利用新一代 AI 模型来生成和存储向量,更重要的是这个向量数据是跟原有的Oracle数据库里面存储的业务数据放在一个数据库里面。这些向量是文档、图像、视频、声音等的多维表示。通过将这些对象编码为向量,用户可以使用数学计算来查找它们之间的相似性。Oracle新的向量函数可以利用数据库能力直接生成向量数据,Oracle Database 的关键任务功能可以与 AI 向量透明地协同工作,即使是非常关键的任务应用,用户也可以运行 AI Vector Search。通过在同一高性能数据库中存储和处理业务和向量数据,用户可以将 AI Vector Search 无缝集成到现有业务应用中,实现新的创新 AI 使用场景,并且不会影响数据安全性。这样无须移动数据,无须把数据提供给一些专门做AI数据处理的第三方,客户在自己的数据库上就可以采用AI能力,直接用SQL来实现,大大加速了AI应用的落地。

这是一个大模型备受关注的时代,如何使行业业务应用快速对接大模型技术,Oracle Database 23ai给我们做出了示范的同时,也带给我们了一种使用数据的方法。

殊途同归!哪个简单,就用哪一个!