前段时间,在甲骨文数据 · AI 论坛上,听到一个有趣的房屋图像特征理论,讲一个人在选住房的时候,把整个房屋选型拆分成屋顶类型、内部装饰、楼层数、建筑材料几个特征去分别挑选,也就是每个特征筛选要用到不同的数据库,整合过程复杂耗时。
而甲骨文分享这个理论,是为了展示其在AI和数据库结合方面的优势——不是集中在大语言模型的训练和推理,新的Oracle Database 23ai 融合数据库是专注在应用的数据处理和管理上的能力。
甲骨文融合数据库把各种数据向量化,就像是把房屋的不同特征分解成数据向量,每个向量代表房屋的一个特征。然后把这些向量化数据在数据库中拆分、筛选和连接,再通过SQL语言,对这些数据进行高效处理和管理。
在AI应用开发中,数据的整合、向量化、处理和连接都是必不可少的环节,甲骨文融合数据库提供了一整套解决方案,帮助企业在整个AI开发生命周期中高效管理和利用数据。
甲骨文融合向量数据库的应用
在论坛上,甲骨文还演示了融合向量数据库在AI领域的多种应用,让大家了解向量数据库如何帮助企业高效处理和分析数据,从而构建专属的AI和融合数据平台。
企业构建生成式AI应用可能面临许多风险,包括管理和权限问题。因此需要做出明智的判断,明确目标和路径:
1. 自然语言交流:通过自然语言与数据库交流,可以在几分钟内开发出新应用,实现零代码开发,即使没有编程经验的用户也能轻松创建应用;
2. 文生SQL:通过大模型训练和推理,系统能够自动生成SQL语言,无需人工干预。用户只需输入文本或语音,即可获得所需的SQL查询。
3. 跨越系统与地域的数据交互:甲骨文数据库能够处理向量、空间、关系数据库及语义数据,支持跨系统与地域的无缝数据交互。
23ai融合了最新的AI技术,为企业提供了强大的数据处理和分析能力。其主要优势包括:
高效数据管理:通过AI技术,Oracle数据库能够更高效地管理和处理大规模数据,提高数据利用率和准确性。
简化开发流程:开发人员可以通过简单的SQL语句,将客户数据、产品数据和AI搜索结合在一起,大大简化了开发流程。
灵活部署:23ai支持在单个数据库中处理向量数据和其他工作负载,简化了多套数据库的部署和管理。
强大的APEX平台:甲骨文的APEX低代码开发平台面向全球850,000名开发人员提供支持,已创建了两千多万个应用。新的APEX AI小助手能在不到两分钟的时间内教会用户使用SQL,实现快速商业化。
在采访中,甲骨文公司中国区技术咨询部高级总监李珈列举了一个真实的用户数据整合挑战。
客户应用场景涉及多种数据库的使用,比如MongoDB用来存储标签信息,MySQL保存用户AI项目的权限和身份信息,图数据库用于知识图谱,向量数据库存储文档和等信息。这种多数据库架构使得应用整合非常困难,特别随着数据规模的增加,向量数据库的性能问题越来越突出。向量数据库通常是单线程运行,无法并行处理,导致CPU利用率低,性能表现不佳。
这个时候如果有一个平台能够将不同类型的数据整合在一起,客户会非常愿意进行数据迁移。甲骨文的现代数据平台可以解决这个问题,它提供高效的数据迁移工具,并能实现“4个Any”——Anytime(任何时间)、Anywhere(任何地点)、Any Data(任何数据)和Anyone(任何人),用不同方法将不同数据整合起来,以便简化数据管理和应用开发。
甲骨文OCI与多家企业的强强合作
在采访中,甲骨文公司副总裁及中国区董事总经理吴承杨回答了最近大家关注的,甲骨文官宣分别和OpenAI(选择使用甲骨文云扩展微软Azure AI 平台)、谷歌云(高速互联)的合作。甲骨文与微软Azure建立合作,用户可以将Oracle Cloud Infrastructure(OCI)和Azure技术结合使用,加速应用的迁移和现代化,不过和微软Azure之间的联接需要支付一个接口费用。OCI与谷歌云的合作则支持客户进行免费数据交互。这一合作为企业提供了更加灵活和高效的数据管理解决方案。
这两次合作也充分说明了OCI在计算能力和应用支持方面表现突出,能够支持大规模的AI模型训练和推理。OCI的高性能计算资源,为企业的AI应用提供了坚实的基础,并通过与微软、谷歌的合作,进一步提升了其技术优势和市场竞争力。
还有甲骨文公司中国区技术咨询部高级总监嵇小峰谈到和英伟达的合作,称在AI训练过程中,尤其是处理大语言模型时,GPU资源的需求非常高。尽管现在有MoE(Mixture of Experts)模式,但推理仍然需要大量计算资源,应用的广泛使用进一步扩大了生态系统的需求。甲骨文与英伟达在合作方式与其他企业有所不同,在一些核心服务的落地,两边的产品部门都有深层的合作,这种合作方式提升了整体解决方案的效果。
此外,甲骨文OCI从第一天起就致力于提供先进的AI和HPC基础设施,甲骨文专门做了网络的优化,构建了一套无损网络体系,让整个GPU的可扩展性变得更加强大。凭借新的OCI Compute裸机实例、超低延迟RDMA网络和高效能储存,OCI Supercluster的速度将显著加快。
最后
甲骨文的23ai融合数据库不仅是一款融合AI技术的数据库产品,更是一个推动企业数据价值最大化的强大工具。通过简化开发流程、提高数据管理效率和支持多种数据类型的处理,推动AI技术在各个行业的广泛应用,为企业数智化转型注入新的动力。