在华为全联接大会2024上,华为常务董事、华为云CEO张平安宣布DataArts数据治理生产线全面升级,为客户提供面向AI、以知识为中心的数据底座。
当前,很多企业的数据平台还不能很好地为大模型使用,还需要进行大量数据准备和知识抽取等工作。张平安指出,面向智能时代,企业需要构建服务于AI模型的、以知识为中心的数据底座。
为了帮助企业的数据平台能够被大模型更充分地使用,并促进更高效地进行模型训练,华为云全面升级数据治理生产线DataArts,提供面向AI、以知识为中心的数据底座,包括数据融合引擎层、数据开发治理层、知识服务层和数智应用层,通过四层架构让资源利用率和供数效率显著提升。
- 数智融合引擎层:提供数据和AI的计算平台,包括云原生数据湖MRS、数据湖探索DLI、云数据仓库GaussDB(DWS)、湖仓构建LakeFormation、数智融合计算服务DataArts Fabric等。其中,DataArts Fabric为首次亮相的新服务,可以提供一体化的湖仓库智计算平台,数据无需重复拷贝,资源利用率提升至原来的3倍。
- 数智开发治理层:全新升级后的数据治理中心DataArts Studio支持一站式提供智能化的数据集成、数据建模、数智开发、质量管理、资产管理、数据安全、数据工程等功能,内置超过60个智能算子,高效处理结构化数据和包括文本、图像、视频等全类型的非结构化数据,大模型供数效率提升10倍。
- 知识服务层:功能内置于DataArts Studio,提供知识抽取、知识构建、本体建模、数智工作编排、算法模型管理等知识湖服务,让模型训练和微调更加精准。
- 数智应用层:提供知识问答、知识洞察、智能决策等功能,通过智能数据洞察DataArts Insight和全新升级的企业搜索服务KooSearch让企业决策效率实现百倍提升。
华为云DataArts是一站式智能化的数据治理生产线,为企业提供云原生、湖仓一体、存算分离的云服务产品组合,包含分布式数据库GaussDB、云原生数据湖服务MRS、全托管Serverless数据湖探索服务DLI、全场景一站式的数据仓库服务GaussDB(DWS),以及基于华为数字化转型经验打造的数据治理中心服务DataArts Studio等产品。