Informatica智能数据平台推出业界首款元数据驱动人工智能,助力数据驱动式数字化转型

Informatica公司日前宣布了Informatica智能数据平台的一系列创新功能,该平台是业界唯一一款面向数据管理和数据驱动式数字化转型的端到端平台。系列创新功能的核心是发布CLAIRE Engine,Informatica智能数据平台上的一款元数据驱动的人工智能应用。

通过智能实现数据管理的转型

Informatica智能数据平台是一个融合了Informatica多个屡获殊荣的产品和数据解决方案的智能平台,涵盖了云数据管理、大数据管理、数据集成、主数据管理、数据质量和数据治理以及数据安全的广泛领域。它是一种最全面、模块化和可扩展的可用数据管理平台。

CLAIRE —— 依托于洞察力以及人工智能核心技术,CLAIRE是业界第一项也是最先进的元数据驱动人工智能技术,它嵌入在Informatica智能数据平台中。CLAIRE将机器学习应用到整个企业范围内以及云端的技术、业务、运营和惯用数据上,为Informatica的全系列数据管理产品和解决方案提供智能化服务。元数据的转换规模和范围支持CLAIRE通过实现很多作业的部分或完全自动化为数据开发人员提供帮助,而且,企业用户能够从企业的任何地方、更加方便地定位并准备他们所需的数据。同时,数据科学家对数据会有更快的了解,数据管理员也能更方便地获得数据关系的可视化视图。

应用实例包括:

——加快数据交付。 CLAIRE能跨越数据库和非结构化文件自动推断出数据域,例如,人、产品、代码、雇佣日期、地点及联系信息。它还能对实体进行标识,例如,采购订单或健康记录,此类实体是数据域的集合。同样,CLAIRE能够从用户数据中提取数据标签,对相似的数据对象进行标识和聚类,并自动对其他数据进行标记和分类,例如,照片标签能在几千张图片中标识出同一个人。

——促进业务数据自助式服务。针对公众数据分析师和数据科学家所做项目中应采用何种数据集,CLAIRE提供智能化数据建议:它能对其当前使用的数据集进行分析,建议他们使用相似条件下的其他数据集。CLAIRE还能自动将业务术语和技术术语相关联。例如,业务术语表中的“索赔支付日期”可以与数据表的某个列关联,这些列的标签有时意义晦涩,例如,“WX-CPD-ADG221”。在为技术数据提供业务背景时,这种关联非常重要,由此,业务用户才能发现和使用数据。

Informatica执行副总裁兼首席产品官Amit Walia表示:“数字化转型颠覆了世界范围内的各行各业。数据是一项区分因素,我们生活在这样一个世界中:你要么是被数据驱动的颠覆者,要么是被颠覆者。颠覆者们都明白:智能发展的速度在赢得未来的可持续竞争优势方面至关重要,CLAIRE使用元数据驱动的人工智能将数据管理提升到一个生产率无法被超越的新水平,以至于所有企业数据都能被智能化管理,无论数据在云端,还是内部部署,而且,数据的提供速度和质量能够满足不断变化的业务计划的新要求,从而为企业提供服务。”

Informatica智能数据平台的发展势头

Informatica智能数据平台取得了多项业界第一,包括业界首款混合数据集成平台,支持Informatica的客户跨越所有部署模型、数据类型和潜在因素部署数据管理功能。此外,Informatica智能数据平台为客户提供颠覆性的混合数据管理和企业数据治理功能,这些因素对于企业在日益混合的、多云的和以数据为中心的世界中保持竞争地位至关重要。

全球用户大会上发布的新功能包括:

(1)实现混合化数据管理的桥梁 ——客户在按照自己的步调将数据和数据流程迁移到云端时,需要管理复杂的混合数据环境。Informatica智能数据平台通过熟悉的数据集成接口、工具、技能和可复用代码,为客户搭建了一座从现有内部部署环境过渡到新的云环境的桥梁。Informatica智能数据平台新集成的混合数据管理创新方法和功能包括:

——Informatica企业信息目录:类似搜索引擎的功能,可对存储在云端、内部部署环境和大数据环境中的所有企业数据进行探查、了解和管理。目前,该功能已经可以使用。新的功能特性包括自动实体探查(例如,Word、PowerPoint、PDF等文件),并提供一种新的工具,使客户和合作伙伴可以创建自己的定制化元数据扫描器。

——Informatica PowerExchange for Cloud:目前使用Informatica PowerCenter®的开发人员可以使用所有Informatica Cloud连接器,方便连接云数据资源,并在需要时自动更新连接。

——支持亚马逊网络服务(AWS)以及微软Azure:智能数据平台组件和服务包括Informatica PowerCenter、Informatica数据质量工具、企业信息目录、运营智能系统以及PowerExchange for Cloud,可以在亚马逊网络服务(AWS)和Azure上使用。

(2)业界第一个对大数据提供支持——大数据管理应用开发人员的开发效率取决于他们应用最优及最新技术的能力,且无需成为样样精通的专家。Informatica智能数据平台提供的全新的大数据管理功能包括:

——支持Spark 2.0和卡夫卡流:Informatica是2016年12月以来第一家支持Apache Spark 2.0以及实时集成Apache卡夫卡分布式流技术的厂商。

——附加的大数据技术支持:Informatica还增加了对新出现的重要大数据技术的支持,例如Spark DI completion、MapR BD、SQOOP及Teradata TDCH。

——Informatica PowerCenter的互操作性和可复用性:PowerCenter映射可以被优化,以运行在Spark大数据环境中。

——基于亚马逊网络服务(AWS)和Azure的Informatica大数据管理应用:点击一次就可以在亚马逊网络服务(AWS)和Azure上安装大数据管理功能。

(3)为可信数据提供单一的应用包:综合化企业数据治理——跨企业的端到端数据治理至今仍然是一个难以企及的目标。Informatica Axon是业界第一种完全集成化的企业数据治理解决方案,目前,该方案已作为一项搭建在Informatica智能数据平台上的统一功能提供给客户。Informatica Axon是一款独一无二的治理产品,考虑了所有客户群体以及技术和业务因素,能够有效地对机构数据进行治理。Informatica Axon与Informatica数据管理解决方案集成在一起,包括数据质量、主数据管理、大数据和云。