火山引擎DataLeap:支持万级表的数据血缘图谱,是如何实现的?
数据来源广、量级大、场景多,导致数据之间关系变得异常复杂。 经过读取、清洗、存储、计算等一系列流程之后,数据最终汇入指标、报表等服务系统中。但如何对数据溯源、跟踪变化,成为困扰数据研发工程师的难题之一。 数据血缘描述了数据的来源和去向,以及...
数据来源广、量级大、场景多,导致数据之间关系变得异常复杂。 经过读取、清洗、存储、计算等一系列流程之后,数据最终汇入指标、报表等服务系统中。但如何对数据溯源、跟踪变化,成为困扰数据研发工程师的难题之一。 数据血缘描述了数据的来源和去向,以及...
近日,火山引擎数智平台VeDI直播活动「超话数据」在线举办,来自火山引擎DataLeap数据产品专家从数据治理与管理,企业数智化升级等角度,分享了DataLeap在字节跳动的治理经验和实践。 DataLeap是火山引擎数智平台VeDI旗下的...
近期,火山引擎DataLeap智能市场上线“数仓建表规范”功能,该功能通过规范数仓场景下的建表流程,提升项目开发效率,实现快速追踪数据链路,并有效保障交付质量。 数仓建设是数据开发的基础工作之一。在日常数据开发过程中,经常涉及多方协同、互相...