跳到主要内容
版本:7.4.0

行拼接

概述

功能说明

同类型的业务数据,可能来自不同的下属公司、门店,即便在同一组织,也存在不同数据源的数据集。例如超市有多种支付方式:现金、银联、移动支付等,导致决策者、IT部门在末端获取的数据集来源众多。行拼接则可以把同业务不同来源的数据拼接在一起。

 

image.png

使用场景

可以将多家门店、多个线上平台等不同来源的销售流水记录,合并成一份统一的全国销售总表。

使用指导

在实际应用中,首先通过列编辑中的「选择列」操作符,对一批数据进行规范化处理,并以此作为规范化的数据集为保留版。其他同业务数据通过「行拼接」操作符,整合成更加规范全面的数据集。

举例:

image.png

image.png

如上图所示为两个来源不同的数据集,但是字段完全相同。

image.png

如图在进行行拼接时,可以选择保留列的情况,如保留所有列、仅保留公共列或者保存任意数据集的所有列。

得到拼接结果后,可以在左上区域内,点击某一数据集下的数字查看对应数据集保留了哪些字段。

节点数设置

在ETL的创建中,提供针对ETL的「行拼接」的节点数量配置功能。规范ETL的创建,能够避免因操作不当引起的系统运行异常问题。

 

具体操作: 管理中心>运维管理>参数配置,ETL参数配置 > 最大支持「行拼接」节点数。(可配置范围:1-50。新客:默认10,已使用客户:默认无限制)。当创建时如果超出限制,则会进行提示。

image.png

image.png

如后续使用其他数据处理算子,详情参考新手入门