行拼接
概述
功能说明
同类型的业务数据,可能来自不同的下属公司、门店,即便在同一组织,也存在不同数据源的数据集。例如超市有多种支付方式:现金、银联、移动支付等,导致决策者、IT部门在末端获取的数据集来源众多。行拼接则可以把同业务不同来源的数据拼接在一起。

使用场景
可以将多家门店、多个线上平台等不同来源的销售流水记录,合并成一份统一的全国销售总表。
使用指导
在实际应用中,首先通过列编辑中的「选择列」操作符,对一批数据进行规范化处理,并以此作为规范化的数据集为保留版。其他同业务数据通过「行拼接」操作符,整合成更加规范全面的数据集。
举例:


如上图所示为两个来源不同的数据集,但是字段完全相同。

如图在进行行拼接时,可以选择保留列的情况,如保留所有列、仅保留公共列或者保存任意数据集的所有列。
得到拼接结果后,可以在左上区域内,点击某一数据集下的数字查看对应数据集保留了哪些字段。
节点数设置
在ETL的创建中,提供针对ETL的「行拼接」的节点数量配置功能。规范ETL的创建,能够避免因操作不当引起的系统运行异常问题。
具体操作: 管理中心>运维管理>参数配置,ETL参数配置 > 最大支持「行拼接」节点数。(可配置范围:1-50。新客:默认10,已使用客户:默认无限制)。当创建时如果超出限制,则会进行提示。


如后续使用其他数据处理算子,详情参考新手入门。