跳到主要内容
版本:7.0.0

合并列

1. 概述

1.1. 功能说明

合并列是指将现有数据集中的两个或多个列的数据整合成一个新列,该操作用于整合数据,使得不同列的信息可以在同一列中呈现。

比如将商品订单表中的地区名称(如省份、城市、街道)合并成完整的地址,或者将日期信息(年、月、日)整合成一个完整的日期。这种操作不仅可以使数据更整洁,还可以生成新的信息,提高数据的维度和深度。

image.png

2. 使用指导

2.1. 操作步骤

  1. 将ETL算子区的 合并列 算子拖入右侧画布编辑区;

  2. 点击 合并列 算子 ,指定新列名称,按需勾选需要合并的原始列,并点击确定;

  3. 按需选择是否 删除原始列 ;

  4. 为新列设置分隔符,定义原始列的合并方式;

  5. 配置完成后,预览数据结果。 

image.png

2.2. 详细说明

下文以配置一个 省市&代码 为例进行介绍。

  1. 将ETL算子区的 合并列 算子拖入右侧画布编辑区,在上游节点后连线;

  2. 点击 合并列 算子,左侧区域变为当前算子配置区,根据业务需要重新命名,如“省市&代码”

image.png

  1. 单击 合并列 算子,进入其配置界面。在配置界面中,设置需要合并的列,并按需配置合并方式;

注意:分隔符可以选择无、分号、逗号、制表符、空格、自定义等。

  • 合并列:省份、省份代码

  • 为新列设置分隔符,定义原始列的合并方式,这里的分隔符选择“制表符”。

image.png

  1. 按需选择是否 删除原始列 ,合并后的原始列可以选择删除或保留;

  · 删除原始列

image.png

  · 保留原始列

image.png

  1. 点击 预览 ,预览数据结果,以确保合并列的值符合预期,不包含错误或异常值。

image.png

ETL页面的操作符中,使用合并列操作符后,如何把合并好的字段再拆开?

如后续使用其他数据处理算子,详情参考 新手入门 。