合并列
1. 概述
1.1. 功能说明
合并列是指将现有数据集中的两个或多个列的数据整合成一个新列,该操作用于整合数据,使得不同列的信息可以在同一列中呈现。
比如将商品订单表中的地区名称(如省份、城市、街道)合并成完整的地址,或者将日期信息(年、月、日)整合成一个完整的日期。这种操作不仅可以使数据更整洁,还可以生成新的信息,提高数据的维度和深度。
2. 使用指导
2.1. 操作步骤
-
将ETL算子区的 合并列 算子拖入右侧画布编辑区;
-
点击 合并列 算子 ,指定新列名称,按需勾选需要合并的原始列,并点击确定;
-
按需选择是否 删除原始列 ;
-
为新列设置分隔符,定义原始列的合并方式;
-
配置完成后,预览数据结果。
2.2. 详细说明
下文以配置一个 省市&代码 为例进行介绍。
-
将ETL算子区的 合并列 算子拖入右侧画布编辑区,在上游节点后连线;
-
点击 合并列 算子,左侧区域变为当前算子配置区,根据业务需要重新命名,如“省市&代码”;
- 单击 合并列 算子,进入其配置界面。在配置界面中,设置需要合并的列,并按需配置合并方式;
注意:分隔符可以选择无、分号、逗号、制表符、空格、自定义等。
-
合并列:省份、省份代码
-
为新列设置分隔符,定义原始列的合并方式,这里的分隔符选择“制表符”。
- 按需选择是否 删除原始列 ,合并后的原始列可以选择删除或保留;
· 删除原始列
· 保留原始列
- 点击 预览 ,预览数据结果,以确保合并列的值符合预期,不包含错误或异常值。
ETL页面的操作符中,使用合并列操作符后,如何把合并好的字段再拆开?
如后续使用其他数据处理算子,详情参考 新手入门 。