输入数据集
1. 概述
数据数据集是数据流中的重要前置算子(流程起点),它为ETL流程的第一阶段(抽取)提供数据基础,为后续ETL的数据处理做准备。
支持多源异构数据的快速融合(多路输入),使得用户能够轻松整合来自不同数据源和不同结构的数据。
2. 操作步骤
-
将数据流算子区的 输入数据集 算子拖入右侧画布编辑区;
-
点击 输入数据集 算子,选择目标数据集
-
点击 确定 ,上传数据集;
-
按需为输入数据集配置预览规则,可选;
-
后续可以加入其他算子节点,以形成一个数据处理的完整流程。