跳到主要内容

输入数据集

1. 概述

数据数据集是数据流中的重要前置算子(流程起点),它为ETL流程的第一阶段(抽取)提供数据基础,为后续ETL的数据处理做准备。

支持多源异构数据的快速融合(多路输入),使得用户能够轻松整合来自不同数据源和不同结构的数据。

2. 操作步骤

  1. 将数据流算子区的 输入数据集 算子拖入右侧画布编辑区;

  2. 点击 输入数据集 算子,选择目标数据集

    |550

  3. 点击 确定 ,上传数据集;

  4. 按需为输入数据集配置预览规则,可选;

    |250

  5. 后续可以加入其他算子节点,以形成一个数据处理的完整流程。