跳到主要内容

版本：6.0.0

测试

概述

功能说明

在一个完整的ETL任务中，输入节点和输出节点确保了从源到目的地的正确流动和处理，是构成ETL生命周期不可或缺的组成部分。
在观远Smart ETL中，我们将ETL的输入、输出算子统称为数据集类算子，包括 输入数据集 算子和 输出数据集 算子，分别代表原始数据集和结果数据集。
支持多源异构数据的快速融合（多路输入），数据流任意节点随时输出（多路输出）。

使用限制

Smart ETL中需要1个及以上的 输入数据集 算子，同时至少需要1个 **输入数据集 **，才能配置 输出数据集 。
输入数据集的来源包括文件数据、数据库数据集（不含直连数据库、视图数据集、实时数据集）以及其他Smart ETL中的输出数据集。\

使用说明

将ETL画布区的 输入数据集 算子拖入至右侧画布编辑区，点击该算子上传源数据；
拖拽其他算子进行数据处理操作，用连接线将各个算子进行连接；
数据处理完成后，将 输出数据集算子 拖至右侧画布编辑区；
点击数据数据集算子， 命名并选择存储位置 ；
**预览 **输出数据集结果，确认无误后，在右上角按需保存或运行任务。

（若选择“保存运行并退出” 时，ETL成功运行后将自动生成输出数据集。）

\

学习路径

您可以直接按以下内容进行学习：

算子名称	说明
输入数据集	为ETL流程的第一阶段（抽取）提供数据基础，为后续ETL的数据处理做准备，支持多源异构数据的快速融合（多路输入）。
输出数据集	是ETL处理后的结果数据，可用于后续的业务分析和报表分析，支持任意节点随时输出（多路输出）。

本页导读
概述
- 功能说明
- 使用限制
使用说明
学习路径