数据集算子概述
创建于 2023-12-01 / 最近更新于 2024-03-27 / 2589
字体:
[默认]
[大]
[更大]
在一个完整的ETL任务中,输入节点和输出节点确保了从源到目的地的正确流动和处理,是构成ETL生命周期不可或缺的组成部分。
输入数据集输出数据集 算子,分别代表原始数据集和结果数据集。
支持多源异构数据的快速融合(多路输入),数据流任意节点随时输出(多路输出)。
输入数据集输入数据集 输出数据集
输入数据集的来源包括文件数据、数据库数据集(不含直连数据库、视图数据集)以及其他Smart ETL中的输出数据集。
输入数据集
拖拽其他算子进行数据处理操作,用连接线将各个算子进行连接;
数据处理完成后输出数据集 算子
点击 输出数据集命名并选择存储位置
预览
(若选择“保存运行并退出”时,ETL成功运行后将自动生成输出数据集。)
您可以直接按以下内容进行学习:
算子名称 | 说明 |
输入数据集 | 为ETL流程的第一阶段(抽取)提供数据基础,为后续ETL的数据处理做准备,支持多源异构数据的快速融合(多路输入) |
输出数据集 | 是ETL处理后的结果数据,可用于后续的业务分析和报表分析,支持任意节点随时输出(多路输出) |
10 人点赞过