输出数据集
1. 概述
1.1. 功能说明
输出数据集是 数据流 处理后的结果数据,可用于后续的业务分析和报表分析。
在 ETL 数据流任意节点可以配置多个输出数据集算子,并为 ETL 输出数据集指定不同的存储位置。
并且用户可对 输出数据集设置加速字段,系统会按照这些字段对数据集进行分片处理,从而提升这些数据集用于卡片查询时的速度。
1.2. 前提条件
数据流 中至少需要 1 个 「输入数据集」或者「数据库输入」 ,才能配置「输出数据集」。
2.操作步骤
-
将 数据流 算子区的 输出数据集 算子拖入右侧画布编辑区,并使用连接线进行连接;
-
点击 输出数据集 算子,命名并选择存储位置;
-
成功运行离线开发任务后,系统将自动输出 离线开发数据集 至「数据中心 > 数据集」。