跳到主要内容

输出数据集

1. 概述

1.1. 功能说明

输出数据集是 数据流 处理后的结果数据,可用于后续的业务分析和报表分析。

在 ETL 数据流任意节点可以配置多个输出数据集算子,并为 ETL 输出数据集指定不同的存储位置。

并且用户可对 输出数据集设置加速字段,系统会按照这些字段对数据集进行分片处理,从而提升这些数据集用于卡片查询时的速度。

1.2. 前提条件

数据流 中至少需要 1 个 「输入数据集」或者「数据库输入」 ,才能配置「输出数据集」。

2.操作步骤

  1. 将 数据流 算子区的 输出数据集 算子拖入右侧画布编辑区,并使用连接线进行连接;

  2. 点击 输出数据集 算子,命名并选择存储位置;

  3. 成功运行离线开发任务后,系统将自动输出 离线开发数据集 至「数据中心 > 数据集」。