Universe-lab 帮助中心

数据预处理

创建于 2022-10-19 / 最近更新于 2022-11-07 / 1871
字体: [默认] [大] [更大]

用户在 Flow 开发中可以通过数据预处理功能,对目标数据集进行清洗、处理等操作,为后续特征工程、建模等提供可利用数据。

1. 创建数据预处理节点

入口1:Flow编辑页-OPERATOR节点-数据预处理

  • 单击”数据预处理”按钮,弹出“新建数据预处理节点”窗口。

入口2:单击待处理的数据集-操作-添加流程节点-数据预处理

  • 配置数据预处理节点的输入数据集及输出数据集:输入数据集为预处理节点的处理对象,输出数据集为完成预处理后会生成的后续数据集。

  • 若要添加/删除预处理节点的输入/输出,可以点击旁边的“+”和”“删除”按钮进行增删操作。

点击确定,完成节点创建。

2. 节点配置

  • 单击节点中的“进入配置页”按钮,或双击节点,进入预处理配置界面。

  • 按需选择左侧的操作节点,将节点拖拽到画布上,对数据流做相应的处理。

AI 项目中的数据预处理节点集成了平台数据流算子的能力,可提供的数据处理能力及配置方式与数据流一致。各节点能力介绍详见:《5.2.2 数据流算子配置》

  • 完成数据预处理配置后,若当下无需运行,点击右上角“保存”即可;

    若需要运行,点击“保存并运行”即可。运行成功后,flow画布上将出现通过数据预处理生成的输出数据集。

3. 数据预处理信息修改

在画布上点击待修改的数据预处理节点,可修改其名称、描述、更改节点的输入/输出等。


0 人点赞过