数据预处理
创建于 2022-10-19 / 最近更新于 2022-11-07 / 1871
字体:
[默认]
[大]
[更大]
用户在 Flow 开发中可以通过数据预处理功能,对目标数据集进行清洗、处理等操作,为后续特征工程、建模等提供可利用数据。
1. 创建数据预处理节点
入口1:Flow编辑页-OPERATOR节点-数据预处理
单击”数据预处理”按钮,弹出“新建数据预处理节点”窗口。
入口2:单击待处理的数据集-操作-添加流程节点-数据预处理
配置数据预处理节点的输入数据集及输出数据集:输入数据集为预处理节点的处理对象,输出数据集为完成预处理后会生成的后续数据集。
若要添加/删除预处理节点的输入/输出,可以点击旁边的“+”和”“删除”按钮进行增删操作。
点击确定,完成节点创建。
2. 节点配置
单击节点中的“进入配置页”按钮,或双击节点,进入预处理配置界面。
按需选择左侧的操作节点,将节点拖拽到画布上,对数据流做相应的处理。
AI 项目中的数据预处理节点集成了平台数据流算子的能力,可提供的数据处理能力及配置方式与数据流一致。各节点能力介绍详见:《5.2.2 数据流算子配置》
完成数据预处理配置后,若当下无需运行,点击右上角“保存”即可;
若需要运行,点击“保存并运行”即可。运行成功后,flow画布上将出现通过数据预处理生成的输出数据集。
3. 数据预处理信息修改
在画布上点击待修改的数据预处理节点,可修改其名称、描述、更改节点的输入/输出等。
0 人点赞过