数据预处理
                             创建于 2022-10-19                                                            /  最近更新于 2022-11-07                                                        /  3094
                            
                            
                            
                        
                    
                        字体:
                        [默认]
                        [大]
                        [更大]
                    
                用户在 Flow 开发中可以通过数据预处理功能,对目标数据集进行清洗、处理等操作,为后续特征工程、建模等提供可利用数据。
1. 创建数据预处理节点
入口1:Flow编辑页-OPERATOR节点-数据预处理
单击”数据预处理”按钮,弹出“新建数据预处理节点”窗口。
.png)
入口2:单击待处理的数据集-操作-添加流程节点-数据预处理
.png)
配置数据预处理节点的输入数据集及输出数据集:输入数据集为预处理节点的处理对象,输出数据集为完成预处理后会生成的后续数据集。
.png)
若要添加/删除预处理节点的输入/输出,可以点击旁边的“+”和”“删除”按钮进行增删操作。
.png)
点击确定,完成节点创建。
2. 节点配置
单击节点中的“进入配置页”按钮,或双击节点,进入预处理配置界面。
.png)
按需选择左侧的操作节点,将节点拖拽到画布上,对数据流做相应的处理。
.png)
.png)
AI 项目中的数据预处理节点集成了平台数据流算子的能力,可提供的数据处理能力及配置方式与数据流一致。各节点能力介绍详见:《5.2.2 数据流算子配置》
完成数据预处理配置后,若当下无需运行,点击右上角“保存”即可;
若需要运行,点击“保存并运行”即可。运行成功后,flow画布上将出现通过数据预处理生成的输出数据集。
.png)
3. 数据预处理信息修改
在画布上点击待修改的数据预处理节点,可修改其名称、描述、更改节点的输入/输出等。
.png)
                    0 人点赞过