项目复制
根据业务实际对AI项目的使用诉求,存在基于不同的业务场景/不同的品牌/开发生产隔离等需求建立多个AI项目的情况,由此衍生出基于已有AI项目进行复制的诉求,例如:
针对不同月份的预测,分别建立两套AI项目,两者整体架构相似仅需要进行部分微调。
从不同的维度开发预测任务,两个项目会存在逻辑复用度较高的部分AI Flow(data cleaning、data processing等),此时需要使用AI项目复制功能,快速从0-1建立起业务模型等。
1. 项目复制
入口:AI项目列表页-创建副本
单击[创建副本],填入副本项目的名称及描述等基本信息;
单击确定,进入创建副本流程,列表页上方支持实时显示副本创建进度;(若同时创建多个项目的副本,将在弹窗内显示各项目复制的进度)
副本创建完成后,平台将自动刷新界面,新创建的副本项目出现在列表最上方。
2. 创建副本逻辑
创建副本时,复制逻辑遵从如下原则:
AI项目属性:
连接文件仓库:自动创建新的AI项目对应目录(/home/guandata/universe-lab/{AI项目ID}),针对原始AI项目的文件仓库内所有内容进行复制搬迁,包括分支文件夹及内部所有文件;
AI Flow:
所有AI Flow名称、Flow逻辑结构同原始AI项目,复制内容包括:Flow参数、code连接、参数列表等配置项;
所有AI Flow内部operator节点(数据预处理、code、plugin)内容及配置项同原始AI项目,包括:
节点基本信息(名称、描述等);
输入输出(及输出配置如增量更新、前置sql等);
节点配置内容详情;
针对“选择文件”类型的code节点进行复制时,内部保存的映射文件相对位置不变(指向复制后新的AI项目ID路径下的py文件)
AI项目内所有数据集:
输入数据集与原始AI项目中的输入数据集引用关系一致;
输出数据集:
仅复制数据集schema信息,形成虚线数据集,AI Flow运行成功后方可生成该数据集对应文件;
数据集名称不变,关联信息中引用信息不变(包括仪表板引用信息);
原始数据集上设置的“注册至数据中心”信息不保留,如有需要可自行注册;
AI项目内所有仪表板:
复制后的仪表板与相应Universe数据集的引用关系不变,Dataset 列表-数据集详情页-关联信息中的仪表板引用信息不变;
副本AI项目不复制内容如下:
所有AI Flow的运行实例、运行实例自动删除设置;
AI项目复制的异常情况:
如果存在某个AI Flow内的code节点映射的文件不存在等异常情况,将不允许进行AI项目的复制,平台会给出报错提示。