Universe-lab 帮助中心

项目复制

创建于 2022-10-19 / 最近更新于 2022-11-07 / 1441
字体: [默认] [大] [更大]

根据业务实际对AI项目的使用诉求,存在基于不同的业务场景/不同的品牌/开发生产隔离等需求建立多个AI项目的情况,由此衍生出基于已有AI项目进行复制的诉求,例如:

  • 针对不同月份的预测,分别建立两套AI项目,两者整体架构相似仅需要进行部分微调。

  • 从不同的维度开发预测任务,两个项目会存在逻辑复用度较高的部分AI Flow(data cleaning、data processing等),此时需要使用AI项目复制功能,快速从0-1建立起业务模型等。

1. 项目复制

入口:AI项目列表页-创建副本

  • 单击[创建副本],填入副本项目的名称及描述等基本信息;

  • 单击确定,进入创建副本流程,列表页上方支持实时显示副本创建进度;(若同时创建多个项目的副本,将在弹窗内显示各项目复制的进度)

  • 副本创建完成后,平台将自动刷新界面,新创建的副本项目出现在列表最上方。

2. 创建副本逻辑

创建副本时,复制逻辑遵从如下原则:

  • AI项目属性:

    • 连接文件仓库:自动创建新的AI项目对应目录(/home/guandata/universe-lab/{AI项目ID}),针对原始AI项目的文件仓库内所有内容进行复制搬迁,包括分支文件夹及内部所有文件;

  • AI Flow:

    • 所有AI Flow名称、Flow逻辑结构同原始AI项目,复制内容包括:Flow参数、code连接、参数列表等配置项;

    • 所有AI Flow内部operator节点(数据预处理、code、plugin)内容及配置项同原始AI项目,包括:

      • 节点基本信息(名称、描述等);

      • 输入输出(及输出配置如增量更新、前置sql等);

      • 节点配置内容详情;

        • 针对“选择文件”类型的code节点进行复制时,内部保存的映射文件相对位置不变(指向复制后新的AI项目ID路径下的py文件)

  • AI项目内所有数据集:

    • 输入数据集与原始AI项目中的输入数据集引用关系一致;

    • 输出数据集:

      • 仅复制数据集schema信息,形成虚线数据集,AI Flow运行成功后方可生成该数据集对应文件;

      • 数据集名称不变,关联信息中引用信息不变(包括仪表板引用信息);

      • 原始数据集上设置的“注册至数据中心”信息不保留,如有需要可自行注册;

  • AI项目内所有仪表板:

    • 复制后的仪表板与相应Universe数据集的引用关系不变,Dataset 列表-数据集详情页-关联信息中的仪表板引用信息不变;

  • 副本AI项目不复制内容如下:

    • 所有AI Flow的运行实例、运行实例自动删除设置;

  • AI项目复制的异常情况:

    • 如果存在某个AI Flow内的code节点映射的文件不存在等异常情况,将不允许进行AI项目的复制,平台会给出报错提示。


0 人点赞过