Universe 帮助中心

2021年01月重要功能更新

创建于 2022-10-28 / 最近更新于 2022-11-07 / 1803
字体: [默认] [大] [更大]

以下功能在1.3.0及之后的版本中均可使用

支持通过API获取多个数据集中的数据,并支持自定义查询SQL语句。

详见:《8.2.2 数据下载》

数据集详情页支持数据结构编辑操作

数据集详情页新增“数据结构”展示,支持以下内容的展示和编辑:字段名称、字段类型、字段注释。

入口:数据中心-数据集详情页-数据结构

undefined

undefined

对于新创建的数据集,字段注释默认为空:

undefined

如果该数据集已经被任何工作流/数据流/Universe数据集/数据质量模型引用,那么修改字段名称/字段类型时会进行二次提示(单纯修改字段注释不会进行二次提示),后续可通过数据集详情页的关联信息/质量模型查看该数据集被引用的具体情况:

undefined

如果该数据集被BI平台的Universe数据集引用,那么开发平台关于数据结构的任何修改,都可以及时同步至BI平台的Universe数据集。

通过工作流/数据流更新数据集时(包括覆盖旧数据/添加新数据),支持设置字段映射:

  • 支持展示:源表的字段和类型、目标表的字段和类型

  • 两者默认根据名称进行自动匹配映射,同时支持手工设置映射关系

  • 以目标表字段为基准,支持选择对应的源表字段

    • 目标表中如果有字段不进行来源映射,那么该字段将不进行insert/update操作

undefined

undefined

工作流中的SCD节点新增对内部数据集的支持,可以在数据集上初始化/增量更新拉链表(SCD节点详细介绍可点击下方卡片查看)。详见:4.2.13 SCD节点》

undefined

工作流/数据流定义列表页新增“导入”入口,支持根据导入的json文件读取工作流/数据流定义的名称、描述、超时告警等信息。

工作流定义的导入:

入口:任务调度-工作流定义-导入工作流

undefined

undefined

undefined

数据流定义的导入:

入口:任务调度-数据流定义-导入数据流

undefined

undefined

普通数据流/DB数据流均支持使用项目级别的全局参数,具体使用范围为以下算子中的SQL语句/表达式,可以通过${参数名}的方式引用全局参数。

  • DB数据流:从数据库输入、输出至数据库、SQL输入、添加计算列、分组聚合-添加计算字段、筛选数据行

  • 普通数据流:输出至数据库、输出数据集-更新数据集、SQL输入、添加计算列、分组聚合-添加计算字段、筛选数据行

QUALITY_MODEL和VALIDATION节点新增“失败策略”配置项(默认勾选):该节点运行失败后,可选择是否导致整个工作流运行失败

undefined

undefined

undefined

数据质量模型中“值域”类型规则支持两种类型字段:数值类型、日期类型

  • 对于“数值”类型字段,新增对于 正无穷/负无穷 的支持

  • 对于“日期”类型字段,支持设置日期范围

undefined

针对Excel类型文件,支持设置跳过从头开始的多少行/多少列进行解析。

样例文件:

undefined

设置入口:

  • 数据中心-创建数据集(文件类型选择为Excel)

undefined

  • 工作流定义编辑页-FTP文件读取节点(文件类型选择为Excel)

undefined

undefined


0 人点赞过