跳到主要内容

任务监控

1. 概述

通过任务监控可全面展示系统运行状态以及监控任务实例状态。任务实例是指在工作流运行时产生的一个特定工作流程的实例化对象。每运行一个工作流,都将记录当次运行的各项配置信息,并生成一个工作流实例。

通过工作流实例,可查看工作流本次运行的基本信息包括:开始时间、结束时间、运行状态,以及每个任务的执行状态和执行结果等。另外,可通过实例对本次运行的任务进行相关的运维管理,包括:重新执行/从失败处继续执行/停止/删除实例等。从而实现对各项任务的整体运行监控及统一化运维管理。

2. 监控大屏

用于展示离线开发任务的任务数指标、各状态的任务数量趋势、任务运行统计等。

2.1. 核心指标

统计任务数量情况:总任务数、开启调度的任务数、未开启调度的任务数、排队中的任务数(支持跳转到任务实例页并过滤排队任务)、运行中的任务数(支持跳转到任务实例页并过滤运行任务)。

2.2. 各时段运行实例总览

统计各时段状态为完成、失败、手动停止、超时停止的任务数量。

2.3. 任务运行统计

统计离线开发任务的运行次数、失败次数、重跑次数以及平均运行时长,可以切换时间段。

说明

当选择所有周期时,数据会每小时统计一次,统计结果会有延迟。

3. 查看实例状态

3.1. 任务并发数

默认并发数:10,同时最多运行10个不同任务的实例,相同任务实例仅支持串行(按顺序依次运行)

管理中心-通用设置-运行参数支持修改

3.2. 查看实例详情

单击列表进入实例详情页,通过实例详情页查看本次运行的参数值、各任务的运行状态、运行日志、上下游运行关系等。

对于数据流节点,支持双击节点或点击查看详情,查看当前实例的数据流配置

3.3. 查看甘特图

点击「查看甘特图」,进入甘特图页面。

通过甘特图,查看工作流实例中各个任务的运行时长及运行状态、排队时间等,用于排查异常运行情况。

3.4. 定期清理实例

为了避免历史实例占用磁盘空间,支持定期清理实例记录

在管理中心-通用设置-系统规则配置离线开发实例自动清理天数

注意

超过天数的实例会被清理删除,无法追溯。

4. 管理实例

目前支持对工作流实例进行管理,包括"重新执行"、"从失败处继续执行"、"停止"等运维管理操作。

4.1. 重新执行

按照已生成的工作流实例配置,重新运行该实例。

4.2. 从失败处继续执行

重新执行失败任务及其下游任务,而不需要重新执行整个工作流。通常用于处理任务执行过程中由于网络原因导致的响应超时或连接失败等问题,可提升问题处理的效率。

4.3. 停止

停止正在执行中的工作流。

4.4. 删除

删除已经生成的工作流实例,操作不可逆。