通知告警
1. 通知告警概述
通知告警模块,可以支持当任务出现异常状态(如失败、超时或当服务器资源包括CPU、内存、磁盘使用率超过一定阈值)时,系统通过多种通知渠道(邮件、企业微信、钉钉等常见OA系统及发送至接口方式,比如群机器人等)自动发送预警信息及时通知相关人员快速处理,从而减少危险事故。
2. 通知告警使用说明
2.1. 任务完成通知
任务完成通知支持以指定渠道发送任务成功或失败的通知。通知渠道支持邮件、钉钉、飞书等主流OA软件(部分支持群机器人Webhook机制),也支持以WebHook(接口)方式将异常信息推送至外部系统。
-
进入「管理中心 > 运维管理 > 通知告警」模块。
-
点击右上角「编辑」按钮。
-
选择告警任务类型、触发条件、通知渠道,添加收件人,填写通知标题和内容等。
说明:以接口方式向外部推送的时候,支持配置动态参数,输入 $ 即可看到可选对象以及对应解释,主要包括: date、time、timestamp、taskname、owner、resourceid、message、status、tasktype等。
2.2. 超时任务告警
超时任务告警支持以指定渠道发送任务超时通知。通知渠道说明同2.1. 任务完成通知渠道。
-
进入「管理中心 > 运维管理 > 通知告警」模块。
-
在超时任务告警页面,点击右上角「编辑」按钮。
-
选择告警任务类型、通知渠道,添加收件人,填写通知标题和内容等。
2.3. 系统资源告警
系统资源告警支持配置系统资源以及单个数据集存储大小告警阈值,并以指定渠道发送告警通知。通知渠道同2.1. 任务完成通知渠道。