任务长时间运行或者任务卡住怎么处理
BI中任务常见有:获取抽取卡片任务、直连卡片任务、ETL运行任务、抽取数据集更新任务、直连数据集更新任务等
那么在我们做数据分析时,遇到这些任务运行时间变长如:
获取卡片任务超过一分钟(抽取、直连)或几分钟无响应,平时秒级
ETL、数据集自动更新任务,和历史运行记录对比时间差距较大
1、普通用户解决方法建议
(1)对于卡片任务普通用户只能看到事情的表象也就是慢,或者一直在加载或者报错超时
(2)数据集或者ETL更新任务,可以通过进入“查看更新历史”
来判断,若之前3秒,这次30分钟+或者与既定定时更新时间已经很久了,那么你就有理由怀疑现在系统有问题;
(下一步找内部的BI系统管理员)
2、系统管理员解决方法建议
进入管理员设置——系统运维——任务管理查看系统中现在运行任务的情况
如果出现任务大面积堵塞,找到正在运行的任务,若异常(时间很长,没什么状态)可手动kill,看看任务是否能正常运行起来。
(1)系统任务逐渐恢复,开始依次执行,那么记录异常任务,群里反馈观远技术支持进行排查
(2)系统任务依旧堵塞,立即联系观远技术支持反馈进行处理。
特别补充说明:
(1)首先看任务运行情况是否健康,主要看运行时长;
☞对于卡片来说,获取直连卡片相对较慢,时间可能会好几秒,但是但凡出现卡片任务长达几分钟级别的就需要检查一下卡片上是否有很复杂的计算,卡片所引用数据集的数据量是不是很大,是否需要优化卡片上的内容等;
☞于对ETL来说,如果出现运行时间很久的如小时级别的,可以先点进该ETL看一下之前的运行记录,是不是一直这么长时间,如果不是,就先检查ETL最近是否被修改过,若没有检查系统,或反馈在售后群里,技术支持协助检查
☞对于数据集来说,首先查看是抽取数据集还是直连数据集,然后检查数据集更新的方式,(增量或全量)全量的话检查数据集更新的sql,是否存在大段的复杂sql(这样的话数据集更新速度会很慢),进行优化
(2)若出现紧急情况,系统存在严重的任务堵塞,如被一个异常的ETL堵死或者数据集堵死的情况下,可取消该任务,现可支持批量取消任务,短暂性恢复系统,然后联系售后技术支持进行排查。