磁盘运维
问题场景1:磁盘使用率过高
问题原因
建议查看指标「节点磁盘使用率各时间段趋势图」,若磁盘使用率持续30分钟超过85%警戒线,说明磁盘使用率过高,可能造成该现象的原因如下:
(1)大量无效数据资产占据了磁盘空间。
(2)数据集未及时清理数据。
(3)大数据集更新方式不合理。
(4)缓存文件、备份文件、日志文件、离线升级文件和历史镜像占据了磁盘空间。
排查思路
我们建议您按照如下思路进行排查:
(1)参考「各节点磁盘用量分布」,了解磁盘空间占用情况,找到空间占用最多的资源。
?优化措施
a. 如缓存文件、备份文件、日志文件、离线升级文件和历史镜像占据磁盘空间较大,建议联系观远数据手动清理。如业务允许,可一并调整以上类型文件的自动清理周期。
b. 如业务数据集占据磁盘空间较大,建议参考下方排查思路进行操作。
(2)参考指标「无任何消费情况的数据集」和「产生无效消费的数据集」,在不影响业务的前提下,识别低价值业务。
?优化措施
对于以上资源,我们建议您将其灰度下线。灰度下线是指将数据集更新机制设置为“手动”,观察对业务是否有影响。如无影响,再进行清理删除。
(3)参考指标「占存储空间最大Top20的数据集」,识别大数据集。
关注占存储空间较大(数据集存储空间占比>磁盘空间5%)的数据集资源,您可点击数据集名称跳转。
?优化措施
建议在不影响业务的前提下,考虑如下方案控制数据集大小:
a. 判断该数据集是否需要频繁更新,若对信息及时性要求一般,建议减少更新频率、调整更新周期。
b. 对数据集设置数据清理。您可根据业务需要,将不再关注的数据进行清理删除。注意,「数据清理」功能仅限于从文件导入数据、数据库接入数据的数据集。实时数据集、视图数据集、直连数据集、填报数据集不支持该功能。