通过分组管理和告警功能构建大批量资源监控告警机制
简介
随着客户的业务发展,企业上云会面临大规模多类型的云产品资源监控运维问题,日常监控往往分布在多地,多业务,多资源无法统一高效监控。本篇实践旨在帮助您使用 CloudSat 提供分组管理和告警服务,可以帮助您的资源进行按业务有效分组,以及规模化的构建告警体系,迅速提升运维效率。
主要概念
操作步骤
以下场景为例:
假设我们有多种资源,一部分用于开发项目组(开发项目正式服务 01 和开发项目正式服务 02),一部分用于测试项目组,业务涉及资源分散于北京 3 区
和上海 1 区
。
-
登录管理控制台。
-
点击产品与服务 > 运维与监控 > 云监控 CloudSat > 告警服务(新版),默认进入告警记录列表页面。
-
在左侧导航栏选择分组管理,进入分组管理页面。
-
点击创建实例分组,进入分组创建页面,根据提示配置各项参数,点击立即创建。具体可参考创建实例分组相关内容。
说明 -
支持批量从项目导入资源,为用户免去重复配置业务分组的繁琐流程。
-
支持多区资源混合管理,帮助用户在全局的情况下了解自己的资源概况。
-
支持资源列表搜索、一键全选以及多选功能;友好的批量操作为用户大批量选取资源带来便利,提升配置效率。
-
-
完成后可明确了解当前各业务线资源整体概况,例如:哪些资源未配置告警服务,哪些资源正在告警。
通过分组管理的功能可以迅速定位分组内资源的关系,快速了解资源的监控告警状态,迅速察觉异常情况。
-
点击分组名称/ID,进入其详情页面,即可在汇聚视图中查看正在告警的资源,并迅速定位具体异常对象。
-
通过告警状况进行针对性排障,如资源超载可以通过扩展资源的方式进行解决。
-
汇聚视图中若发现未配置告警服务的资源类型,可在分组详情页的关联模板页签内绑定告警模板,快速为各项资源绑定告警策略。具体可参考分组管理的绑定告警模板相关操作。
-
在关联模板页签内,点击模板 ID,即可查看当前分组绑定的告警规则有哪些。
-
在告警记录中可查看当前分组内各资源的告警情况。
-
选择某一条告警记录,点击告警记录操作列的详情,告警的具体内容。