为了方便您及时发现容器服务的异常状况,以保证您业务的稳定性和可靠性,建议您为所有生产集群配置必要告警。本文介绍如何为 QKE 配置告警策略。

创建告警策略

通过创建告警策略,定义哪些指标达到何种条件时进行告警。

  1. 登录管理控制台。

  2. 通过以下方式进入告警策略创建页面。

    方式一:

    1. 在顶部的导航菜单中,选择产品与服务 > 容器服务 > 容器引擎 QKE,进入 QKE 集群列表页面。

    2. 在目标集群的集群运维 > 告警管理页面,点击创建告警策略,进入自定义告警策略页面。

      alarm mgt

    方式二:

    1. 在顶部的导航菜单中,选择产品与服务 > 监控服务 > 云监控 CloudSat

    2. 在左侧导航栏,选择告警服务,然后点击自定义告警策略页签。

      cloudsat alarm service
  3. 点击创建,弹出创建告警策略窗口。

  4. 设置告警参数。

    • 名称 :输入告警策略名称。

    • 对象范围 :默认为自定义监控

    • 告警类型 :默认为指标告警,即对集群指标进行监控告警。

    • 命名空间:选择 app-o6lvbkhm,这是 QKE 所对应的命名空间。

    • 监控周期 :默认支持5分钟粒度的监控。

  5. 点击下一步,设置告警规则。

    定义触发告警通知需要满足的条件。指标含义及配置建议可参考告警指标说明

    可添加多条规则。默认情况下,任何一条规则满足条件时都会触发告警。

  6. 点击下一步,设置告警行为。

    • 发送通知:触发告警时是否发送通知。建议选择,否则无法及时发现告警。

    • 触发条件:设置何时发送告警通知。

    • 告警次数:当资源持续处于告警状态时,连续发送告警通知的次数。最多为 100 次。

    • 通知列表:选择告警通知的接收人。可点击新列表新增接收人。

  7. 点击提交,弹出提示框。

  8. 如果您需要立即将该策略应用到 QKE 集群,则点击确认,选择需要绑定的集群资源(可多选)。

  9. 点击提交,告警策略绑定成功。

绑定告警策略

如果您需要将已创建好的告警策略绑定到新创建的集群,请按照如下步骤进行操作。

  1. 在云监控 CloudSat 的告警服务 > 自定义告警策略页面,右键点击告警策略,选择添加监控资源

    alarm bindto cluster
  2. 选择您需要绑定的集群,点击提交

编辑告警策略

您可以随时修改已创建或已绑定的告警策略。

  1. 在 QKE 集群的告警管理页面,点击目标告警策略操作列的编辑,进入该策略详情页。

    或在云监控 CloudSat 的告警服务 > 自定义告警策略页面,点击告警策略 ID,进入策略详情页。

  2. 规则区域,可进行规则的添加、删除等操作。

    edit alarm rules
    • 点击添加,添加新规则。

    • 勾选已有规则,点击删除,删除所选规则。

  3. 点击应用修改,更新规则。

解绑告警策略

在 QKE 集群的告警管理页面,点击目标告警策略操作列的解绑,然后点击确定,解绑该告警策略。

alarm unbind cluster