监控与告警

查看 Github 文档

RadonDB MySQL Kubernetes 2.1.0+ 支持。

背景

Prometheus 基于文本的暴露格式,已经成为云原生监控领域事实上的标准格式。

RadonDB MySQL 监控引擎基于 Prometheus MySQLd Exporter 定义。通过 mysqld-exporter 抓取 RadonDB MySQL 服务指标,再通过接入第三方应用平台实现监控指标可视化。

本教程演示如何开启 RadonDB MySQL 监控指标。

准备工作

部署步骤

步骤 1: 配置 serviceMonitor

serviceMonitor 开启后将自动绑定 mysqld_exporter 与 Prometheus。

serviceMonitor 参数包含如下字段:

serviceMonitor:
  enabled: true
  ## Additional labels for the serviceMonitor. Useful if you have multiple prometheus operators running to select only specific ServiceMonitors
  # additionalLabels:
  #   prometheus: prom-internal
  interval: 10s
  scrapeTimeout: 3s
  # jobLabel:
  # targetLabels:
  # podTargetLabels:
  namespaceSelector:
    any: true
  selector:
    matchLabels:
      app.kubernetes.io/managed-by: mysql.radondb.com
      app.kubernetes.io/name: mysql

您可以在 charts/mysql-operator/values.yaml 文件中配置 serviceMonitor

  • 新部署 Operator 时, serviceMonitor.enabled 默认为 true,表示默认开启。
  • 已部署 Operator 2.1.0 以下版本的集群,需重新部署 Operator。

步骤 2: 配置 metricsOpts

metricsOpts 是 CRD mysqlclusters.mysql.radondb.com 中定义 RadonDB MySQL 集群监控的参数,可通过配置mysql_v1alpha1_mysqlcluster.yaml 文件中参数值开启监控服务。

metricsOpts 参数包含如下字段:

metricsOpts:
    enabled: false  
    image: prom/mysqld-exporter:v0.12.1

    resources:
      requests:
        cpu: 10m
        memory: 32Mi
      limits:
        cpu: 100m
        memory: 128Mi

metricsOpts.enabled 默认为 false,需手动设置为 true

  • 选择设置 metricsOpts.enabled 状态为 true,开启集群监控功能。
  • 设置资源参数值,定义监控容器资源配额大小。

文件参数修改完成后,使用如下指令应用配置,部署/更新集群回显信息如下:

$ kubectl apply -f config/sample/mysql_v1alpha1_mysqlcluster.yaml
cluster.mysql.radondb.com/sample created/configured

查看监控服务

通过客户端查看

您可以通过如下指令查看集群监控服务和 serviceMonitor 信息。

$ kubectl get service,servicemonitor

$ kubectl describe servicemonitor <serviceName>

预期效果

$ kubectl get service,servicemonitor
NAME                             TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)    AGE
service/mysql-operator-metrics   ClusterIP   10.96.242.205   <none>        8443/TCP   3h25m
service/sample-follower          ClusterIP   10.96.2.234     <none>        3306/TCP   21h
service/sample-leader            ClusterIP   10.96.30.238    <none>        3306/TCP   21h
service/sample-metrics           ClusterIP   10.96.7.222     <none>        9104/TCP   3h24m
service/sample-mysql             ClusterIP   None            <none>        3306/TCP   21h

NAME                                                              AGE
servicemonitor.monitoring.coreos.com/demo-mysql-operator          3h25m

$ kubectl describe servicemonitor demo-mysql-operator 
Name:         test-radondb-mysql-metrics
Namespace:    default
Labels:       app=test-radondb-mysql
              app.kubernetes.io/managed-by=Helm
              app.kubernetes.io/vendor=kubesphere
              chart=radondb-mysql-1.0.0
              heritage=Helm
              release=test
Annotations:  kubesphere.io/creator: admin
API Version:  monitoring.coreos.com/v1
Kind:         ServiceMonitor
......
Spec:
  Endpoints:
    Interval:        1m
    Path:            /metrics
    Port:            metrics
    Scheme:          http
    Scrape Timeout:  10s
......

在 KubeSphere 平台查看

在 KubeSphere 企业空间部署的 RadonDB MySQL Operator 和集群,开启监控后,可在如下页面查看监控服务状态。

  • 在项目空间应用负载下的服务页面,点击 <集群名称>-metrics ,可查看监控服务信息。

查看监控服务

  • 在项目空间应用负载下的容器组页面,点击一个容器的名称,可查看该容器中 metrics 资源状态。

查看监控资源状态

查看监控

通过 KubeSphere 自定义监控

说明

RadonDB MySQL Operator 和集群需部署在 KubeSphere。

KubeSphere 的监控引擎基于 Prometheus 和 Prometheus Operator。使用 KubeSphere 的自定义监控功能支持以可视化的形式监控 RadonDB MySQL 指标。

  1. 在集群同一项目中,选择监控告警下的自定义监控,点击创建
  2. 在对话框中,选择 MySQL 模版,并继续配置监控模版。

选择模版

  1. 点击保存模版,即新创建监控面板。

保存监控模版

  1. 新建监控面板需等待约十分钟,即可查看监控数据。

查看监控

更多详情,请查看 KubeSphere 自定义监控介绍可视化监控

通过 Prometheus + Grafana 平台

Grafana 是一个跨平台、开源的数据可视化网络应用程序平台。通过 Prometheus + Grafana 平台查看监控基本原理如下:

  • 通过 mysql_exporter 获取 RadonDB MySQL 服务监控数据.
  • 通过 node_exporter 获得 RadonDB MySQL 服务器的监控数据。
  • 将监控数据传到 Prometheus 后,通过配置数据源,最终在 Grafana 呈现丰富的监控数据图表和警告。

基本原理

更多 Grafana 可视化监控使用说明,请参见 Grafana Dashboards