如何极速定义监控 探求GreatADM
引文
在数据库运维环节中,所经常使用的运维治理平台能否存在这样的疑问:
1、自动监控粒度不够,业务须要更细颗粒度的监控数据。
2、平台自动的监控命令不适宜,须要调整阈值量身定制监控战略。
3、 不同类型的实例或组件须要有不同的监控重点,但治理平台监控固化,难以应答多样化的监控需求。
4、 只监控系统关键目的,屏蔽不用要的目的,优化CPU消耗、网络、采集数据量等,缩小资源消耗,优化系统性能。
在数据库运维环节中,用户或许DBA经常会由于治理平台监控面板无法性能,或许监控模板固化,监控模板中没有所关注的目的项,而不得已弃用局部治理平台,进而自建监控或许基于自身业务自定义一批运维监控脚本,来成功数据库或许主机的多样化监控需求。
但这些脚本往往出自不同DBA之手,监控脚本的治理、降级和保养,以及危险评价给数据库的稳固运转带来了新的危险,而且脚本的输入结果须要DBA周期审核剖析,展现上也不够直观。当天咱们来看下GreatADM是如何处置上述疑问的。
一、GreatADM的监控引见
GreatADM提供灵敏的自定义监控性能方法,支持通用的prometheus+grafana的规范,用户可以按如实践业务上的需求,经过性能规范的grafana面板json格局文件或许经过图形化选项性能监控采集项,手动定义dashboard面板。用户可按需灵敏的性能监控面板。同时GreatADM支持用户按需调整监控数据的采集频率、监控超时阈值等,用户可按实践业务需求来定义调整,以及对应的SQL命令的调整等。
GreatADM提供不同数据库架构的监控目的和监控模板,支持采集频率、超时阈值的调整,并提供3个维度监控:
针对监控采集,DBA在剖析判别疑问时,也可明晰了解到监控经常使用的SQL命令是什么,方法能否和自己的经常使用的SQL相反等。
假设上方的监控目的,或许面板不是你想要的,接上去咱们就详细看下GreatADM如何自定义业务中,或许DBA想要的监控项,和监控面板的性能。
二、如何自定义GreatADM的监控面板
性能全体步骤如下:
Demo1:只监控linux根空间用量
Demo2:监控慢日志累计增长量
1、参与空间采集项
Demo1、【如何参与主机自定义监控项---独立监控linux根空间用量】
针对以下选项:填写采集组称号:host_root采集频率:300s采集超时:5s采集组自动能否启用:启用参与到哪个类型数据库架构:paxos高可用复制
采集目的:数据库主机选用任一节点:hostname运转shell采集命令:df -Th|grep root|awk -F' ' '{print $6}'|awk -F'%' '{print $1}'采集命令留意:监控主机,则采集语句为shell命令,目的选用主机;监控数据库,则采集语句为SQL命令,目的选用数据库。另外对应的采集器前往的结果只准许是"单项结果值",假设存在多列,多行结果,对应的采集器会报错,并且无法反常采集。
采集器参与成功之后,消息如下
检查对应的采集命令
Demo2、【如何参与数据库自定义监控项---数据库慢日志增长趋向】
针对以下选项性能方法同上:填写采集组称号:slow_queries采集频率:5s采集超时:5s采集组自动能否启用:启用参与到哪个类型数据库架构:paxos高可用复制
采集目的:数据库实例选用任一实例节点: 选用数据库名:paxos_600 实例节点:database_1运转SQL采集命令:select variable_value from performance_schema.global_status where variable_name='slow_queries'
提交并检查监控项消息
经常使用的SQL语句
参与采集项的全体性能流程可以总结为:
1选用类型
2选用主机/数据库
3采集命令
4运转采集命令
5提交并审核
2、审核新增采集项能否有效
选用【监控诉警】--子项【查问】来验证新参与的采集项能否可采集到数据,以及前端绘图能否反常
点击【经常使用查问】可看到对应的graph的绘制图,点击【审核】,可详细看到采集项【统计数据】,如下共采集了482行。由于我选用了2台主机的,因截图遮展现框盖住了另外一台的绘图。
详细【数据】可检查到时序期间对应的主机采集的磁盘数值。
登录主机和实践主机的磁盘根空间对比检查
确认对应的采集数据可以反常,无误,为可用形态。(数据库的采集项和此审核分歧,这里就不在赘述了)。 接上去就可以性能grafana面板了。
3、性能监控面板
登录GreatADM的可间接跳转到GreatADM集成Grafana面板性能页,自动账号为admin,明码为GreatADM内置的初始明码。
选用【+】 Dashboard--参与新的【panel】
在这里Data sorce 选用【监控】
点击【目的阅读器】--搜查栏搜查采集项称号【host_root】--婚配到【node_ext_host_root_demo】--智能婚配【address标签】展现可监控的主机IP列表
选用要监控的主机【IP】--点击【经常使用查问】--可反常绘制监控图 调整横坐标轴的题目title【主机 "/" 根空间经常使用率】和纵坐标的lable形容【磁盘空间经常使用率(%)】
下一步针对绘图线的格局调整,点击【选项】--【图例】--【自定义(提供命名模板)】
将{{label_name}}修正为{{address}}之后,对应的主机消息就完整了
保留性能,并为Dashboard 定义称号
性能好之后的Grafana面板如下:
接上去只须要将定义好的面板的json数据性能消息,cp到greatadm的自定义监控项中,粘贴出来即可。
4、成功自定义监控面板
拷贝性能成功的Grafana面板的json数据,到greatadm自定义面板页面,选用【Edit】
点击【性能的齿轮图标】
选用【JSON Model】--全选--复制即可
点击GreatADM的【监控诉警】---【自定义监控】--【新增监控面板】--粘贴拷贝的json文本
提交即可看到自定义的监控面板了。
雷同的形式性能slow_queries的增长趋向,方法和主机监控的相反,这里就不在重复引见了。全体成果如下2个面板针对不同的监控项做定制。
但此时有人问了,如何将面板都性能在同一页面中呢?
5、多个面板如何性能在同一页面
假设将多个面板如何性能在同一页面中展现呢,比如将慢日志增长趋向的和主机根空间性能在一同。接上去继续看。 选用 【add panel】--参与新的面板
将慢查问增长趋向,反常性能出来
调整--【选项】--【自定义】--【{{address}}:{{port}}:{{name}}】对应【数据库实例IP:端口:实例名】,性能方法齐全不时。
最终在GreatADM页面点击【保留】之后,性能成果如下
验证监控成果; 慢查问增长经过:select sleep(10);select sleep(10);select sleep(10); 参与3条慢查问记载,从9条参与到12条。
磁盘空间经常使用dd 命令,暂时创立1个10G的大文件,看根空间的经常使用率变动,从50%增长到55%
[root@gip /]# dd if=/dev/zero of=/test_root_spacebs=1024M count=10
增长趋向变动可直观的检查到,与实践数据库和主机的值婚配。示意监控项是有效可用可直观观察到变动。
三、自定义监控的经常使用场景和意义
为什么须要自定义监控性能处置了用户和dba现场保养数据库时的几个诉求,以及提供基于业务可定制监控的路径。其意义如下:
1、共性化监控:不同类型的实例或组件须要有不同的视角,但治理平台监控固化,而自定义监控处置了应答多样化的监控需求。自定义监控面板准许治理员选用所需的监控目的和图表,依据自己的实践需求来展现关键的数据库运转数据,提高消息关注度和有效性。
2、重点监控:针对特定的业务需求,治理员可以将自定义面板中的监控目的和图表设置为关器重点,确保数据库的关键性能和性能获取优先监控。
3、运转趋向监控:数据库治理平台自定义监控面板能够提高数据的可视化水平。使数据库性能和肥壮状况更容易了解和剖析。经过设置预警和警报规定,自定义面板有助于及时发现潜在疑问,并采取措施启动干预,确保数据库的稳固运转。 这也是GreatADM再联合诸多业务的实践运维场景,紧贴用户实践需求开发的产品,真正做到易用,好用,可灵敏性能,处置实践疑问为目的,为数据库的颠簸运转保驾护航。