应用GaussDB的可观测性才干构建缺点模型
D-SMART高斯专版曾经开发了几个月了,目前关键技术疑问都曾经处置,也能够初步看到大略的相貌了。有好友问我,Gaussdb未曾经有了TPOPS了,为什么你们还要开发D-SMART高斯专版呢?实践上TPOPS和D-SMART只管都可以用于Gaussdb的运维监控,不过其分工还是十分显著的。TPOPS是华为GaussDB自带的运维工具,从数据库部署开局就不时可以经常使用。TPOPS+DBMind也具有必定的运维剖析才干,不过这些性能都是基于传统的运维治理理念的。D-SMART是一个运维常识智能化系统,其目的是成功愈加数字化的运维监控、缺点预警、根因剖析(RCA)、智能化巡检等,今后还会附丽D-SMART的数据构建线上的SAAS生态。D-SMART是一个十分弱小的常识智能化平台,可以不时积淀用户自己的运维常识,包括各种肥壮模型、缺点模型和诊断工具。这些都是TPOPS不具有的性能,因此D-SMART可以作为TPOPS的有效补充。
另外一方面,D-SMART高斯专版会允许一切的高斯生态产品,蕴含华为GaussDB集中式/散布式,openGauss、南大通用GBASE 8C、海量Vastbase、神通数据库、磐维、MogDB等。
D-SMART是从运维视角来看待GaussDB的。从入口上,D-SMART与TPOPS的视角就齐全不同。
经常使用过D-SMART的用户送GaussDB专版没有任何学习老本,可以很轻松的经过工具去对GaussDB集群启动剖析。
配套的D-SMART V2.6版本提供了一个图形化的集群拓扑。让习气于图形界面的DBA看起来愈加温馨。
在集群拓扑上可以点击CN/DN节点启动下钻。在D-SMART中,每个有散布式CN/DN节点和集中式DN节点三种子类型,目前咱们把它们作为PG兼容子类来看待。由于GaussDB和openGauss都有少量的监控视图与PG兼容,可以复用局部PG的工具,因此咱们没有给openGauss/GaussDB节点独立的数据库类别。只管如此,GaussDB、openGauss和PostgreSQL三种数据库子类在可观测性视图方面曾经有了很多差异。作为可观测性才干而言,GaussDB>openGauss >PostgreSQL。更强的可观测性象征着更为弱小的智能化/智能化剖析才干。
缺点模型告警和诊断工具依然沿用D-SMART传统的形式,目前工具的开发还在继续启动中,不过基于运维常识图谱的通用剖析工具曾经是可用的了。智能目的剖析与告警时序剖析、期待事情智能剖析等工具曾经可以经常使用了。
基于GaussDB弱小的可观测才干,目前缺点模型的梳理上班也停顿顺利,和一些其余的国产数据库不同的是,咱们显著感到能够梳理进去的缺点模型数量太多了,刚刚颁布的时刻或许就会有上百个缺点模型,比咱们2018年颁布Oracle版本时的缺点形式数量还要多出不少。
缺点模型是对数据库运维阅历的一种总结,能够构建其丰盛的缺点模型关于承载大型关键运行系统十分关键。而缺点模型的构建依赖于弱小的可观测才干,以及将数据库形态目的化的才干,再辅以专家的阅历才干成功。这种才干可以让一些原本须要专家才干发现的疑问成功智能化发现与智能化预警。
目前咱们针对GaussDB的缺点模型触及组件肥壮形态、容量、高可用、并发、负载、性能、资源、实例肥壮、义务等维度。实践上这是针对GaussDB集群的缺点模型,针对每个组件,比如CN/DN,以及承载CN/DN的主机也都会设计缺点模型。这样才干保证整个数据库运转环境产生疑问,都能够被提早发现。
散布式数据库的运维工具开动员来比拟费事,在前面的开发环节中咱们也遇到了很多疑问,比如DN节点的切换后,系统是否立刻无缝跟踪到这个变动,假设复制组中存在配件性能上的不同,或许会影响模型的评价,如何能够在每隔2-3分钟的评价中避开数据失误,这些都在不时的完善中。这个月底宿愿有一个评价版本可以成功,届时也宿愿消费环境中有GaussDB的好友能一同协作来验证工具。有兴味的好友可以关注“DBAIOPS社区”群众号给咱们留言。