扫码阅读
手机扫码阅读

TiDB丨如何给TiDB集群的prometheus更换端口

388 2023-09-09


TiDB

神州数码云基地

在 TiDB 上的尝试、调研与分享



如何给TiDB集群的

prometheus更换端口

背景

在部署TiDB集群的时候,由于9090端口被操作系统的某个进程占用,在部署TiDB时,只能先将prometheus的端口设置为9091,将原本占用9090端口的进程调整为其它端口后,需要将prometheus的端口从9091改为9090,这就涉及到TiDB集群组件端口的更换。


经过研究,最终发现如果要更改prometheus 组件的监听端口,可以通过tiup 缩容prometheus 组件,然后在扩容prometheus 组件,这样就实现了prometheus端口的更改。


注意事项

通过 tiup 直接缩容 prometheus组件会导致 prometheus 监控数据丢失。

如果是生产环境的话,需要评估下prometheus监控数据的丢失是否能够接受,如果不能够接受prometheus监控数据的丢失,可在缩容prometheus之前,先将prometheus的数据目录备份,在扩容prometheus 之后,再将备份的数据进行还原。

本文并没有备份prometheus的监控数据,而是直接缩容prometheus组件。

因为grafana组件也依赖prometheus的ip和port提供数据源去展示,所以更改 prometheus端口后,grafana需要重新配置prometheus的数据源。

还有一种方法,可以把grafana和prometheus通过tiup一起缩容,然后通过tiup把 grafana和prometheus一起扩容,这样grafana就不需要重新配置prometheus的数据源了。

本文采用的方案就是把grafana和prometheus通过 tiup 一起缩容,然后扩容。

#  1

tiup缩容prometheus和grafana组件

1-1  tiup缩容prometheus组件

· 假设集群名称是tidb-test

tiup cluster display tidb-test -R prometheus


· 获取prometheus组件的ip和port

tiup cluster scale-in tidb-test -N 172.16.1.3:9091


· 假设promethues组件的ip和port分别是172.16.1.3和9091,执行tiup 缩容命令缩容prometheus组件


· 执行命令后,如果出现Scaled cluster `tidb-test` in successfully,则代表缩容prometheus组件成功。

1-2   tiup缩容grafana组件

· 假设集群名称是tidb-test

tiup cluster display tidb-test -R grafana

· 获取grafana组件的ip和port

tiup cluster scale-in tidb-test -N 172.16.1.3:3000

· 假设grafana组件的ip和port分别是172.16.1.3和3000,执行tiup 缩容命令缩容grafana组件

· 执行命令后,如果出现Scaled cluster `tidb-test` in successfully,则代表缩容grafana组件成功。

#  2

tiup扩容prometheus和grafana组件

2-1  tiup扩容prometheus组件

通过tiup 扩容prometheus组件,首先需要写一份yaml 文件 ⬇

prometheus_scaleout.yamlmonitoring_servers: - host: 172.16.1.3 port: 9090 rule_dir: /home/tidb/prometheus

prometheus_scaleout.yaml 文件说明 ⬇

host: 172.16.1.3

#扩容prometheus 组件的服务器ip,由于需要把prometheus扩容到172.16.1.3上,host就是172.16.1.3;

port: 9090

#扩容prometheus 组件的端口,由于需要把prometheus运行在9090端口上,port就是9090;

rule_dir: /home/tidb/prometheus

#如果prometheus的告警配置文件做了一些修改,可以把修改后的prometheus告警配置文件放到rule_dir 定义目录下

其他配置项可以根据实际情况填写

· 假设集群名称是tidb-test

tiup cluster scale-out tidb-test prometheus_scaleout.yaml

· 执行tiup 扩容命令扩容prometheus

· 执行命令后,如果出现Scaled cluster `tidb-test` out successfully,则代表扩容prometheus组件成功

tiup cluster display tidb-test -R prometheus

· 扩容prometheus后,检查下扩容的prometheus组件状态是否正常

2-2  tiup扩容grafana组件

通过tiup 扩容grafana组件,首先需要写一份yaml 文件 ⬇

grafana_scaleout.yamlgrafana_servers: - host: 172.16.1.3

grafana_scaleout.yml 文件说明 ⬇

grafana_servers:

host: 172.16.1.3

#扩容grafana组件的服务器ip,由于需要把grafana扩容到172.16.1.3上,host就是172.16.1.3

其他配置项目例如port等信息可以根据实际情况填写

· 假设集群名称是tidb-test

tiup cluster scale-out tidb-test grafana_scaleout.yaml

· 执行tiup 扩容命令扩容grafana组件

· 执行命令后,如果出现Scaled cluster `tidb-test` out successfully,则代表扩容grafana组件成功

tiup cluster display tidb-test -R grafana

· 扩容grafana后,检查下扩容的grafana组件状态是否正常

#  3 检查prometheus和grafana

工作是否正常

在通过对prometheus和grafana 组件进行缩容和扩容后,

登录(http://172.16.1.3:3000/) grafana ,


检查下grafana监控面板是否能够从prometheus 采集数据进行展示,

如果扩缩容步骤能够顺利执行,prometheus和grafana的工作状态是正常的。

写在最后

虽然更换promethues的监听端口这种操作并不是很频繁,但是有时候也可能碰到这样的需求。

通过tiup,我们可以将prometheus进行缩容和扩容,这样实现了更换prometheus的监听端口。

而且步骤比较简单,如果需要更换TiDB集群其它组件的端口,也可以采取类似的步骤进行操作。

以上就是关于通过tiup

实现更换prometheus的监听端口

如果你对此内容感兴趣或有疑问

欢迎入群探讨 ⬇


原文链接: http://mp.weixin.qq.com/s?__biz=Mzg5MzUyOTgwMQ==&mid=2247513571&idx=1&sn=33a29deb21a7b82c59661fbf5eafc479&chksm=c02f8e45f7580753c990d481e1f2ba0d2530d4e7823a6f45ce3cf31bfcfb231cec90f54c4125#rd