Alert Manager

GUI ile erişimde Alert Manager için aşağıdaki alandan erişebilirsiniz.

Bu ekran ilede size uyarı olarak gelecek olan alerletlerin hangi ekrandan ayarladnığını görebilirsiniz.

Alert ayarlarında sizlere create receiver dediğinizde 4 tane ulaştırma şekline desteğini görebilrisniz.

aşağıdaki komut ile default olarak kurulan ve yapınıza göre kurulmuş olan alert amanger podlarını görebilirsiniz ve eğer alert managerlerinzi çalışmıyor ise pod kontrollerinizi yapabilirsiniz.

oc get pods --namespace openshift-monitoring
NAME                                                     READY   STATUS    RESTARTS      AGE
alertmanager-main-0                                      6/6     Running   6             181d
alertmanager-main-1                                      6/6     Running   6             181d
cluster-monitoring-operator-7f799f99c9-vq49g             1/1     Running   0             24d
kube-state-metrics-57f85cf65c-tnrqf                      3/3     Running   3             182d
monitoring-plugin-757756d599-xfd6w                       1/1     Running   1             182d
monitoring-plugin-757756d599-xl7ck                       1/1     Running   1             182d
node-exporter-2ds76                                      2/2     Running   6             185d
node-exporter-bfmck                                      2/2     Running   10            185d
node-exporter-m89md                                      2/2     Running   10            185d
node-exporter-p8b7p                                      2/2     Running   6             185d
node-exporter-p9swj                                      2/2     Running   8             185d
node-exporter-qz786                                      2/2     Running   8             185d
node-exporter-tqr5p                                      2/2     Running   8             185d
node-exporter-twrx8                                      2/2     Running   10            185d
node-exporter-wwxmn                                      2/2     Running   14            185d
openshift-state-metrics-6769fb8d9b-92dd8                 3/3     Running   4             182d
prometheus-adapter-bbfbf5485-gf5kd                       1/1     Running   0             4d16h
prometheus-adapter-bbfbf5485-j2zm5                       1/1     Running   0             4d16h
prometheus-k8s-0                                         6/6     Running   8 (24d ago)   181d
prometheus-k8s-1                                         6/6     Running   8 (24d ago)   181d
prometheus-operator-5c4c774bbc-cv49b                     2/2     Running   2             182d
prometheus-operator-admission-webhook-64956cc4f8-4krrg   1/1     Running   1             182d
prometheus-operator-admission-webhook-64956cc4f8-r4bbf   1/1     Running   1             182d
telemeter-client-5d4bc4bd79-kwqfp                        3/3     Running   3             26d
thanos-querier-5b5b6d574f-m6f64                          6/6     Running   7 (24d ago)   181d
thanos-querier-5b5b6d574f-x92m8                          6/6     Running   6             181d

Burada yulkarıdaki listede alertmanager-main-0 ve alertmanager-main-1 defult olarak kurulanlardır diğerleri sizlerin OCP ortamınızdan hangi alanlardan alerting yapacaksınız ona göre yapıtınzı ayarlar ile eklenir ve çıkarılır.

Bir alarmı geçici bir süre dururmak sitedinzi emela konuyu biliyorsunzu ve 1 gün size artık mail yada hangi bildirim yönetimi sçeti iseniz oradan bilgi gelsin istmiyorsunuz aşağıdaki komut setini kullanabilirsiniz.

oc exec pod/alertmanager-main-0 --namespace openshift-monitoring -- amtool silence add 'alertname=FluentdNodeDown' --alertmanager.url="http://localhost:9093" --duration="1d" --comment="temporarily silencing this alert for 1 day"

Sesiz moda alınan alarmların listesini görmek için aşağıdaki komutu kullanabilirsiniz.

oc exec pod/alertmanager-main-0 --namespace openshift-monitoring -- amtool silence --alertmanager.url="http://localhost:9093"

Yada bu işlemi GUI ile aşağıdaki resimdeki gibi sıralama ile yapabilirsiniz. Hangi alarm için olduğuna dikkat etmeyi unutmayınız.

Last updated