Ep. 17: Lavorare con le topologie di rete in Checkmk
[0:00:00] |
Bentornati sul canale di Checkmk e in questo episodio daremo un'occhiata ai genitori e alla topologia di rete. |
[0:00:16] | Gli argomenti di oggi sono i genitori e la topologia di rete. Vi mostrerò come potete usarli per evitare notifiche inutili. |
[0:00:24] | Per questo video utilizzeremo ancora una volta il nostro sistema di prova. Siamo di nuovo nella nostra piccola configurazione distribuita. Abbiamo un totale di 10 host. Passiamo rapidamente a Monitor e a Tutti gli host. |
[0:00:38] | Abbiamo quattro server di database. Abbiamo due server Checkmk. Abbiamo un server web e tre switch. Ora andiamo su Monitor e poi su Topologia di rete e abbiamo questo diagramma simile a una nuvola. |
[0:00:56] | Ciascuno dei nostri siti Checkmk è rappresentato da questo nodo viola. Tutti i nodi intorno sono gli host monitorati da quel sito. |
[0:01:10] | Tutte le note verdi sono host attivi, che al momento non presentano problemi. Poi c'è questo host rosso che è down, ma a parte questo non mi dice molto. Creiamo ora una topologia più interessante e parliamo del motivo per cui lo faremo. |
[0:01:31] | Oltre ai nostri server di database, al server web e ai server Checkmk, abbiamo anche tre switch. E ora supponiamo che questi quattro server di database siano accessibili solo tramite lo switch1. Cosa succederebbe se questo switch si spegnesse? |
[0:01:49] | Allora i nostri quattro server di database non sarebbero più accessibili per un sistema di monitoraggio e otterrebbero lo stato "Down". Questo comporterebbe molte notifiche, non solo per lo switch ma anche per i server di database. |
[0:02:06] | Sarebbe più utile ricevere una notifica relativa al problema dello switch, che includa l'informazione che i server di database a valle non sono più accessibili per il sistema di monitoraggio. Per questo, in Checkmk esiste uno stato chiamato irraggiungibile. |
[0:02:21] | Se questo è il caso, di norma non si riceveranno notifiche relative ai server di database perché se ne è già ricevuta una per lo switch. |
[0:02:30] | Potrebbe accadere che il server di database funzioni perfettamente e sia accessibile agli utenti, ma non al sistema di monitoraggio. Per far sì che questo funzioni, dobbiamo configurare in Checkmk l'accesso ai server di database tramite lo switch. A questo scopo, esiste una proprietà chiamata Genitori. Quindi, andiamo avanti e modifichiamo uno dei nostri host. |
[0:02:56] | Come sempre, andiamo su Setup e poi su Hosts e poi sulla cartella Munich, Servers, e modifichiamo db-2-server. |
[0:03:11] | Ora c'è questa proprietà chiamata Parents. Selezioniamo la casella e ora possiamo selezionare l'host padre, scegliendo 'switch1'. Ora salviamo e attiviamo le modifiche. Se ora torniamo alla topologia di rete, a Monitor e poi a Topologia di rete, vediamo che il diagramma è ancora lo stesso. |
[0:03:44] | Per vedere i bambini dobbiamo aumentare il numero di hop. Ora si vede che il db-server-2 è connesso allo switch 1. La direzione delle linee indica la direzione in cui scorrono i dati. |
[0:04:03] | Qui si vede che i dati vanno dal db-server-2 allo switch1 e poi al sito di monitoraggio. Ora Checkmk sa che per raggiungere un server di database deve passare attraverso questo switch. Quindi, quando uno switch si guasta, sa che non dovrebbe essere in grado di raggiungere il server di database. Ora facciamo lo stesso per tutti gli altri server di database. Torniamo alla configurazione dell'host. |
[0:04:35] | Per prima cosa, rimuoviamo il genitore da db-server-2. Salva. Ora, invece di impostare esplicitamente il genitore su tutti i server, possiamo tornare a Monaco e modificare la cartella Servers. Impostiamo quindi il genitore a livello di cartella, switch1, salviamo e attiviamo le modifiche. |
[0:05:16] | E ora torniamo alla topologia di rete. Aumentiamo di nuovo il numero di hop e ora vediamo che ogni singolo host della cartella è connesso a switch1. Ogni volta che aggiungiamo un nuovo host a quella cartella, esso saprà automaticamente o Checkmk saprà automaticamente che è accessibile solo tramite lo switch1. |
[0:05:48] | La prossima cosa da fare è provare se funziona davvero. E come possiamo farlo? Beh, lo switch1 deve spegnersi per vedere cosa succede. Ma poiché questo è un sistema di prova, non posso semplicemente spegnere lo switch. Dobbiamo fare un piccolo trucco. |
[0:06:11] | Se facciamo clic con il pulsante destro del mouse sull'host e poi andiamo su Dettagli dell'host e quindi modifichiamo la proprietà dell'host, facciamo clic sul nome dell'host e poi su Configurazione host. Invece di spegnere lo switch, modificheremo semplicemente l'indirizzo IP. Attivare le modifiche. |
[0:06:44] | Ora il nostro host o Checkmk dovrebbe presumere che il nostro host sia inattivo. Aumentando il numero di hops, ora si vede che lo switch 1 è down. Si vede anche che db-server-1 è ora irraggiungibile. Prima non era raggiungibile, ma ora Checkmk presume che non lo sia, probabilmente a causa del fatto che lo switch 1 non funziona. |
[0:07:10] | Ci si potrebbe chiedere perché gli altri tre server di database non siano passati allo stato irraggiungibile. Normalmente in un sistema reale probabilmente lo sarebbero, ma poiché questo è un sistema di prova e Checkmk è ancora in grado di eseguire il ping di questi host, rimarranno attivi. |
[0:07:27] | Ciò significa che se Checkmk è ancora in grado di raggiungere l'host anche se il genitore è down. Questi rimarranno attivi e Checkmk continuerà a monitorarli come al solito. |
[0:07:42] | Ma cosa succede se si dispone di un sistema con switch ridondanti? Se gli host sono accessibili attraverso più di uno switch, finché uno degli switch è funzionante, l'host dietro di esso dovrebbe essere accessibile. |
[0:07:56] | In questo caso, non si avrà una struttura ad albero ma una struttura a maglie, che si può configurare anche in Checkmk. Quindi, ancora una volta, andiamo alla configurazione degli host. Configurazione --> Host. E torniamo alla cartella che stavamo modificando. |
[0:08:12] | Forse l'avete già visto, qui in Genitori è possibile selezionare più genitori. Quindi aggiungiamone uno, aggiungiamo switch2. Ancora una volta, salviamo e attiviamo. Ora torniamo alla topologia di rete. Aumentiamo il numero di hop. |
[0:08:42] | Vedete che è diventato un po' più disordinato e questo perché tutti questi server sono ora collegati sia allo switch1 che allo switch2. Quindi lo switch2 e lo switch1 sono collegati al sito e tutti gli altri server sono collegati a questi switch. |
[0:09:00] | Vedrete anche che ora db-server-1 non è più irraggiungibile, ma è down. Perché Checkmk vede che dovrebbe essere accessibile tramite switch1 e switch2 e uno di questi è funzionante, quindi sa che il problema risiede nell'host stesso con db-server-1 e non nello switch. |
[0:09:25] | Come potete vedere, Checkmk ha la possibilità di mappare la topologia di rete, soprattutto per evitare avvisi inutili. E quando parliamo di topologia di rete in Checkmk intendiamo la topologia dal punto di vista del sistema di monitoraggio. |
[0:09:40] | Quindi come Checkmk raggiunge gli host e non la topologia di rete in generale. Se si dispone di una configurazione distribuita, ogni sito ha la propria topologia e questo perché il monitoraggio avviene localmente dal sito. |
[0:09:56] | Se si configura correttamente la topologia di rete e Checkmk, si possono evitare molti avvisi non necessari e questo è assolutamente consigliato, soprattutto se si hanno alcuni siti con una grande quantità di host accessibili solo tramite alcuni router o switch. |
[0:10:14] | Questo è quanto per questo episodio sulla topologia di rete. Spero che vi sia stato utile. In caso affermativo, iscrivetevi al nostro canale e mettete "mi piace" al video. Alla prossima puntata. |
Vuoi saperne di più su Checkmk? Partecipa al nostro webinar "Introduzione a Checkmk".