Ep. 14: Monitoraggio distribuito con Checkmk

Per caricare questo video di YouTube è necessario accettare i cookie pubblicitari.

[0:00:00] Bentornati al canale Checkmk. In questo episodio, daremo un'occhiata al monitoraggio distribuito.
[0:00:14] Monitoraggio distribuito significa utilizzare più server Checkmk per creare un unico grande sistema di monitoraggio e ci sono diverse ragioni per creare una configurazione di questo tipo.
[0:00:24] Una potrebbe essere la scalabilità, ad esempio quando si hanno più host di quanti se ne possano monitorare su un singolo server. Anche se le prestazioni di Checkmk gli consentono di scalare molto bene, se si ha un numero molto elevato di host si potrebbe arrivare al punto di aver bisogno di un secondo server Checkmk. A quel punto, potete scegliere di creare 2, 3, 4 o quanti server Checkmk vi servono e collegarli tutti insieme per creare un unico grande sistema di monitoraggio.
[0:00:55] Un'altra ragione potrebbe essere che server Checkmk separati sono gestiti da parti diverse di un'azienda per motivi organizzativi. Ma alla fine si vuole comunque una panoramica completa dell'intero monitoraggio dell'azienda.

[0:01:07]

 

Poi c'è il networking, diciamo che avete una sede a Monaco e una a New York. Se lavorate da New York ma il vostro sistema di monitoraggio si trova a Monaco e ogni volta che interrogate un host situato a New York, i dati fanno ping-pong attraverso l'oceano Atlantico per quattro volte.
[0:01:29] Si potrebbe invece configurare un server locale a New York, che monitorerebbe tutti gli host di New York e poi collegarli tra loro usando il monitoraggio distribuito per monitorare entrambe le sedi.
[0:01:42] Questo coprirebbe anche il problema della disponibilità. Si vuole che il sistema di monitoraggio continui a funzionare anche se non è disponibile una connessione a un sito remoto.
[0:01:54] Sicurezza generale: può accadere che non sia possibile monitorare la sede A dalla sede B per motivi di sicurezza o che esista una DMZ, un'area sicura in cui l'accesso al monitoraggio non è auspicabile.
[0:02:09] In questo caso, si potrebbe creare un sito Checkmk per quell'area sicura e integrarlo nel sistema di monitoraggio più ampio. Vi mostrerò come funziona e come si può creare una configurazione distribuita utilizzando più server Checkmk.
[0:02:25] Il nostro punto di partenza sarà questo normale sito Checkmk con 6 host che abbiamo utilizzato nel corso della serie.
[0:02:33] Ora il passo successivo sarà quello di creare un sito remoto, quindi un secondo sito che vogliamo integrare in questo. Per farlo, passerò alla riga di comando del nostro server Checkmk.
[0:02:46] Normalmente si tratta di un server remoto, ma in questo caso è lo stesso server del nostro server principale. Perché è solo un esempio e funzionerà benissimo.
[0:02:57] Ora creiamo il server con il comando 'omd create'. Quindi 'omd create' e rimaniamo sull'esempio di New York e chiamiamolo 'checkmk_new_york'. Ok e ora che questo è stato fatto possiamo cambiare la password in qualcosa di facile da ricordare.
[0:03:28] Quindi accediamo usando 'su -checkmk_new_york' e ora possiamo copiare questo comando, selezionarlo e copiarlo e incollarlo con il tasto centrale del mouse. E impostiamo la password.
[0:03:59] Ora il primo passo importante è consentire l'accesso da una postazione remota. Il modo in cui funziona è che il sito principale si connette su una porta TCP specifica, per recuperare i dati di stato dal sito remoto. A tale scopo si utilizza il comando 'omd config'.
[0:04:20] Poi si passa al monitoraggio dei distributori. E qui attiviamo il LIVESTATUS_TCP.
[0:04:33] Ora dovremmo anche configurare un indirizzo IP, che è l'indirizzo IP da cui il server è raggiungibile; è anche possibile impostare la crittografia, ma questa è già abilitata per impostazione predefinita. Lascerò la restrizione IP così com'è ora, ma normalmente si consiglia di impostarla sull'indirizzo IP del server principale di Checkmk. Ora possiamo tornare al menu principale. E uscire.
[0:05:07] L'unica cosa che resta da fare è avviare il sito, quindi 'omd start'. Ora siamo al punto in cui questo sito remoto è pronto per essere incluso nel nostro monitoraggio.
[0:05:25] È importante annotare o ricordare la porta su cui ci si connetterà. L'impostazione predefinita è 6557 e non l'ho cambiata, ma se intendete collegare più siti Checkmk a un sito principale e naturalmente dovrete configurare più porte TCP.
[0:05:45] Tutti i passaggi successivi possono essere eseguiti direttamente nell'interfaccia del nostro sito principale. Per farlo, andiamo nel menu di configurazione e cerchiamo il monitoraggio distribuito; qui possiamo aggiungere una nuova connessione al nostro sito remoto. Il nostro sito principale è già stato aggiunto automaticamente, per aggiungere il nostro sito remoto cliccate su aggiungi connessione.
[0:06:10] Per il nostro ID sito, dobbiamo inserire il nome del sito remoto esattamente come lo abbiamo digitato durante l'esecuzione del comando 'omd create'. Quindi, nel nostro caso, checkmk_new_york. E per l'alias useremo New York.
[0:06:34] Importante è l'indirizzo IP del server su cui è in esecuzione il sito remoto e anche la porta TCP che è stata visualizzata nel menu quando abbiamo eseguito il comando 'omd config'.
[0:06:54] Per mantenere tutto sicuro, vogliamo ovviamente utilizzare una crittografia, ma nel nostro caso dovremo deselezionare questa casella.
[0:07:05] Dobbiamo farlo perché ora abbiamo generato un certificato con la nostra ca questo significa che un certificato sul nostro sito remoto è generato automaticamente in modo casuale e quindi purtroppo non possiamo verificarlo.
[0:07:16] Se volete configurare questo sistema di monitoraggio, potete trovare tutte le informazioni nella nostra documentazione. Il live status proxy è una funzione dell'edizione enterprise che ottimizza i tempi di attesa per le connessioni a latenza molto elevata.
[0:07:33] Ad esempio attraverso l'oceano Atlantico e riconosce o rileva anche quando i siti remoti non sono disponibili. Dovrò anche configurare il prefisso URL su cui sarà disponibile l'interfaccia utente del sito remoto. Nel nostro caso sarà l'indirizzo IP seguito dal nome del sito.
[0:08:08] Poi dobbiamo passare all'ultima sezione di configurazione della connessione. Qui abbiamo due opzioni: possiamo dire che il sito è gestito dalla sua stessa sede. Così gli amministratori di New York gestiscono da soli il proprio Checkmk per configurare l'host.
[0:08:25] A Monaco di Baviera, invece, si ha un'unica panoramica centrale dello stato da cui è possibile gestire le operazioni e avere tutti gli approfondimenti.
[0:08:32] L'altra variante, più comune al giorno d'oggi, consiste nell'avere una configurazione centrale, in modo che il monitoraggio sia percepito come un unico grande sistema, mentre a New York non viene toccato nulla, ma tutto viene gestito dal lato di Monaco.
[0:08:50] Per configurarlo, bisogna scegliere di inviare la configurazione a questo sito. Ciò significa che la configurazione del sito principale viene inviata a questo sito remoto. La cosa successiva da fare è impostare l'URL del sito remoto.
[0:09:05] Questo è lo stesso che avevamo prima, quindi possiamo copiarlo, l'unica cosa che dobbiamo aggiungere è "check_ mk /", il resto possiamo lasciarlo così e premere semplicemente Salva.
[0:09:25] La prossima cosa da fare è accedere al sito remoto.
[0:09:29] Finora abbiamo solo impostato una connessione, ma per accedere al sito remoto abbiamo bisogno dell'accesso come amministratore e possiamo quindi inviargli la nostra configurazione. Per farlo, dobbiamo impostare le credenziali per una sessione unica, che si può ottenere facendo clic su questa icona a forma di chiave.
[0:09:23] Le credenziali non saranno memorizzate, ma utilizzate una sola volta per eseguire un handshake iniziale e per questo useremo l'utente cmkadmin. Dobbiamo anche confermare che vogliamo sovrascrivere la configurazione di un host remoto con quella del nostro sito principale.
[0:10:12] Nel nostro caso il sito remoto è vuoto perché lo abbiamo appena creato, ma se avete già lavorato a lungo nel vostro sito remoto e avete centinaia di host al suo interno, questi verranno sovrascritti.
[0:10:24] Quindi integrare un sito con l'host esistente in questo modo non è automaticamente possibile, se si vuole prendere il controllo dell'host esistente è necessario farlo in un altro modo. Quindi digitiamo la nostra password e selezioniamo la casella di controllo per sovrascrivere la configurazione. Ora premete login.
[0:10:49] Vedrete che ora abbiamo impostato una connessione. Il segno di spunta a destra è per la connessione della configurazione, quello a sinistra è la connessione di stato utilizzata per ottenere gli stati di tutti gli host e i servizi.
[0:11:07] Per provare il tutto, aggiungiamo ora un nuovo host al sistema di monitoraggio, che dovrebbe essere monitorato a New York. Al momento siamo ancora collegati al nostro sito principale di Monaco, ma vogliamo aggiungere l'host che è stato creato a New York e ora è molto facile.
[0:11:28] Andiamo semplicemente su setup e poi su host e creiamo un host come faremmo normalmente per aggiungere un host il cui nome sarà checkmk_new_york. Questo sarà il server di monitoraggio a New York. Ora, la cosa importante è l'attributo 'Monitored on site' (Monitorato sul sito) e qui scegliamo su quale sito deve essere creato questo host. Nel nostro caso, New York.
[0:12:03] Ciò significa che questo sito remoto recupererà i dati dall'agente ed è anche possibile che questo sito remoto possa accedere a host nella sua rete a cui il sito principale non può accedere.
[0:12:16] L'unica cosa che resta da fare ora è digitare l'indirizzo IP e premere Salva per passare alla configurazione del servizio.
[0:12:32] Ora è l'host di New York a contattare l'agente e a eseguire il rilevamento del servizio. L'aspetto è praticamente identico a quello che si avrebbe se si aggiungesse un host a una configurazione a sito singolo, e questo è stato fatto apposta perché si vuole dare l'impressione di un unico grande sistema di monitoraggio.
[0:12:52] Premiamo quindi fix all per monitorare tutto e attivare le modifiche. Ora si nota anche un cambiamento, c'è una seconda riga per il secondo sito che abbiamo aggiunto.
[0:13:17] Abbiamo aggiunto l'host al sito di New York, ecco perché vedete questa icona che indica che ci sono modifiche da attivare su questo sito, mentre il nostro sito principale è ancora aggiornato, come indicato dal segno di spunta verde. Ora premiamo su "Attiva sui siti selezionati".
[0:13:40] Verranno riavviati solo i siti che hanno modifiche in sospeso. Come si può vedere, ora entrambi i siti hanno un segno di spunta verde che indica che tutto è aggiornato. E se ora andiamo su tutti gli host, vediamo che c'è un nuovo host qui a New York.
[0:14:09] E nella panoramica si vede che ora ci sono sette host, sei nel nostro sito principale e uno nel sito di New York. In questo modo abbiamo configurato un sistema di monitoraggio distribuito che sembra un unico grande sistema e che presenta i vantaggi di essere scalabile semplicemente aggiungendo nuovi siti, di essere a prova di errore e di poter monitorare aree di rete sicure senza dover ricorrere a un firewall e molto altro ancora.
[0:14:35] C'è anche un elemento o uno snap-in utile per quando si utilizza il monitoraggio distribuito Andiamo in una barra laterale e facciamo clic sull'icona più e ora scorriamo verso il basso c'è un elemento o uno snap-in chiamato stato del sito che possiamo aggiungere facendo clic su di esso.
[0:14:59] Oltre a mostrare lo stato di ciascuno dei nostri siti, possiamo anche usarlo per attivare e disattivare le informazioni o i dati di questo sito. Torniamo quindi alla nostra vista host. E se ora attiviamo o disattiviamo New York. Vedrete che la vista viene aggiornata e tutti i dati di questo sito vengono esclusi.
[0:15:31] È importante sapere cosa succede quando i siti diventano irraggiungibili; uno dei principi importanti del monitoraggio distribuito è che tutti i dati di monitoraggio rimangono sui siti remoti e non vengono trasferiti al sito principale per tutto il tempo; questo è importante perché è uno dei motivi per cui è molto scalabile.
[0:15:46] Se ad esempio avete 100 siti con un milione di host ciascuno, scrivere tutti i dati in un database centrale è del tutto inutile. Non esiste un database al mondo che permetta di scrivere una tale quantità di dati in un periodo di tempo così breve. In questo modo non solo si garantisce la scalabilità, ma ci si assicura anche che il sito remoto possa continuare a lavorare in modo indipendente se la connessione al sito principale è irraggiungibile.
[0:16:18] Oppure, se il sito remoto diventa irraggiungibile, non si vedranno dati obsoleti, ma piuttosto non se ne vedranno affatto, non saranno visibili e lo stato della connessione dirà che è morta e che i dati sono incompleti.
[0:16:29] Quindi, quando un sito remoto è irraggiungibile, è del tutto inutile vedere lo stato di un'ora fa ed è per questo che non mostriamo alcun dato obsoleto.
[0:16:43] Piuttosto diciamo che c'è un problema con la connessione e non appena la connessione torna disponibile riceverete anche lo stato attuale. Quindi non c'è un arretrato di aggiornamenti di monitoraggio, ma al contrario vedrete i dati aggiornati del sito remoto non appena saranno disponibili.
[0:16:54] Questo è quanto per il monitoraggio distribuito e naturalmente ci sono molti altri aspetti interessanti, come ad esempio cosa succede agli avvisi? Cosa succede alla console degli eventi? Tutto questo potete trovarlo nella nostra documentazione.
[0:17:11] Grazie per aver guardato, spero che questo sia stato interessante per voi. In caso affermativo, iscrivetevi al canale, mettete "mi piace" al video e spero di vedervi nel prossimo episodio.

Vuoi saperne di più su Checkmk? Partecipa al nostro webinar "Introduzione a Checkmk".

Registrati adesso

Altri Video di Checkmk