Ep. 36: Introduzione ai diversi tipi di check per il monitoraggio con Checkmk

Per caricare questo video di YouTube è necessario accettare i cookie pubblicitari.

[0:00:00] Cosa sono i check e i servizi in Checkmk? Scopriamolo.
[0:00:13] Benvenuti nel canale Checkmk. Potreste esservi imbattuti in diversi termini quando guardate Checkmk.
[0:00:20] Servizi, Checks, Active checks, Passive checks. Ci sono check locali e check MRPE. E ci sono anche plugin nativi o plugin in generale.
[0:00:32] Ci sono molti termini e a volte questo crea confusione. Quindi, in questo video, daremo un'occhiata più da vicino a tutti questi termini e imparerete cosa siano e come differenziarli.
[0:00:44] Iniziamo con il primo. Diamo un'occhiata ai servizi e ai check. Quindi, diamo un'occhiata al nostro host di esempio qui.
[0:00:54] Se ci spostiamo nella configurazione dei servizi, c'è un modo molto semplice per vedere e capire la differenza tra servizi e check.
[0:01:05] Abbiamo la possibilità di mostrare i nomi dei plugin. Se diamo un'occhiata, possiamo vedere che ci sono i servizi sul lato sinistro. Questa è la colonna qui.
[0:01:17] E abbiamo i check plugin, che sono su questo lato. Si tratta di quelli che comunemente vengono chiamati check, in realtà sono plugin di controllo. Qui si può vedere, per esempio, il plugin df check.
[0:01:30] È presente diverse volte e ogni volta è un servizio. Quindi, un servizio è fondamentalmente il risultato di un plugin di controllo. E un plugin di controllo può creare diversi servizi o diverse istanze, se vogliamo metterla in questo modo.
[0:01:44] Questa è la differenza principale. In questa vista, si può vedere immediatamente la differenza e di cosa si tratta.
[0:01:53] Di conseguenza, se volete disabilitare i servizi, ad esempio, potete pensare a come affrontare la questione. Perché se guardiamo qui, vediamo che c'è il plugin df.
[0:02:05] Quindi, per esempio, se volete disabilitare tutti i controlli del file system per qualche motivo, non vedo il motivo, ma solo per una questione dimostrativa, dovreste disabilitare tutti i servizi del file system.
[0:02:17] Quindi possiamo dare un'occhiata a Impostazione, cercare Disabilitato. E qui abbiamo l'opzione, diciamo, Controlli ("Check") disabilitati.
[0:02:25] Questo disabiliterà il plugin del file system o, in questo caso, nello specifico, il plugin df.
[0:02:31] Ciò significa che non si otterrà alcun servizio sui file system, indipendentemente dalla loro posizione, a seconda di come si configura la regola, naturalmente. Ma questo disabilita il monitoraggio di tutti i file system.
[0:02:44] Se si vuole disabilitare il monitoraggio solo di alcuni file system, si può scegliere la regola Disabilita servizi, che disabilita di fatto solo i servizi inseriti.
[0:02:55] Ad esempio, se non si vuole monitorare il file system root o l'unità C di un sistema Windows, non ha alcun senso, non farlo, ma si può fare in questo modo.
[0:03:06] Questo è particolarmente interessante se pensiamo ai dispositivi SNMP, perché in questo caso c'è la possibilità di disabilitare le sezioni.
[0:03:15] Quindi, se si disabilitano i servizi, li si disabilita semplicemente sul lato server. Le informazioni vengono comunque interrogate, ma il server non le visualizza nella configurazione di monitoraggio in esecuzione.
[0:03:26] Con i dispositivi SNMP, ciò significa che tutte le informazioni vengono ancora interrogate. Ma questo non è il caso, perché si vuole ridurre il carico.
[0:03:33] Se non si vede un servizio, non è necessario interrogare le informazioni. In questo caso, si opta per le sezioni disabilitate, perché in questo caso non si recuperano nemmeno.
[0:03:44] Questo funziona anche per l'agente, quindi si potrebbero disabilitare anche sezioni complete e non recuperare le informazioni.
[0:03:49] Fine della prima parte. Si è trattato della differenza tra servizi e controlli e del modo in cui si può lavorare per disabilitarli.
[0:03:58] Vediamo ora cosa sono i check attivi e passivi e cosa significano.
[0:04:07] A tal fine, ci colleghiamo nuovamente al nostro host di esempio, ma questa volta nella configurazione di monitoraggio in esecuzione. Eccoci qui.
[0:04:15] Possiamo vedere tutti i servizi presenti e utilizzerò un piccolo trucco per mostrare facilmente ciò che sta accadendo.
[0:04:24] Questo potrebbe aiutarvi anche nell'attività quotidiana. Cambierò la visibilità dell'icona incorporata e voglio che il pulsante di riprogrammazione sia direttamente nella colonna.
[0:04:38] Vedrete tra poco cosa fa. E se ora torniamo al nostro host, possiamo vedere i cerchi qui, che vengono utilizzati per riprogrammare il check.
[0:04:50] Quindi, se vogliamo avere informazioni aggiornate, possiamo riprogrammare il servizio Checkmk e recuperare tutte le informazioni.
[0:04:57] Se avete già lavorato con Checkmk, sapete che l'agente recupera tutte le informazioni in una volta sola e poi sul lato server vengono calcolati i risultati.
[0:05:05] E possiamo vederlo qui, perché l'agente Checkmk ha un cerchio giallo. E la maggior parte degli altri servizi, come quelli del file system, ad esempio, se scorriamo verso il basso la maggior parte dei servizi che abbiamo qui, hanno un cerchio grigio, e ciò significa che si tratta di check passivi.
[0:05:23] E se ci passiamo sopra, possiamo vedere che c'è scritto "Riprogrammare il servizio 'Checkmk'", il che significa che se riprogrammiamo uno di questi servizi, il servizio Checkmk verrà riprogrammato e recupererà tutte le informazioni.
[0:05:36] Questa è la differenza. Un check passivo riceve informazioni da una fonte di dati e poi viene presentato qui. Un check attivo fa direttamente qualcosa.
[0:05:47] Quindi, in questo esempio, questo è l'agente Checkmk. Sta recuperando attivamente le informazioni e ci sono altri check, come si può vedere.
[0:05:54] Quindi, abbiamo il servizio di discovery e il servizio di inventario hardware e software, entrambi sono check attivi.
[0:06:00] Non si basano sull'agente stesso, ma vengono eseguiti direttamente. Inoltre, abbiamo, ad esempio, altri check di cui parleremo tra poco, anch'essi attivi e non basati sull'agente.
[0:06:17] Questo è il concetto generale di passività e di attività. Il prossimo argomento da trattare sono i controlli MRPE.
[0:06:28] I check MRPE provengono dal vecchio mondo Nagios o da plugin compatibili con Nagios, e Checkmk può integrarli, ed è questo che chiamiamo MRPE.
[0:06:40] Si tratta di un sistema che consente di utilizzare questi plugin proprio come se fossero plugin di Checkmk.
[0:06:47] Sì, a dire il vero stanno diventando un po' rari. Ci sono alcuni casi d'uso, ma Checkmk copre la maggior parte dei casi d'uso che avete, quindi è molto raro che poteste averne bisogno.
[0:07:00] Ma è comunque possibile integrare questi plugin, che ovviamente non sono configurabili attraverso l'interfaccia utente, o almeno non in modo così semplice come i check nativi di Checkmk.
[0:07:12] Sono comunque disponibili. La cosa successiva per estendere i servizi che state monitorando o per estendere i plugin sono i cosiddetti check locali.
[0:07:21] Sono il modo più semplice per estendere il monitoraggio, perché è possibile scriverli in qualsiasi linguaggio che l'agente Checkmk può eseguire, a seconda che si tratti di Windows o Linux, ad esempio.
[0:07:32] È possibile utilizzare il linguaggio desiderato, ma tutta la logica si trova all'interno del plugin, si tratta quindi di un file che viene eseguito dall'agente e deve essere eseguibile.
[0:07:42] Si inserisce tutta la logica e si deve solo seguire un certo formato nell'output, che viene poi inviato a Checkmk sul server di Checkmk.
[0:07:50] E questo calcolerà i risultati, ma senza effettuare alcuna configurazione dal lato server di Checkmk. E come appare? Lo possiamo vedere nell'interfaccia web, perché ho già preparato un controllo qui.
[0:08:09] Ecco questo piccolo servizio, Il mio primo servizio. È un esempio tratto dalla nostra guida ufficiale e potete vedere che è in uno stato OK.
[0:08:18] Dice semplicemente: "Sì, questo è un servizio statico, è sempre OK". E cosa sembra dal lato dell'agente?
[0:08:25] Possiamo vederlo nel terminale proprio qui. Quindi, se do un'occhiata al file, l'ho già messo nella cartella locale dell'agente, e si può vedere che si chiama semplicemente foo.sh.
[0:08:37] E se lo guardiamo, possiamo vedere il formato di base di questo controllo locale, che è semplicemente il codice di stato.
[0:08:45] In realtà, se lo sostituiamo, ad esempio, con 1 per uno Stato di avviso e lo scriviamo, lo vedremo nell'interfaccia utente tra pochi istanti, e dopo il campo dello stato abbiamo la descrizione del servizio. È da qui che proviene il servizio My 1st.
[0:09:02] Se ci sono degli spazi vuoti, bisogna citare la stringa, altrimenti basta eliminare gli spazi vuoti. Ma siete liberi di dare un nome al vostro servizio, completamente libero.
[0:09:12] Poi qui, dove c'è il - è possibile inserire i dati sulle prestazioni, che verrebbero effettivamente calcolati da Checkmk. In questo caso non c'è, quindi c'è questo -.
[0:09:22] L'ultima parte è l'output lungo, dove si può scrivere tutto ciò che si vuole. Questo viene inviato al server di Checkmk e, come avete visto, viene mostrato nel riepilogo del servizio.
[0:09:33] Quindi, tornando all'interfaccia utente, si può notare che, come ho detto, lo stato è cambiato perché è interamente basato sullo script, ma tutto il resto è rimasto invariato.
[0:09:47] Il nome del servizio è lo stesso e anche l'output lungo, perché non l'ho cambiato. È lo stesso e continua a dire "è sempre tutto ok", anche se non è così.
[0:09:55] Si tratta quindi di un modo molto semplice e alla portata di tutti per estendere il monitoraggio, ma è anche piuttosto limitato nelle possibilità di utilizzo. L'ultima opzione è il plugin Native Checkmk.
[0:10:13] E questo è davvero il gold standard che vorreste avere alla fine.
[0:10:18] Ma per farlo bisogna avere competenze in Python, perché è necessario codificare qualcosa, avere un plugin di controllo sul lato server, che calcola i risultati dei dati recuperati.
[0:10:31] È necessaria una sorta di plugin per il sito agente che recuperi i dati che il plugin di controllo deve consumare e calcolare.
[0:10:38] Potrebbe trattarsi, ad esempio, di un controllo SNMP, quindi potrebbe recuperare un SNMP o un ID e usare il plugin di controllo per calcolare quei dati.
[0:10:46] Oppure si potrebbe inserire un pezzo di codice nell'agente che recupera alcune informazioni dal sistema, le invia al server Checkmk e il plugin di controllo calcola il risultato.
[0:10:58] Ma ho già detto che per iniziare è necessario avere qualche conoscenza di Python, e anche che alla fine si otterrà la stessa esperienza dei plugin integrati che forniamo già con Checkmk.
[0:11:10] Con questo vi lascio per oggi. Grazie mille per averci seguito. Assicuratevi di abbonarvi al canale per non perdere mai un altro video. A presto.

Vuoi saperne di più su Checkmk? Partecipa al nostro webinar "Introduzione a Checkmk".

Registrati adesso

Altri Video di Checkmk