Ep. 44: Lavorare con l'integrazione Datadog in Checkmk
[0:00:00] | Benvenuti nel canale Checkmk. Oggi parlerò dell'integrazione con Datadog. |
[0:00:14] | Questa integrazione ci permette di correlare i dati di due sistemi, di accelerare l'analisi delle root cause e di facilitare la comunicazione tra gli utenti di Checkmk e Datadog. |
[0:00:25] | Ecco cosa vi mostrerò. Quindi, senza ulteriori indugi, iniziamo. Ecco una nuova istanza di Checkmk. Prima di attivare l'integrazione con Datadog, dobbiamo completare alcuni prerequisiti, ovvero la creazione di un host, il caricamento della chiave API e della chiave dell'applicazione nell'archivio delle password e, infine, la creazione delle regole della console eventi. |
[0:00:50] | Per creare un host, dobbiamo fare clic su Impostazione, Host, Aggiungi monitoraggio host. Definiamo qui il nome dell'host. Non vogliamo eseguire il ping di questo host, quindi lo impostiamo su Nessun IP. Il resto può rimanere così com'è. Fare clic su Salva e andare alla cartella. |
[0:01:10] | Prima di attivare le modifiche, possiamo anche caricare la nostra chiave API e la chiave dell'applicazione. Per farlo, dobbiamo fare clic su Password, Aggiungi password. Sotto ID unico, possiamo definire la chiave API di Checkmk. |
[0:01:28] | È possibile assegnarle un nome qualsiasi. In questo caso, la chiamerò checkmk_api_key. E si può anche aggiungere un commento alla voce Password. Ora dobbiamo tornare all'interfaccia utente di Datadog per recuperare la chiave API e caricarla nell'archivio delle password. |
[0:01:48] | Andiamo all'interfaccia web di Datadog. È necessario selezionare l'organizzazione. Andare alle Impostazioni dell'organizzazione. Chiavi API. Fare clic su questa chiave API, copiarla e incollarla qui. Allo stesso modo, è necessario ripetere questa procedura per la chiave dell'applicazione. |
[0:02:14] | Anche in questo caso è necessario assegnare un nome univoco. Ora dobbiamo incollare la chiave dell'applicazione nello stesso modo. |
[0:02:26] | Selezionate la chiave di applicazione, copiatela e incollatela nel campo Password. Quindi, possiamo salvare. E ora possiamo attivare le modifiche. |
[0:02:44] | Abbiamo quindi già completato due prerequisiti. Ora andremo nella Console eventi per compilare il terzo prerequisito. Si trova nel menu Setup. |
[0:02:56] | Avete già un pacchetto predefinito. Nel pacchetto predefinito, è possibile creare diversi filtri o regole che verranno utilizzati per elaborare i messaggi e gli eventi ricevuti da Datadog. |
[0:03:16] | Ho già configurato queste regole in precedenza per risparmiare tempo. In fin dei conti, quello che stanno facendo è cercare un modello e, in base al modello, progettare uno stato. |
[0:03:32] | Lo stesso vale per i log. Ogni volta che i log sono a posto con il messaggio "Nessun dato ricevuto", verrà impostato lo stato come questo log. Ok, quindi i nostri prerequisiti sono stati completati. Ora possiamo tornare all'integrazione con Datadog. |
[0:03:49] | Si trova nel modulo Setup. È necessario andare in Altre integrazioni, fare clic su Datadog, fare clic su Aggiungi regola. E qui dovete definire il motivo per cui lo state facendo. È un'integrazione di Datadog, se lo sapete. |
[0:04:07] | Alla voce Commento, definite il motivo per cui lo state facendo. Collegamento all'URL della documentazione. E poi possiamo passare direttamente alla compilazione del modulo relativo all'istanza Datadog. |
[0:04:20] | Abbiamo già caricato la chiave API e la chiave di applicazione nell'archivio delle password, dobbiamo solo importarle qui. Abbiamo importato la chiave API. Importeremo anche la chiave di applicazione. |
[0:04:36] | Il mio host API rimarrà invariato perché la mia istanza di datadog è in esecuzione in Europa. Quindi, l'endpoint API o il nome dell'host API è api.datadog hq.eu. Non ho bisogno di definire un proxy perché posso connettermi dalla mia istanza Checkmk all'istanza Datadog senza alcun proxy in mezzo. Quindi, tralascerò questa opzione. |
[0:05:07] | Poi possiamo passare subito alla ricerca dei monitor. Facendo clic su monitor, è possibile applicare alcune restrizioni in base ai tag o ai tag dei monitor. Ogni volta che i monitor vengono recuperati da Datadog all'interno di Checkmk, vengono creati come controlli di servizio separati. |
[0:05:28] | Quindi, se nell'organizzazione sono presenti tre monitor o a seconda del filtro, verranno creati altrettanti monitor come controlli di servizio. Ora selezioniamo gli eventi. L'età massima degli eventi recuperati è di 10 ore al massimo. Posso impostarla a un'ora. |
[0:05:56] | La restrizione e la visualizzazione dei tag nella Console eventi possono rimanere invariate. Le altre impostazioni, come la struttura Syslog, la priorità Syslog, sono abbastanza standard per le regole della Console eventi. Inoltre, non aggiungerò alcun testo agli eventi, quindi anche questo può rimanere così com'è. |
[0:06:18] | Ora selezioniamo la voce Recupera registri. Anche in questo caso dobbiamo definire un'età massima per i log di recupero. Per impostazione predefinita è di 10 minuti, quindi la modificherò a un'ora. |
[0:06:32] | Nella query di ricerca dei log è possibile definire la sintassi di ricerca dei log di Datadog. Quindi, il modo in cui si cerca all'interno del flusso di log o nella sezione di log di Datadog, definendo una query. Lo stesso tipo di query si può definire anche qui. |
[0:06:52] | Non definirò nulla perché voglio recuperare tutto ciò che è disponibile nel flusso di log. Per quanto riguarda gli indici, ho definito un *, il che significa che utilizzerà tutti gli indici. |
[0:07:07] | Non c'è nulla sulla struttura Syslog, il livello di servizio rimane invariato. Il testo degli eventi inoltrati può essere costruito in base agli attributi della voce di log. Si tratta di un nome e di una chiave. |
[0:07:20] | Quindi, ho dato qui messaggio, messaggio. Si possono aggiungere altri elementi. Ora è possibile assegnare questa verità all'host creato nei passaggi precedenti e salvare la regola. |
[0:07:37] | Prima di attivare le modifiche, possiamo già effettuare il rilevamento da questa pagina facendo clic sul nome dell'host, Salva e vai alla configurazione del servizio. |
[0:07:48] | Ora si vedrà l'elenco dei controlli di servizio che gli elementi selezionati all'interno della regola. Vengono creati alcuni controlli di servizio. Se si guarda agli Eventi Datadog, si legge che ha già inoltrato 4 eventi alla Console eventi. |
[0:08:06] | Per quanto riguarda i log di Datadog, mostra che ha inoltrato 0 log alla Console eventi. Nel caso di un monitor, questo è il nome del mio monitor nell'organizzazione Datadog. Questo è il monitor Utilizzo dello spazio su disco su {{dispositivo.nome}}/{host.nome}}. |
[0:08:25] | Queste variabili che vedete con il simbolo {}, sono definite in questo modo all'interno di Datadog, ed esattamente utilizziamo lo stesso nome anche all'interno di Checkmk. E hanno lo stato generale, la soglia, la criticità e l'avviso. E ora possiamo fare clic su Accetta tutto. |
[0:08:49] | Una volta cliccato su Accetta tutto, è possibile attivare le modifiche, in modo da renderle permanenti. Nel prossimo aggiornamento si possono vedere tutti i controlli dei servizi. Quando si fa clic su datadog-instance ora, il messaggio di errore che si vede qui è dovuto al fatto che questo host Checkmk non ha un indirizzo IP, quindi si tratta solo di un avviso temporaneo. |
[0:09:16] | Possiamo fare clic su Riprogramma controllo ("check") e ora verranno mostrati i check creati con la definizione di questa regola. |
[0:09:27] | Come si può vedere sullo schermo, sono stati inoltrati 0 eventi e 0 log. |
[0:09:33] | Diamo un'occhiata alla Console eventi. Quando guardiamo la Console eventi, l'elenco degli eventi, vediamo che ci sono un mix di log e di eventi. |
[0:09:47] | Tutti i log vengono abbinati alla regola datadog_logs che abbiamo definito nella Console eventi come prerequisito. E poi c'erano tre regole per gli eventi: datadog_rule_warn, datadog_rule_triggered e datadog_rule_recovered. |
[0:10:05] | Quindi, esaminando gli eventi, possiamo notare che è stato attivato un evento. Poi è passato allo stato di avviso per due volte e quindi è stato recuperato. Se guardiamo i log, ci sono alcuni log inviati a un determinato timestamp con messaggi di errore negati e falliti. Anche questi sono stati recuperati dal flusso di log di Datadog e mostrati all'interno di Checkmk Event Console. |
[0:10:36] | Quindi, per oggi è tutto. Questa era una breve panoramica dell'integrazione con Datadog. Grazie per aver guardato. Non dimenticate di mettere "Mi piace" e di iscrivervi. E alla prossima volta. |
Vuoi saperne di più su Checkmk? Partecipa al nostro webinar "Introduzione a Checkmk".