Nel primo giorno della Checkmk Conference #7, tutto ha ruotato - come da tradizione - intorno all'ultima versione di Checkmk. Checkmk 2.0, lanciata a marzo di quest'anno, non è solo la più grande release di prodotto della nostra storia, ma la sua interfaccia e la sua navigazione completamente ridisegnate offrono anche un'esperienza d'uso completamente nuova per gli utenti di Checkmk.
Una caratteristica essenziale della nuova versione è stata, tra l'altro, il miglioramento del dashboarding. Con Checkmk 2.0, non solo abbiamo rivisto l'aspetto delle dashboard, ma ne abbiamo anche semplificato la gestione. La prima sessione tecnica della conferenza è stata quindi dedicata al tema di come sia possibile creare dashboard di alta qualità con la nuova versione di Checkmk. Mathias Kettner, fondatore di tribe29, e Marcel Arentz, consulente di Checkmk, hanno utilizzato l'esempio di un server Linux per mostrare come sia possibile creare dashboard di grande impatto in pochi passaggi grazie alle nuove funzioni di dashboarding. Ad esempio, i grafici delle serie temporali predefinite per un servizio possono essere assegnati a una dashboard speciale tramite il menu delle azioni. In linea di massima, la creazione di dashboard è molto più semplice rispetto alle versioni precedenti grazie alla nuova navigazione.

Oltre alla facilità di gestione nella creazione e configurazione di nuove dashboard, Mathias e Marcel hanno presentato anche le quattro nuove dashlet. Queste offrono a Checkmk 2.0 ancora più opzioni per la visualizzazione dei dati di monitoraggio, oltre alle visualizzazioni già disponibili come l'elenco tabellare degli elementi e i grafici delle serie temporali.
Ad esempio, il nuovo elemento gauche è adatto alla visualizzazione di singole metriche che hanno un limite superiore o inferiore, come l'attuale utilizzo della memoria. Questo è in contrasto con la metrica singola, che è progettata per metriche che non hanno un limite, come il tempo di attività di un sistema. Entrambi gli elementi del dashlet possono essere arricchiti opzionalmente con dati storici. Nel caso della gauche, si tratta di un istogramma che mostra i valori medi in un determinato periodo di tempo. Nel caso della singola metrica, viene visualizzata la sua progressione storica. Inoltre, entrambi gli elementi mostrano facoltativamente lo stato del servizio associato.
Con il grafico a barre, la versione 2.0 di Checkmk presenta anche un'opzione completamente nuova per la visualizzazione dei dati provenienti da più host. Ad esempio, il dashlet può essere utilizzato per riassumere lo spazio disponibile sul disco rigido di vari host in un unico grafico a barre.
Anche il grafico scatterplot raccoglie i dati di diversi host, ma include anche i dati storici. Con lo scatterplot, Checkmk visualizza metriche come il carico della CPU da più host per un periodo di tempo, con ogni host rappresentato da una linea. In questo modo è possibile riconoscere immediatamente i valori anomali. Inoltre, due grafici mostrano la mediana dei valori superiori e inferiori.
Oltre ai grafici delle serie temporali e alle visualizzazioni delle tabelle, Checkmk offre la possibilità di organizzare visivamente i dati di monitoraggio mediante dashboard informative. In questo articolo troverete ulteriori informazioni sulla nuova interfaccia grafica e sulle nuove dashboard.
Keynote: Monitoraggio delle infrastrutture IT ibride
Il calcio d'inizio ufficiale della Checkmk Conference #7 è stato dato dal CEO di tribe29 Jan Justus con il suo keynote, sul palco principale. Nel suo discorso, Jan non solo ha illustrato il programma dei due giorni di conferenza, ma ha anche parlato delle sfide attuali del monitoraggio IT. Al giorno d'oggi, le organizzazioni si affidano sempre più a stack IT moderni e cloud-native, oltre a quelli tradizionali. Questo mondo ibrido ed eterogeneo di on-premises, cloud, container, Kubernetes, ecc. deve essere mappato e monitorato con un'unico strumento di monitoraggio, idealmente con Checkmk.

Per esempio, tribe29 si è recentemente impegnata a migliorare in modo significativo il flusso di lavoro quotidiano con Checkmk attraverso la sua nuova interfaccia utente. Inoltre, Checkmk offre il miglior monitoraggio IT ibrido possibile grazie all'integrazione degli strumenti di osservabilità e dell'IT enterprise, ovvero i vari sistemi e soluzioni IT di cui le aziende hanno bisogno per le loro operazioni commerciali. Le API e le integrazioni consentono alle aziende un monitoraggio completo e flessibile con l'approccio best-of-breed.
Per consentire l'integrazione di tutti questi sistemi IT aziendali connessi nel monitoraggio IT, tribe29 si affida all'open source. A nostro avviso, ciò offre la flessibilità e l'adattabilità necessarie per monitorare le infrastrutture IT ibride. Il nostro obiettivo è che qualsiasi azienda possa avere un monitoraggio adeguato, indipendentemente dall'aspetto della propria infrastruttura ibrida. Questo approccio non si riflette solo nell'Enterprise Edition, ma è dimostrato anche dal fatto che stiamo migliorando costantemente la Checkmk Raw Edition, basata sull'open source. Quest'ultima ha ricevuto molte nuove funzioni con questa nuova release del prodotto, e continuerà a beneficiare di miglioramenti in futuro.
L'approccio open source consente inoltre alla nostra comunità di sviluppare le proprie estensioni per il monitoraggio IT. Ad esempio, la nuova API Check Plug-in rende più facile per gli utenti integrare i propri connettori in Checkmk. Inoltre, stiamo lavorando con la nostra comunità per rendere Checkmk disponibile in più lingue.
Infine, Jan ha anche gettato uno sguardo sui futuri sviluppi di Checkmk, introducendo il contenuto del secondo giorno della conferenza: Attualmente, tribe29 sta lavorando sia per semplificare il monitoraggio del cloud che per migliorare il monitoraggio di Kubernetes con Checkmk. Oltre a semplificare l'implementazione nel cloud grazie alla fornitura di Checkmk attraverso i Marketplace di Azure e AWS, in futuro dovrebbe essere possibile monitorare anche le risorse on-premise dal cloud. A tal fine, è necessario che gli agenti trasferiscano i dati "nella direzione opposta", ossia che spingano i dati di monitoraggio nel cloud. Alcuni elementi costitutivi di un migliore monitoraggio di Kubernetes sono, ad esempio, le configurazioni predefinite che semplificano notevolmente l'installazione di Checkmk per Kubernetes.
Inoltre, la revisione delle integrazioni esistenti con Grafana e InfluxDB e una nuova interfaccia DataDog sono altri tre punti sulla roadmap di Checkmk.
Lo stato attuale di Checkmk
Lars Michelsen, responsabile dello sviluppo di tribe29, ha fornito una panoramica dettagliata dello stato attuale di Checkmk nella sua presentazione. Con la nuova UX, la nuova Check Plug-in API e la nuova API Rest, Checkmk 2.0 ha subito tre importanti aggiornamenti. Inoltre, Checkmk ha colmato una lacuna nell'area della rete integrando il monitoraggio dei flussi di rete di ntops. Grazie a questa integrazione, è ora possibile ottenere informazioni più approfondite sul traffico di rete. L'integrazione dei connettori Prometheus consente alle organizzazioni che utilizzano Prometheus per il monitoraggio di Kubernetes di incorporare i suoi dati di monitoraggio in Checkmk.
Lars ha anche illustrato i vantaggi della nuova interfaccia utente e della navigazione. La nuova dashboard principale di Checkmk è stata progettata per aiutare gli utenti a identificare immediatamente le tendenze, fornendo un'ampia panoramica dei servizi monitorati e mostrando lo stato del monitoraggio e lo stato dell'infrastruttura IT. A questo scopo Checkmk mette a disposizione tre dashboard: la Panoramica principale, la Dashboard dei problemi e la Dashboard di Checkmk. Le modifiche possono essere effettuate facilmente tramite le tre icone presenti nella barra superiore. È anche possibile visualizzare una dashboard definita dall'utente dopo aver effettuato l'accesso all'interfaccia web.

Con la nuova API REST, Checkmk 2.0 offre anche più opzioni per automatizzare il processo di monitoraggio. Rispetto alla precedente API web, con la nuova interfaccia è possibile non solo automatizzare le configurazioni degli host, ad esempio, ma anche ricevere informazioni sullo stato del monitoraggio o eseguire operazioni come la programmazione dei tempi di inattività.
Inoltre, grazie alla nuova API per i plug-in di Check, tribe29 può garantire in futuro il supporto dei quasi 2.000 plug-in ufficiali di Check. La nuova API segue le best practice di progettazione di Check e introduce anche standard che garantiscono la gestione e la sicurezza dei plug-in. È presente anche del materiale aggiuntivo per aiutare gli utenti di Checkmk a sviluppare i propri plug-in. Abbiamo riassunto tutte le informazioni importanti relative alla nuova API REST e all'API dei plug-in di Check in un articolo del blog.
Anche dal punto di vista delle prestazioni, Checkmk 2.0 ha subito una serie di cambiamenti. L'architettura del Checkmk Micro Core (CMC) implementato nell'Enterprise Edition è stata radicalmente rivista. Di conseguenza, il monitoraggio con Checkmk richiede ora un numero significativamente inferiore di risorse. Per scoprire come è stata progettata la nuova architettura del CMC, consultate questo articolo del blog.
Con la versione 2.0, anche la gestione della capacità con Checkmk è diventata più semplice. I grafici di previsione erano già stati introdotti con Checkmk 1.6, ma la funzione doveva essere installata separatamente e faticosamente configurata. Con Checkmk 2.0, tribe29 ha sostituito questo motore con una soluzione propria e più snella. Inoltre, l'opzione di previsione fa ora parte di default dell'ambito funzionale di Checkmk.
Come parte finale del suo intervento, Lars ha anche approfondito la migrazione da Checkmk a Python 3. In totale, è stato necessario migrare più di 700.000 righe di codice da Python 2 a Python 3. Questo ha comportato alcune difficoltà in una fase di transizione da un sistema all'altro, ma nel complesso i problemi si sono rivelati meno gravi del previsto.
La Fireside Chat - e alcune storie da insider...
L'ultimo punto del programma del primo giorno è stata la cosiddetta Fireside Chat. In un'atmosfera rilassata e con un fusto di birra appena spillato, Jan, Mathias e Lars hanno concluso la prima giornata in studio. Hanno parlato non solo dello sviluppo dell'attuale versione di Checkmk, ma anche dei primi tempi di Checkmk, in particolare di come Lars sia diventato il primo dipendente di Mathias e di come sia stata la collaborazione nei primi tempi. Tra le altre cose, il pubblico ha appreso che Lars è un consulente "cattivo" perché ha completato un progetto di cinque giorni in due giorni. Mathias e Lars hanno anche parlato della prima pietra miliare della loro collaborazione: il Checkmk Micro Core, sviluppato in proprio. Questo ha permesso loro di offrire non solo la versione open source, basata sul core di Nagios, ma anche una Enterprise Edition molto più veloce e meno dispendiosa in termini di risorse: la base del successo di Checkmk.
Dopo la breve escursione storica, altri ospiti si sono aggiunti via Zoom. La Community Manager Faye Tandog ha parlato, tra le altre cose, del programma linguistico. Attualmente sono disponibili nove pacchetti linguistici (tradotti automaticamente). Tutti i membri della comunità possono contribuire a ottimizzare le traduzioni e a rendere Checkmk disponibile nella propria lingua madre. È possibile contribuire al progetto all'indirizzo translate.checkmk.com. I pacchetti linguistici sono disponibili per il download come pacchetti MKP nel nostro Exchange.
Con Andreas Döhler e Robert Sander, si sono collegati in studio anche due membri attivi della comunità di Checkmk. Ci hanno raccontato perché amano lavorare con Checkmk e condividere le loro conoscenze su Checkmk con altri utenti nel forum, quando trovano un po' di tempo, naturalmente.
L'ultimo ospite della serata è stato Moritz Kiemer, sviluppatore di Checkmk. Ha raccontato lo sviluppo della nuova API di Check, gli ostacoli che è stato necessario superare e le discussioni sul percorso che ha portato dall'idea all'API funzionante. Allo stesso tempo, Moritz ha anche fornito una prospettiva su ulteriori progetti riguardanti l'API, come le configurazioni di cluster preconfigurati per i servizi.
La Fireside Chat ha concluso il primo giorno della conferenza. Il secondo giorno della conferenza si è concentrato sullo sviluppo futuro di Checkmk.