Prometheus

Monitoring mit Prometheus

Prometheus ist ein Monitoring System, welches auf Basis einer Time-Series Datenbank tiefe Einblicke in die Gesundheit verteilter Systeme ermöglicht. Durch aktives Anfragen von Metrik-Endpunkten und einer Vielfalt an bereits existierenden Exporters ist es gerade im Umfeld von Containern und Kubernetes kaum noch weg zu denken.

In diesem Kurs installieren wir Prometheus, schauen uns alle Komponenten an, arbeiten mit Exportern und lassen uns über Alert-Manager Regeln benachrichtigen. Außerdem schauen wir uns Graphing mit Grafana an und halten einen kurzen Exkurs in die Kubernetes Welt um zu verstehen, welche Prometheus in Cloud Native Infrastrukturen eingebettet wird.

Voraussetzungen

Vorausgesetzt werden Kenntnisse in der Linux Administration:

  • Installation von Diensten auf Linux
  • Fehleranalyse in Client-Server Umgebungen
  • Basiskenntnisse in DNS und HTTP

Inhalt

Einführung

  • Ziele und Methoden von Monitoring
  • Architektur und Komponenten von Prometheus
  • Auswahl zu überwachender Systeme und Eigenschaften

Exporter

  • Node Exporter für die Überwachung von Einzelsystemen
  • Blackbox Exporter für die Überwachung externer Systeme
  • HAProxy Exporter für die Überwachung von HAProxy
  • Grok-Exporter und mtail für die Überwachung von Log-Dateien
  • Push Gateway für die Überwachung von abgeschlossenen Vorgängen
  • cAdvisord für die Überwachung von Containern
  • Kube State Metrics für die Überwachung von Kubernetes

Service Discovery

  • Statische Konfiguration und dateibasierte Service Discovery
  • DNS
  • IaaS-Clouds
  • Kubernetes
  • Relabling, insbesondere in IaaS-Clouds und Kubernetes

PromQL

  • Metriken und Labels
  • Datentypen und ihre Eigenschaften und Funktionen
  • Vektortypen und Vektormatching
  • Recording Rules und Alerting Rules

Alarmierung

  • AlertManager
  • Konfiguration von Alerts
  • Alert Labels und Alert-Routing

Dashboards

  • Prometheus Consoles
  • Grafana

Operative Aspekte

  • Meta-Monitoring
  • Kapazitätsplanung
  • Skalierung und Hochverfügbarkeit
  • Verteiltes Prometheus und Federation
  • Hinweise zur Instrumentierung eigener Anwendungen
  • Ausblick auf Thanos

Best Practices

Kurszeiten

Wer möchte, reist bis 22 Uhr am Vortag an und nutzt den Abend bereits zum Fachsimpeln am Kamin oder im Park.

An den Kurstagen dann von 9-18 Uhr (mit 2 Kaffee- und 1 Mittagspause) etwa 60% Schulungen und 40% Übungen. Selbstverständlich arbeitet jeder Teilnehmer am von uns gestellten Notebook oft parallel zum Referenten mit.

Anschließend Abendessen und Angebote für Fachsimpeln, Ausflüge uvm. Wir schaffen eine Atmosphäre, in der Fachleute sich ungezwungen austauschen. Wer das nicht will, wird zu nichts gezwungen und findet auch jederzeit Ruhe.