eBPF für Observability: Wie Linux-Kernel-Instrumentierung tiefe Systemeinblicke ohne Code-Änderungen liefert

Cloud-Computing-Infrastruktur – eBPF erweitert moderne Observability-Stacks durch tiefe Linux-Kernel-Instrumentierung ohne Codeänderungen (Foto: Sam Johnston / Wikimedia Commons, CC BY-SA 3.0)

In der modernen IT-Infrastruktur laufen Anwendungen häufig als Container auf Kubernetes-Clustern, verteilt über mehrere Nodes und Cloud-Regionen. Wer verstehen will, was wirklich auf Kernel-Ebene passiert – Netzwerkverbindungen, Systemaufrufe, CPU-Scheduling-Entscheidungen – stößt mit klassischen Instrumentierungsansätzen schnell an Grenzen. eBPF hat sich als transformative Technologie für Observability etabliert: ein Mechanismus, der tiefe Systemeinblicke liefert, ohne Anwendungscode zu verändern oder den Kernel zu modifizieren.

Was ist eBPF?

eBPF steht für „Extended Berkeley Packet Filter". Ursprünglich als Netzwerkfilter-Mechanismus im Linux-Kernel entwickelt, ist eBPF heute viel mehr: ein virtueller Maschinenrahmen im Kernel, der es ermöglicht, kleine Programme sicher in Kernel-Space auszuführen. Diese Programme reagieren auf Ereignisse – Systemaufrufe, Netzwerkpakete, Funktionsaufrufe, Timer-Events – und können Daten sammeln, aggregieren oder weiterleiten.

Der entscheidende Vorteil: eBPF-Programme laufen im Kernel, ohne dass der Kernel selbst neu kompiliert oder zusätzliche Kernel-Module installiert werden müssen. Sie werden zur Laufzeit geladen, durch einen eingebauten Verifier auf Sicherheit geprüft und dann als Just-in-Time-kompilierter Code ausgeführt. Das Risiko eines Kernel-Crashes durch fehlerhafte Programme ist damit strukturell minimiert.

Warum eBPF für Observability besonders wertvoll ist

Traditionelle Observability-Ansätze erfordern entweder Anwendungsebene-Instrumentierung über SDKs und Tracing-Libraries oder den Einsatz von Kernel-Modulen. Ersteres bedeutet: Der Anwendungscode muss angepasst werden, zusätzliche Abhängigkeiten kommen hinzu, und Teams müssen koordiniert mitwirken. Letzteres ist riskant und wartungsintensiv.

eBPF schließt diese Lücke. Ohne Quellcode-Änderungen können folgende Informationen in Echtzeit gesammelt werden:

Systemaufrufe: Welche Anwendung öffnet wie viele Dateiverbindungen? Wer führt mit welcher Häufigkeit write() aus?
Netzwerktraffic: Verbindungsaufbau, Latenz pro Service-Paar, TCP-Retransmits direkt auf Kernel-Ebene
CPU-Nutzung: Profiling von CPU-Cycles pro Funktion ohne nennenswerten Sampling-Overhead
Sicherheitsereignisse: Privilegienanfragen, ungewöhnliche Systemaufrufmuster, Container-Escape-Versuche

Diese Daten stehen ohne jede Änderung an der beobachteten Anwendung zur Verfügung – ein erheblicher Unterschied zum herkömmlichen Instrumentierungsmodell und ein entscheidender Vorteil in Umgebungen mit vielen heterogenen Services.

Die wichtigsten eBPF-basierten Tools im Observability-Stack

Cilium und Hubble

Cilium ist ein Kubernetes-Netzwerk-Plugin, das eBPF für Netzwerk-Policy-Enforcement und Load Balancing nutzt. Die zugehörige Observability-Komponente Hubble zeigt in Echtzeit, welche Services miteinander kommunizieren, welche Verbindungen durch Policies abgelehnt werden und wo Latenzen entstehen – alles ohne Service-Mesh-Sidecars, die eigenen CPU-Overhead und Memory-Druck erzeugen würden.

Pixie

Pixie ist ein Open-Source-Observability-Tool, das eBPF nutzt, um HTTP-Requests, Datenbankabfragen, gRPC-Calls und mehr automatisch zu erfassen. Entwickler können SQL-ähnliche Abfragen in Echtzeit gegen die gesammelten Daten ausführen – ohne Logs exportieren oder Agents separat konfigurieren zu müssen. Besonders für schnelle Debugging-Sessions in Kubernetes-Umgebungen ist Pixie wertvoll, weil es ohne SDK-Integration Einblicke liefert, die sonst manuelles Tracing erfordern würden.

Falco

Falco nutzt eBPF für Security Observability: Es erkennt ungewöhnliches Verhalten auf Kernel-Ebene – etwa wenn ein Container plötzlich Shell-Befehle ausführt, Systemdateien schreibt oder auf sensible Pfade zugreift. Falco erlaubt das Definieren von Regeln, die bei Triggering Alerts erzeugen oder Verbindungen blockieren. Damit schließt es eine wichtige Lücke zwischen Anwendungs-Logging und echter Laufzeitsicherheit.

BCC und bpftrace

BCC (BPF Compiler Collection) und bpftrace sind Werkzeuge für Entwickler und SREs, die eigene eBPF-Programme schreiben wollen. Mit bpftrace-Skripten lassen sich in wenigen Zeilen tiefe Analysen durchführen: Wer generiert gerade die meisten Kernel-Locks? Welche Funktionen verursachen die meisten Context Switches? Das macht eBPF zum präzisen Skalpell für Performance-Debugging auf Produktionssystemen, ohne diese zu gefährden.

eBPF in der Praxis: Typische Anwendungsfälle

In produktiven Umgebungen wird eBPF typischerweise für folgende Szenarien eingesetzt:

Service-Mesh ohne Sidecar: Cilium ersetzt Envoy-Proxies für Netzwerkpolicy und Observability und reduziert damit den Overhead pro Pod erheblich.
Continuous Profiling: Tools wie Parca nutzen eBPF für CPU-Profiling auf Produktionssystemen mit vernachlässigbarem Overhead im Vergleich zu klassischen Samplern.
Zero-Instrumentation-Tracing: HTTP- und Datenbanktraces können automatisch generiert werden, ohne OpenTelemetry-SDKs in Anwendungen zu integrieren.
Netzwerk-Sicherheit: Packet-Filter auf Kernel-Ebene ermöglichen präzise Drop-Regeln für DDoS-Mitigation, ohne Traffic in User-Space kopieren zu müssen.

Grenzen und Voraussetzungen

eBPF ist nicht ohne Einschränkungen. Der Linux-Kernel muss mindestens Version 4.18 haben; für moderne Features wie CO-RE (Compile Once – Run Everywhere) ist Kernel 5.2 oder höher erforderlich. Viele eBPF-Tools setzen Kernel 5.8 oder neuer voraus. In veralteten On-Premise-Umgebungen kann das ein Hindernis sein.

Das Laden von eBPF-Programmen erfordert root-Rechte oder spezifische Linux-Capabilities. In stark gesicherten Umgebungen kann das zu Reibungen mit Sicherheitsrichtlinien führen. Der eBPF-Verifier schränkt außerdem ein, was Programme tun dürfen – Schleifen ohne garantierte Terminierung sind etwa verboten, um Hänger im Kernel zu verhindern.

Trotz dieser Einschränkungen gilt eBPF als einer der bedeutendsten Fortschritte in der Linux-Systemarchitektur der letzten Jahre. Cloud-native Umgebungen auf aktuellen Linux-Versionen können eBPF in der Regel ohne Einschränkungen nutzen.

Fazit: eBPF verändert die Observability grundlegend

Klassische Observability erfordert die Kooperation des Anwendungscodes. eBPF durchbricht dieses Prinzip. Es liefert präzise, vollständige Einblicke in das Systemverhalten auf Kernel-Ebene – ohne Agents zu installieren, ohne Code zu ändern, ohne spürbaren Overhead zu akzeptieren. Für Teams, die Kubernetes-Cluster betreiben, moderne Cloud-Infrastruktur managen oder Sicherheitsprobleme in Produktionssystemen diagnostizieren, ist eBPF heute kein exotisches Werkzeug mehr, sondern ein etablierter Bestandteil eines modernen Observability-Stacks.

Bildquelle: Sam Johnston / Wikimedia Commons, CC BY-SA 3.0