DORA · Operational resilience

Als ein Update die Welt lahmlegte: der CrowdStrike-Ausfall als DORA-Lehrstück

Monolinien-Raster von Endgeräten unter einem orangefarbenen Update-Bus; ein zusammenhängender Block rot markierter, ausgefallener Maschinen. Bildunterschrift: eine Abhängigkeit, jedes Endgerät, 8,5 Millionen Maschinen ausgefallen.

Eine einzige fehlerhafte Datei legte 8,5 Millionen Windows-Maschinen lahm, stoppte Flüge und fror Handelsräume ein. Unter DORA lautet die Frage nicht mehr wessen Fehler, sondern: wo war Ihre Simulation?

Am 19. Juli 2024 machte ein fehlerhaftes Inhalts-Update eines weit verbreiteten Endpoint-Sicherheitsagenten binnen Stunden rund 8,5 Millionen Windows-Systeme startunfähig. Fluggesellschaften stoppten Flotten, Krankenhäuser kehrten zum Papier zurück, und Finanzinstitute entdeckten, dass eine einzige Drittanbieter-Datei schaffte, was keinem Angreifer gelungen war. Kein Gegner, keine Schadsoftware, kein Einbruch: genau das macht den Fall zum saubersten Resilienz-Lehrstück des Jahrzehnts.

Der Vorfall

Ein Hersteller, eine Konfigurationsdatei, eine weltweite Verteilung. Das Update erreichte jede Maschine mit dem Agenten praktisch gleichzeitig, und der Fehlermodus war total: Bluescreen, Boot-Schleife, manuelle Wiederherstellung Gerät für Gerät. Der Maßstab verwandelte einen Softwarefehler in Infrastruktur-Wetter.

Die regulatorische Lesart

Der EU-Rechtsakt zur digitalen operationalen Resilienz (DORA) zieht keinen Trost aus der Abwesenheit eines Angreifers. Seine Kernforderung: IKT-Störungen, böswillig oder nicht, sind zu antizipieren, auszuhalten und zu überwinden. Drei Säulen sind unmittelbar berührt: das IKT-Drittparteienrisiko (die ausfallende Komponente saß tief in fast jeder Lieferkette, oft unterhalb der vertraglichen Sichtbarkeit), die Resilienztests (Szenarien müssen schwere, aber plausible Störungen abdecken; der gleichzeitige Ausfall eines Endpoint-Agenten war plausibel, schwer und fast nirgends simuliert) und die Vorfallsmeldung (Institute hatten Stunden, nicht Tage, um die eigene Exponierung zu verstehen und einzustufen).

Was Berechnung geändert hätte

Die Abhängigkeit war erkennbar: ein vollständiges Inventar zeigt denselben Agenten auf jedem Endgerät, einen einzigen Punkt korrelierten Ausfalls. Der Wirkradius war berechenbar: eine Monte-Carlo-Simulation über dieses Inventar, wie DORA-MAST sie für Finanzunternehmen und cVaR für jede Branche ausführt, beziffert das Szenario „der vertraute Agent fällt überall gleichzeitig aus" in finanziellen Verlustgrößen und macht aus einer vagen Sorge eine vorstandsfähige Zahl. Und die Erholung ist schneller, wenn Nachweise greifbar sind: Institute, die genau wussten, welche Maschine welche Agentenversion fuhr, erholten sich in Stunden; wer den Bestand aus Tabellen rekonstruierte, brauchte Tage.

Vorhersagen, simulieren, vorab remedieren: nichts davon verlangte Hellsehen. Es brauchte ein Inventar, ein Modell und den Willen, den unglücklichen Pfad zu berechnen, bevor man ihn erlebt.

Die meisten betroffenen Institute hatten kein Pech. Sie hatten kein Modell.

The CCI angle

Solutions referenced: DORA-MAST · cVaR · EviGensee the products or talk to a practitioner.