DORA · Operational resilience

一つのアップデートが世界を止めた:DORAケーススタディとしてのCrowdStrike障害

単一のオレンジ色の更新バスの下にあるエンドポイントマシンのモノライングリッド;赤で障害としてマークされた連続したブロック。キャプション:一つの依存関係、すべてのエンドポイント、850万台のマシンがダウン。

単一の欠陥チャンネルファイルが850万台のWindowsマシンをダウンさせ、フライトを欠航させ、取引フロアを凍結させた。DORAの下では、問題はもはや「誰のせいか?」ではなく「あなたのシミュレーションはどこにあったのか?」です。

2024年7月19日、広く展開されているエンドポイントセキュリティエージェントの欠陥のあるコンテンツアップデートが、数時間以内に約850万台のWindowsシステムを起動不能にした。航空会社は機材を停止し、病院は紙に戻り、金融機関はどのような攻撃者も成し遂げられなかったことを単一のサードパーティファイルが実現できることを発見した。敵対者なし、マルウェアなし、侵害なし——これが10年間で最も明確なレジリエンスのケーススタディとなる理由だ。

インシデント

一つのベンダー、一つのチャンネルファイル、一つのグローバル配信。アップデートは実質的に同時にエージェントを実行しているすべてのマシンに到達し、障害モードは完全だった:ブルースクリーン、ブートループ、デバイスごとの手動回復。スケールがソフトウェアの欠陥をインフラの気象現象に変えた。

規制上の解釈

EU デジタル・オペレーショナル・レジリエンス法(DORA)は攻撃者の不在から何の安慰も得ない。金融機関に対するその核心的な要求は、ICTの混乱が悪意のものであれそうでなければであれ、予測され、耐えられ、回復されることだ。そのピラーのうち三つが正面から関与している:ICTサードパーティリスク(障害を起こしたコンポーネントはほぼすべての機関のサプライチェーンの深部に位置しており、しばしば契約レベルの可視性を下回っていた)、デジタルレジリエンステスト(シナリオテストは深刻だが妥当性のある混乱をカバーしなければならない;エンドポイントエージェントの同時障害は妥当性があり、深刻であり、ほぼどこでもシミュレートされていなかった)、そしてインシデント報告(機関には自分自身のエクスポージャーを理解・分類するための時間が数日ではなく数時間しかなかった)。

計算が変えていたもの

依存関係は把握可能だった:完全な資産インベントリはすべてのエンドポイントに同じエージェントが存在することを示し、相関障害の単一点となる。影響範囲は計算可能だった:そのインベントリに対するモンテカルロシミュレーション——DORA-MASTが金融機関に対して、cVarがあらゆる業界に対して実行するような種類——は「信頼されたエージェントが一度にすべてで障害を起こす」というシナリオを財務的損失の観点で定量化し、漠然とした懸念を取締役会に提示できる数字に変える。そして証拠が手元にあれば回復は早い:どのマシンがどのエージェントバージョンを実行しているかを正確に把握していた機関は数時間で回復した;スプレッドシートから環境を再構築していた機関は数日かかった。自動化された証拠収集はその回答を最新の状態に保つ。

予測し、シミュレートし、事前に是正する:これらのいずれも予知能力を必要としなかった。インベントリ、モデル、そして実際に経験する前に最悪のシナリオを計算する意志が必要だっただけだ。

影響を受けたほとんどの機関は運が悪かったのではない。モデル化されていなかっただけだ。

The CCI angle

Solutions referenced: DORA-MAST · cVaR · EviGensee the products or talk to a practitioner.