10.000 Schwachstellen aus Project Glasswing: Eine CISO-3-Wege-Entscheidung für DACH

Glasswing-Partner-Warteliste, Claude Security Public Beta oder warten auf Mythos GA im Juli — was Dein AppSec-Team vor Q3-Schluss wählen sollte.

Anthropic hat vor drei Tagen das erste quantifizierte Update zu Project Glasswing veröffentlicht. Die Schlagzeilenzahlen setzen zurück, was jeder CISO dieses Quartal tut.

In rund einem Monat Koalitionsnutzung hat Claude Mythos Preview über 10.000 Schwachstellen mit hoher oder kritischer Schwere in der weltweit meistgenutzten Software entdeckt. Die Post-Triage-True-Positive-Rate liegt bei 90,6 %. Allein Cloudflare meldete rund 2.000 Bugs, davon 400 hoch oder kritisch. Mozilla hat in Firefox 150 271 Schwachstellen gefixt — das Zehnfache dessen, was in Firefox 148 gefunden wurde. wolfSSL — eine Krypto-Bibliothek, die auf Milliarden Geräten läuft — bekam einen Zertifikats-Fälschungspfad identifiziert. Bei einer Partnerbank verhinderte Mythos in Echtzeit eine betrügerische 1,5-Mio.-Wire-Überweisung. Das UK AI Security Institute bestätigte, dass Mythos Expert-Level-Cyber-Range-Aufgaben autonom End-to-End löst.

Und der eine Satz, den alle zitieren:

“Software-Sicherheits-Fortschritt war früher dadurch begrenzt, wie schnell wir Schwachstellen finden konnten. Jetzt ist er dadurch begrenzt, wie schnell wir patchen können — Maintainer bitten uns, langsamer zu machen, weil sie nicht schnell genug patchen können.”

Der lane-definierende Post auf X kam diese Woche von @dannylivshits, einem ehemaligen Meta-GenAI-Red-Team-Lead: “10.000 kritische Vulns in 30 Tagen. 75 gepatcht. Deine neue Angriffsfläche lebt in der Patch-Pipeline. Plane für den Leak. Nutze die nächsten 90 Tage.” Diese Rahmung — Patch-Pipeline als die neue Angriffsfläche — wird Dein AppSec-Team den Rest des Jahres aus jeder Richtung hören.

Für DACH-CISOs kommt zusätzlich der NIS2-Druck dazu: Die Umsetzungsdeadline ist längst überschritten (Deutschland implementiert über das NIS2UmsuCG), und der Sorgfaltsmaßstab für “Stand der Technik” bei Schwachstellen-Identifikation steht ab Veröffentlichung des Glasswing-Reports in einer anderen Höhe. “Wir wussten nichts davon” ist ab Q3 keine BSI-akzeptable Antwort mehr.

Hier die Beschaffungs-Frage, die jeder CISO, jeder VP-AppSec, jeder DevSecOps-Lead und jeder Plattform-Security-Architekt im Q3-Budget-Zyklus gerade auf dem Tisch hat: was tun wir damit? Drei Optionen liegen vor. Keine ist offensichtlich. Das SERP ist voller Erklärartikel, aber leer einer Entscheidungstabelle. Das ist die Entscheidungstabelle.

Die Anthropic-Project-Glasswing-Seite mit den Schlagzeilenzahlen aus dem 22.-Mai-Update — das Quelldokument unten Quelle: Project Glasswing: An initial update — Anthropic, 22. Mai 2026.

Die 3-Wege-Entscheidungstabelle

DimensionWahl 1: Glasswing-Partner-Warteliste beantragenWahl 2: Claude Security in Public Beta deployenWahl 3: Mythos GA (Juli) abwarten und neu bewerten
Zeit zum ersten Signal4-8 Wochen vor GADiese WocheNach Juli-GA + 30-60 Tage Evaluation
VerpflichtungFindings mit Koalition teilenAPI-gemetert + Seat-Lizenzen TBDKeine
Integration mit existierendem SAST/SCAKoalitions-koordiniert; variabelNeben Snyk / Semgrep / CodeQL / GitHub Advanced SecurityPost-GA entscheiden
False-Positive-RisikoKoalitions-vorgeprüft (90,6 % TP-Rate-Baseline)Beta — Rauschen + Alert-Fatigue-Spike erwartenMitigiert durch Post-GA-SLA
Patch-Volumen-AbsorptionHoch — Koalition liefert seriöses Advisory-VolumenHoch — Du absorbierst den vollen 10x-Sprung alleinKeine bis Du deployst
Regulatorische / Audit-AufstellungErfordert Bescheinigung; manche Häuser brauchen RechtsprüfungBeta-Software in regulierter Produktion = RisikoVerteidigbare “wir warteten auf GA”-Position
Kosten über 12 MonateKoalitionsanteil — nicht-monetäre Verpflichtung$TBD; Anthropic-Preise nutzungsbasiertKeine bis zur Entscheidung
Headcount-Bedarf1-2 zusätzliche AppSec-Engineers zur Volumenabsorption2-3 Engineers Minimum0 jetzt
Guter Fit fürRegulierte DAX-Konzerne, Sicherheits-Vendoren, reife AppSec-TeamsAppSec-Teams mit etabliertem SCACompliance-getriebene Häuser, Teams mit Backlog-Überlast
Risiko des NichtstunsKoalition schließt um ~52 Partner; Fenster schrumpftWettbewerber bekommen 5-6 Wochen Vuln-Prävention-VorsprungQuartal Aufhol-Arbeit nach GA

Drei Zeilen verdienen mehr als eine Zelle.

Zur False-Positive-Zeile (4). Die 90,6 %-True-Positive-Rate ist die Koalitions-Baseline nach menschlicher Triage — die Partner-SOC-Teams absorbieren die Triage-Arbeit. Wenn Claude Security Beta in Eurer SDLC landet, absorbiert Ihr die Triage-Arbeit. Plant für 8-12 % False-Positive-Overhead im ersten 30-Tage-Fenster ein — was bei einer großen Codebase echte Engineer-Stunden pro Tag bedeutet. Die Mitigation: stufiger Rollout auf einen oder zwei Services zuerst, False-Positive-Rate ehrlich instrumentieren, erst expandieren, wenn die menschliche-Review-Pro-Finding-Kosten unter eine akzeptable Schwelle fallen.

Zur Patch-Volumen-Absorption (5). Die Maintainer-Throttle-Geschichte ist der Kanari. Microsoft hat öffentlich gesagt, dass Patch-Volumen auf absehbare Zeit größer wird. Wenn Euer Team aktuell 50-100 high/critical Vulns pro Quartal absorbiert, stellt euch auf 5-10x Anstieg unter dauerhafter Mythos-Klasse-Scannung ein. Das ist kein Tooling-Problem; das ist ein Headcount-Problem. Das CFO-Gespräch gehört in den FY27-Budget-Zyklus, nicht den FY28.

Zur Risiko-des-Nichtstuns-Zeile. “Wir wussten nichts” wird als Audit-Verteidigung schnell schwächer. Sobald Mythos GA im Juli landet und die Technologie breit verfügbar wird, steigt der implizite Sorgfaltsmaßstab für Euer Sicherheits-Programm. Bankaufseher (BaFin, FINMA, FMA), KRITIS-Aufsicht (BSI für Deutschland) und auch zivilrechtliche Schadensersatz-Kläger arbeiten alle rückwärts davon, was vernünftig verfügbar war. Bis Q4 wird “wir warteten auf die zweite Produktgeneration” eine verteidigbare Position sein; “wir ignorierten es zwei weitere Quartale” wahrscheinlich nicht.

So wählst Du: 5 Fragen, die Du diese Woche mit Deinem Team durchgehst

1. Wie hoch ist Eure aktuelle Critical-Vuln-Patch-Velocity? Wenn Ihr kritische Vulns aktuell innerhalb 14 Tage patcht, habt Ihr Absorptions-Kapazität, um Wahl 2 (Claude Security Beta) ernsthaft zu erwägen. Wenn Euer Schnitt 60+ Tage ist, ist die rationale Sequenz Wahl 3 (auf GA warten) plus ein sofortiges Einstellungs-Gespräch über Absorptions-Kapazität.

2. Ist Euer existierender AppSec-Stack reif genug, um einen weiteren Scanner zu koexistieren? Mythos-Klasse-Output sitzt neben Snyk, Semgrep, CodeQL, GitHub Advanced Security, Checkmarx — nicht als Ersatz. Wenn Euer Team aktuell 1 SAST-Tool läuft und kämpft, schafft das Aufschichten von Claude Security Beta mehr Alert-Volumen, als Euer Triage-Prozess bewältigt.

3. Habt Ihr eine regulierte Produktionsumgebung, die Beta-Software verbietet? Bank, Versicherung, Verteidigung, kritische Infrastruktur haben typisch schriftliche Richtlinien gegen Beta-Tooling-Einsatz gegen Produktivcode. Im DACH-Kontext besonders: das BSI-IT-Grundschutz-Kompendium und die BAIT/VAIT erwarten ein bewusst dokumentiertes Risiko bei Beta-Software-Einsatz. Wenn Wahl 2 aus Compliance-Gründen vom Tisch ist, bleiben Wahl 1 (Warteliste) und Wahl 3 (auf GA warten).

4. Ist Euer FY27-Budget gesperrt, oder gibt es einen Q3-Nachtrag? Sowohl Wahl 1 als auch Wahl 2 brauchen AppSec-Headcount für Volumenabsorption. Wenn Euer FY27-Budget gesperrt ist und Euer CFO keine Nachtrags-Bereitschaft hat, ist Wahl 3 die einzige ehrliche Antwort.

5. Seid Ihr ein Sicherheits-Anbieter oder Kunde eines solchen? Sicherheits-Vendoren sollten sich für Wahl 1 ohne Bedingung bewerben — die Koalitions-Position ist strategisch für jedes Unternehmen, dessen Produkt mit Mythos’ Fähigkeit überlappt.

Der Reframe “Patch-Pipeline ist die neue Angriffsfläche”

Das konsequenteste an @dannylivshits’ Framing sind nicht die Zahlen. Es ist, dass das Bedrohungsmodell sich umgedreht hat. 25 Jahre lang nahm AppSec an: Angreifer hat begrenzte Zeit, eine Schwachstelle zu finden; Verteidiger hat Monate, um zu patchen. Project Glasswing dreht beide Hälften um.

Die Angreiferseite: Jeder anspruchsvolle Gegner hat innerhalb 12-18 Monate Zugang zu Mythos-Klasse-Fähigkeit (Open-Source-Pendants werden bereits prototypisiert; staatliche Akteure werden schneller deployen). Zeit-zum-Finden kollabiert von Monaten auf Tage.

Die Verteidigerseite: Zeit-zum-Patchen ist im Wesentlichen unverändert. Maintainer-Throughput ist menschengebunden. Interne AppSec-Triage ist menschengebunden. Das Patch-Deployment-Fenster — Staging, Regressionstest, CAB, Produktiv-Push — ist prozessgebunden. Selbst mit voller Mythos-Abdeckung über Eure Codebase ist Eure effektive Zeit-zum-Patchen in Wochen, nicht Tagen, gemessen — es sei denn, Ihr habt schon in automatisierte Regression + Canary + Auto-Rollback-Infrastruktur investiert.

Die CISO-Konsequenz: Window-of-Exposure wird die Metrik, die zählt. Nicht Vuln-Count, nicht Schwere-Verteilung, nicht Mean-Time-to-Patch allein. Die Zahl, die diesem Quartal auf das Aufsichtsrats-Dashboard gehört, ist das Zeitintervall zwischen dem Moment, in dem eine kritische Vuln in unserem Produktivcode durch ein Mythos-Klasse-Tool entdeckbar ist, und dem Moment, in dem unser Patch in Produktion ist. Alles über 30 Tage ist jetzt ein strukturelles Risiko, das Du entweder schließen oder dokumentieren musst, warum nicht.

Was das für Dich heißt

Wenn Du CISO bei einer DAX-30-Bank oder Versicherung bist

Wahl 1 — Glasswing-Partner-Warteliste — beantragen. Auch wenn Beta-Tools in Produktion off the table sind, ist die Koalitions-Beteiligung selbst eine BaFin-defensible Position. Du dokumentierst aktive Risikoadressierung, ohne Beta-Code zu deployen. Parallel das Headcount-Gespräch mit dem CFO für FY27 starten.

Wenn Du VP-AppSec in einem schnellwachsenden Mittelständler bist

Wahl 2 — Claude Security Beta — auf 1-2 nicht-kritischen Services starten. Die Lernkurve zahlt sich aus, sobald Mythos GA breit verfügbar ist. Aber sei ehrlich über die Triage-Last und plane Headcount entsprechend ein.

Wenn Du DevSecOps-Lead in einem 50-200-Personen-SaaS bist

Wahl 1 oder Wahl 2, abhängig von Eurer Patch-Velocity. Wenn Ihr unter 14-Tage-Patch-Velocity seid: Wahl 2. Wenn Ihr drüber seid: Wahl 1 (Warteliste) und im Q3 zusätzlich an Patch-Velocity arbeiten.

Wenn Du KRITIS-CISO bei einem deutschen Energieversorger oder Krankenhausverbund bist

Wahl 1 — Warteliste — sofort beantragen. NIS2 und KRITIS-Verordnung sind in der Auslegung “Stand der Technik” ein bewegliches Ziel — Glasswing-Koalitionsteilnahme ist die sauberste Dokumentation, dass Ihr am Stand der Technik mitarbeitet. Wahl 2 ist für Euch off the table aus Compliance-Gründen.

Was diese Entscheidungstabelle Dir nicht sagen kann

Sie kann Dir nicht sagen, ob Mythos GA im Juli wirklich kommt. Anthropic hat Roadmap-Termine schon verschoben. Plane mit einer 30-60-Tage-Verzögerungs-Möglichkeit.

Sie kann Dir keine Preise nennen. Anthropic hat Claude-Security-Pricing noch nicht offengelegt. Plane für eine Anthropic-typische nutzungsbasierte Struktur mit Floor-Lizenz pro Seat.

Sie kann den NIS2- und EU-AI-Act-Compliance-Berater nicht ersetzen. Diese Tabelle ist Beschaffungs-Heuristik, nicht regulatorische Rechtsberatung. Sobald Du eine Wahl triffst, schick die Klausel-Sprache durch Dein internes Compliance-Team.

Das Fazit

Project Glasswing ist nicht die zehnte Mythos-Ankündigung — es ist die erste quantifizierte. 10.000 Vulns, 90,6 % True-Positive-Rate, Maintainer, die um Tempo bitten. Das ändert den Sorgfaltsmaßstab. Trifft die Entscheidung im Q3, nicht im Q4.

Wenn Du den KI-Sicherheits-Muskel auf Deinem Team aufbaust — vom Threat-Modell über Vendor-Risk bis zur EU-AI-Act- und NIS2-Konformität — geht unser KI-Sicherheit & Cybersecurity durch die End-to-End-Disziplin für DACH-Häuser.

Quellen

Echte KI-Skills aufbauen

Schritt-für-Schritt-Kurse mit Quizzes und Zertifikaten für den Lebenslauf