Kilka dni temu Nicholas Carlini z Anthropic na konferencji [un]prompted 2026 pokazał, że Claude był w stanie samodzielnie znaleźć i wyeksploitować niewykryte wcześniej luki bezpieczeństwa (tzw. zero-day).

W jednym z przykładów Claude znalazł pierwszą krytyczną podatność w Ghost — jednym z najpopularniejszych systemów zarządzania treściami (50 000 gwiazdek na GitHubie).

Była to podatność typu Blind SQL Injection — pierwsza w historii tego projektu krytyczna luka bezpieczeństwa — która pozwoliła AI napisać skrypt, który wyciągnął klucze API i hashe haseł.

Co jeszcze bardziej imponujące, Claude wykrył również zupełnie inną, bardzo złożoną lukę w silnie zabezpieczonym kernelu Linuxa — heap buffer overflow w NFS — która pozostawała niezauważona przez ludzi od 2003 roku.


Jak raportuje Axios, firma Anthropic w nieoficjalnych rozmowach ostrzega rząd USA, że jej model, który nie został jeszcze udostępniony — obecnie noszący nazwę „Mythos" — znacznie zwiększa prawdopodobieństwo wystąpienia cyberataków na ogromną skalę jeszcze w 2026 roku.

Z kolei Fortune zdobył nieopublikowany post na blogu Anthropica, w którym można przeczytać:

„Mythos obecnie znacznie wyprzedza wszelkie inne modele sztucznej inteligencji pod względem zdolności cyber."

„Mythos jest zapowiedzią nadejścia fali modeli, które będą w stanie wykorzystywać luki w zabezpieczeniach w sposób znacznie wyprzedzający wysiłki osób odpowiedzialnych za cyberbezpieczeństwo."

Warto przy okazji przypomnieć, że pod koniec ubiegłego roku Anthropic ujawnił pierwszy udokumentowany przypadek cyberataku przeprowadzonego w większości przez sztuczną inteligencję — chińska grupa wspierana przez ChRL wykorzystała agentów AI do włamania się do około 30 celów na całym świecie, przy czym AI przeprowadziła około 80–90% operacji bez udziału człowieka.


Z perspektywy osoby z wewnątrz branży mogę potwierdzić, że nie wygląda to dobrze — defensywa jest ewidentnie z tyłu w porównaniu do wykorzystania AI w operacjach ofensywnych.

Na przykład na zeszłorocznej konferencji BSides w Krakowie nie było ani jednego wystąpienia na temat defensywnego wykorzystania AI — wszystkie prelekcje dotyczyły ofensywy.

Czekają nas trudne — ale ciekawe — czasy.

Źródła: Axios · Fortune · Anthropic