Kilka dni temu Nicholas Carlini z Anthropic na konferencji [un]prompted 2026 pokazał, że Claude był w stanie samodzielnie znaleźć i wyeksploitować niewykryte wcześniej luki bezpieczeństwa (tzw. zero-day).
W jednym z przykładów Claude znalazł pierwszą krytyczną podatność w Ghost — jednym z najpopularniejszych systemów zarządzania treściami (50 000 gwiazdek na GitHubie).
Była to podatność typu Blind SQL Injection — pierwsza w historii tego projektu krytyczna luka bezpieczeństwa — która pozwoliła AI napisać skrypt, który wyciągnął klucze API i hashe haseł.
Co jeszcze bardziej imponujące, Claude wykrył również zupełnie inną, bardzo złożoną lukę w silnie zabezpieczonym kernelu Linuxa — heap buffer overflow w NFS — która pozostawała niezauważona przez ludzi od 2003 roku.
Jak raportuje Axios, firma Anthropic w nieoficjalnych rozmowach ostrzega rząd USA, że jej model, który nie został jeszcze udostępniony — obecnie noszący nazwę „Mythos" — znacznie zwiększa prawdopodobieństwo wystąpienia cyberataków na ogromną skalę jeszcze w 2026 roku.
Z kolei Fortune zdobył nieopublikowany post na blogu Anthropica, w którym można przeczytać:
„Mythos obecnie znacznie wyprzedza wszelkie inne modele sztucznej inteligencji pod względem zdolności cyber."
„Mythos jest zapowiedzią nadejścia fali modeli, które będą w stanie wykorzystywać luki w zabezpieczeniach w sposób znacznie wyprzedzający wysiłki osób odpowiedzialnych za cyberbezpieczeństwo."
Warto przy okazji przypomnieć, że pod koniec ubiegłego roku Anthropic ujawnił pierwszy udokumentowany przypadek cyberataku przeprowadzonego w większości przez sztuczną inteligencję — chińska grupa wspierana przez ChRL wykorzystała agentów AI do włamania się do około 30 celów na całym świecie, przy czym AI przeprowadziła około 80–90% operacji bez udziału człowieka.
Z perspektywy osoby z wewnątrz branży mogę potwierdzić, że nie wygląda to dobrze — defensywa jest ewidentnie z tyłu w porównaniu do wykorzystania AI w operacjach ofensywnych.
Na przykład na zeszłorocznej konferencji BSides w Krakowie nie było ani jednego wystąpienia na temat defensywnego wykorzystania AI — wszystkie prelekcje dotyczyły ofensywy.
Czekają nas trudne — ale ciekawe — czasy.