Oppgraderingen er så stor at selskapet selv advarer

Anthropic lekket ved en feil sin nye AI-modell Mythos (og evt. Capybara, et annet produkt nevnt i et annet utkast) som skal være en stort sprang opp fra dagens Claude LLM-modeller, så mye at eksperter er redde for hva som kan skje når modellen slippes løs blant hobbyutviklere og hva hackere kan finne ut.

Anthropic bekrefter at de tester en ny modell

Selskapet publiserte ved en feil et blogginnlegg som senere ble slettet, men ikke før det i sin helhet ble lagret – nå er lekkasjen en sak hos Fortune, så om ikke annet er dette gratis-PR.

Avisen kontaktet selskapet som naturlig nok bekrefter at de trener og tester en ny modell, det gjør jo alle LLM-selskap hele tiden, men denne gangen skal oppdateringen skal være ektra stor.

Anthropic bruker dette til sin fordel til å markedsføre den nye modellen:

«Vi utvikler en allmennmodell med betydelige fremskritt innen resonnering, programmering og cybersikkerhet. Gitt styrken i kapasitetene, går vi bevisst og kontrollert frem i hvordan vi lanserer den. Som er vanlig praksis i bransjen, samarbeider vi med en liten gruppe tidligtilgangskunder for å teste modellen. Vi anser denne modellen som et betydelig sprang fremover og den mest kapable vi har bygget til nå,» uttaler en talsperson for selskapet ovenfor Fortune.

Annonse

Advarer mot at forbedringen kan hjelpe hackere

Apropos potensielle problemer: selskapet understreker dette selv i utkastet til pressemeldingen:

«I arbeidet med å lansere Claude Capybara ønsker vi å være ekstra forsiktige og forstå risikoen den innebærer – også utover det vi selv avdekker i testing. Spesielt vil vi forstå modellens potensielle kortsiktige risiko innen cybersikkerhet, og dele resultatene for å hjelpe forsvarere med å forberede seg.»

Hva er det de sikter til? Jo, muligheten for at den nye LLM-en kan misbrukes av black hat-hackere, som raskere kan finne nye og stadig mer alvorlige sårbarheter i datasystemer.

Les Anthropics pressemeldingsutkast

“Mythos” er et nytt navn for et nytt nivå av modell: større og mer intelligent enn våre Opus-modeller – som frem til nå har vært våre kraftigste. Vi valgte navnet for å fremkalle det dype, sammenkoblede vevet som binder kunnskap og ideer sammen.

Sammenlignet med vår tidligere beste modell, Claude Opus 4.6, oppnår Mythos betydelig høyere resultater på tester innen programvareutvikling, akademisk resonnering og cybersikkerhet, blant annet.

I arbeidet med å lansere Claude Mythos ønsker vi å gå frem med ekstra forsiktighet og forstå risikoene den medfører – også utover det vi selv har lært gjennom testing. Spesielt ønsker vi å forstå modellens potensielle kortsiktige risikoer innen cybersikkerhet – og dele resultatene for å hjelpe forsvarere med å forberede seg.

Mythos er også en stor, svært beregningskrevende modell. Den er svært kostbar for oss å drifte, og vil også være kostbar for kundene å bruke. Vi jobber med å gjøre modellen langt mer effektiv før en eventuell bred lansering.

INSERT

Av disse grunnene tar vi en langsommere og mer gradvis tilnærming til lanseringen av Mythos enn vi har gjort med våre andre modeller. Vi starter med et lite antall tidlige tilgangskunder, som vil utforske modellens cybersikkerhetsbruk og rapportere tilbake hva de finner.

Forsprang innen cybersikkerhet

Vi har skrevet flere ganger de siste månedene om den raske utviklingen i AI-modellers cybersikkerhetsferdigheter – ferdigheter som kan brukes både til gode og onde formål. Vi har dokumentert hvordan modeller kan brukes til raskt å oppdage sårbarheter i kodebaser; vi har også vist hvordan de allerede brukes til å gjennomføre storskala cyberangrep.

Selv om Mythos per i dag ligger langt foran enhver annen AI-modell innen cybersikkerhet, varsler den en kommende bølge av modeller som kan utnytte sårbarheter på måter som langt overgår forsvarernes evne til å håndtere dem.

Derfor fokuserer vår lanseringsplan for Mythos på cyberforsvarere: vi gir tidlig tilgang til organisasjoner, slik at de får et forsprang i å forbedre robustheten i sine kodebaser mot den kommende bølgen av AI-drevne angrep.

Sikkerhetstesting før lansering

Som med alle våre modeller har vi testet Claude Mythos gjennom et svært bredt spekter av sikkerhets- og kapabilitetsevalueringer.

Utvidelse av lanseringen

Vi vil gradvis utvide tilgangen til Claude Mythos til flere kunder via Claude API i løpet av de kommende ukene. Siden vi er spesielt interessert i bruk innen cybersikkerhet, er det her vi først vil utvide tidligtilgangsprogrammet.