grok 1.5
x.AI har gjort et stort og viktig hopp med Grok i versjon 1.5.

Annonse


Viktig gjennombrudd for Musk

Grok-1.5V er den viktigste lanseringen for x.AI til nå.

Et veiskille for x.AI

Og kanskje for alltid, for dette er versjonen som tar skrittet fra å skjønne tekst, til å kunne lese visuell informasjon “som dokumenter, diagrammer, skjermbilder og fotografier,” forklarer selskapet i et ferskt blogg-innlegg. “Grok-1.5V vil snart være tilgjengelig for våre tidlige testere og eksisterende Grok-brukere,” avsløres det samtidig.

Å fremme både vår multimodale forståelse og generasjonsevner er viktige skritt for å bygge gunstig AGI som kan forstå universet. I løpet av de kommende månedene forventer vi å gjøre betydelige forbedringer i begge funksjonene, på tvers av ulike modaliteter som bilder, lyd og video.

x.AI

x.AI sine eksempler på visuell prosessering:

“For å utvikle nyttige AI-assistenter i den virkelige verden, er det avgjørende å fremme en modells forståelse av den fysiske verdenen. Mot dette målet introduserer vi en ny test, RealWorldQA. Testen er designet for å evaluere grunnleggende romlig forståelsesevner i den virkelige verden til multimodale modeller. Mens mange av eksemplene i gjeldende test er relativt enkle for mennesker, utgjør de ofte en utfordring for modellene.”

Det er også verdt å sjekke ut de andre eksemplene, som at Grok kan lage Python-kode av et tegnet diagram, hvor mange kalorier det er i et produkt, en historie skapt ved å “se” en barne-tegning og forklaring av et meme:

x.AI sine test-tall.

Annonse