Grok-1.5V er den viktigste lanseringen for x.AI til nå.
Et veiskille for x.AI
Og kanskje for alltid, for dette er versjonen som tar skrittet fra å skjønne tekst, til å kunne lese visuell informasjon “som dokumenter, diagrammer, skjermbilder og fotografier,” forklarer selskapet i et ferskt blogg-innlegg. “Grok-1.5V vil snart være tilgjengelig for våre tidlige testere og eksisterende Grok-brukere,” avsløres det samtidig.
Å fremme både vår multimodale forståelse og generasjonsevner er viktige skritt for å bygge gunstig AGI som kan forstå universet. I løpet av de kommende månedene forventer vi å gjøre betydelige forbedringer i begge funksjonene, på tvers av ulike modaliteter som bilder, lyd og video.
x.AI
x.AI sine eksempler på visuell prosessering:
Det er også verdt å sjekke ut de andre eksemplene, som at Grok kan lage Python-kode av et tegnet diagram, hvor mange kalorier det er i et produkt, en historie skapt ved å “se” en barne-tegning og forklaring av et meme:
Annonse