Google introduserte i kveld Gemini, deres nyeste og mest avanserte AI.
Gemini er Googles store AI-satsing
Google “introduserer sin største og mest avanserte AI-modell, Gemini, som nå blir gjort tilgjengelig,” heter det i pressemeldingen med tilhørende promo-video fra Google sine toppsjefer og sjefs-utviklere.
AI-en kommer i tre ulike modeller:
- Gemini Ultra – vår mest beste og største modell for svært komplekse oppgaver
- Gemini Pro — vår beste modell for skalering på tvers av et bredt spekter av oppgaver
- Gemini Nano — vår mest effektive modell for oppgaver på enheten
Tjenesten rulles ut i dag, blant annet til Bard, og er i stand til å tolke tekst, bilder, lyd, video og språk:
“Til nå har standardtilnærmingen for å lage multimodale modeller involvert å trene opp separate komponenter for forskjellige modaliteter og deretter sy dem sammen for å grovt etterligne noe av denne funksjonaliteten. Disse modellene kan noen ganger være flinke til å utføre visse oppgaver som å beskrive bilder, men sliter med mer konseptuelle og komplekse resonnementer.
Så vi designet Gemini til å være naturlig multimodal – forhåndsopplært fra starten på forskjellige modaliteter. Deretter finjusterte vi den med flere multimodale data for å forbedre effektiviteten ytterligere. Dette hjelper Gemini sømløst å forstå og resonnere om alle typer input fra grunnen av, langt bedre enn eksisterende multimodale modeller – og dens evner er toppmoderne på nesten alle domener,” forklarer Google.
Annonse
Dette betyr Gemini for forbrukere
Det er tre ting som er viktige for forbrukere å vite foruten at Bard bruker Gemini Pro og “vil være tilgjengelig på engelsk i mer enn 170 land og territorier. Den vil være langt mer dyktig til ting som å forstå og oppsummere, resonnere, utføre idédugnader, skrive og planlegge. Dette er den største enkeltoppgraderingen til Bard.”
Ja, jeg kjører på Googles Gemini AI, et stort språkmodell (LLM) utviklet av Google AI. Gemini er designet for å være mer multimodal enn tidligere LLM-er, noe som betyr at den kan forstå og svare på inndata fra en rekke kilder, inkludert tekst, kode og bilder. Den er også mer effektiv ved integrering av verktøy og API-er, noe som betyr at den kan integreres lettere i eksisterende systemer. Gemini er fortsatt under utvikling, men den har allerede vist imponerende ferdigheter, for eksempel å generere forskjellige kreative tekstformater av tekstinnhold, som dikt, kode, skript, musikkstykker, e-post, brev osv., og skrive forskjellige typer kreativt innhold.
Bard
Gemini kommer også til Pixel 8 Pro i form av Gemini Nano. Det vil gjøre det mulig for Googles nyeste mobil å summarisere i Recorder-appen, brukes i Smart Reply i Gboard og WhatsApp – støtte for flere meldingsapper kommer neste år. Gemini skal også bakes inn i søk, annonser, Chrome og Duet AI.
Annonse