google gemini
Google Gemini er selskapets AI som skal bakes inn i samtlige produkter. Google starter med Bard og Pixel for forbrukere.

Annonse


“Et betydelig gjennombrudd innen kunstig intelligens”

Google introduserte i kveld Gemini, deres nyeste og mest avanserte AI.

Gemini er Googles store AI-satsing

Google “introduserer sin største og mest avanserte AI-modell, Gemini, som nå blir gjort tilgjengelig,” heter det i pressemeldingen med tilhørende promo-video fra Google sine toppsjefer og sjefs-utviklere.

AI-en kommer i tre ulike modeller:

  • Gemini Ultra – vår mest beste og største modell for svært komplekse oppgaver
  • Gemini Pro — vår beste modell for skalering på tvers av et bredt spekter av oppgaver
  • Gemini Nano — vår mest effektive modell for oppgaver på enheten

Tjenesten rulles ut i dag, blant annet til Bard, og er i stand til å tolke tekst, bilder, lyd, video og språk:

“Til nå har standardtilnærmingen for å lage multimodale modeller involvert å trene opp separate komponenter for forskjellige modaliteter og deretter sy dem sammen for å grovt etterligne noe av denne funksjonaliteten. Disse modellene kan noen ganger være flinke til å utføre visse oppgaver som å beskrive bilder, men sliter med mer konseptuelle og komplekse resonnementer.

Så vi designet Gemini til å være naturlig multimodal – forhåndsopplært fra starten på forskjellige modaliteter. Deretter finjusterte vi den med flere multimodale data for å forbedre effektiviteten ytterligere. Dette hjelper Gemini sømløst å forstå og resonnere om alle typer input fra grunnen av, langt bedre enn eksisterende multimodale modeller – og dens evner er toppmoderne på nesten alle domener,” forklarer Google.

Annonse


Dette betyr Gemini for forbrukere

Det er tre ting som er viktige for forbrukere å vite foruten at Bard bruker Gemini Pro og “vil være tilgjengelig på engelsk i mer enn 170 land og territorier. Den vil være langt mer dyktig til ting som å forstå og oppsummere, resonnere, utføre idédugnader, skrive og planlegge. Dette er den største enkeltoppgraderingen til Bard.”

Ja, jeg kjører på Googles Gemini AI, et stort språkmodell (LLM) utviklet av Google AI. Gemini er designet for å være mer multimodal enn tidligere LLM-er, noe som betyr at den kan forstå og svare på inndata fra en rekke kilder, inkludert tekst, kode og bilder. Den er også mer effektiv ved integrering av verktøy og API-er, noe som betyr at den kan integreres lettere i eksisterende systemer. Gemini er fortsatt under utvikling, men den har allerede vist imponerende ferdigheter, for eksempel å generere forskjellige kreative tekstformater av tekstinnhold, som dikt, kode, skript, musikkstykker, e-post, brev osv., og skrive forskjellige typer kreativt innhold.

Bard

Gemini kommer også til Pixel 8 Pro i form av Gemini Nano. Det vil gjøre det mulig for Googles nyeste mobil å summarisere i Recorder-appen, brukes i Smart Reply i Gboard og WhatsApp – støtte for flere meldingsapper kommer neste år. Gemini skal også bakes inn i søk, annonser, Chrome og Duet AI.

Annonse