Kjenner du Studio Ghibli? Filmstudioet bak anime-perler som Totoro og Chihiro har inspirert en trend på X, der ChatGPTs kraftig oppgraderte 4o-bildegenerering forvandler memes og kjente bilder til vakker Ghibli-stil – med imponerende detaljnivå, presis tekstgjengivelse og avansert kontekstforståelse.

Annonse


Dette endrer alt

Kjenner du til Studio Ghibli?

Mange ganger bedre

Det japanske animasjonsfilmstudioet Studio Ghibli, etablert i 1985 av filmskaperne Hayao Miyazaki, Isao Takahata og produsenten Toshio Suzuki, har satt standarden innen anime-sjangeren og har gjennom flere tiår skapt noen av verdens mest kritikerroste animasjonsfilmer.

Studioet har oppnådd global anerkjennelse for sin unike visuelle stil, detaljerte håndtegnede animasjoner, dype filosofiske undertoner, miljøbevisste temaer, samt sterke og komplekse rollefigurer. Blant deres mest kjente filmer er Min nabo Totoro, Chihiro og heksene (Spirited Away), Prinsesse Mononoke og Det levende slottet. Gjennom sitt arbeid har Studio Ghibli ikke bare påvirket japansk manga og animasjon, men også internasjonal filmkunst og populærkultur generelt.

Men hva i alle dager har dette med GPT-4o sin kraftige oppgraderte bildegenerering med 4o-modellen å gjøre? Jo, det har tatt helt av å spørre 4o om følgende på X: «lag et bilde av (emne, person etc.) med Ghibli-stil.» Det er nærmest umulig å bla i strømmen uten å se et innlegg annenhver gang med et kjent meme eller et historisk bilde eller en person som ikke har fått Ghibli-behandling.

Annonse


Men all bildegeneringeinner er mye bedre selvsagt, ikke bare med Ghibli. Faktisk brukte vi samme modell da vi lagde dette konseptet av en brette-iPhone. Kvaliteten på bildet er nærmest ugjenkjennelig mye bedre sammenlignet med den gamle bildemodellen.

Blant annet er dette forbedret:

  • Tekstgjengivelse: Modellen kan nå nøyaktig gjengi tekst innenfor bilder, noe som tidligere var utfordrende for bildegenereringsmodeller.
  • Instruksjonsfølgning: Den håndterer komplekse forespørsler med opptil 20 forskjellige objekter, og sikrer at attributter og relasjoner mellom objekter blir korrekt representert.  
  • Multimodal kontekstforståelse: GPT-4o kan tolke og generere bilder basert på både tekstlige beskrivelser og eksisterende bilder, noe som gir en mer sammenhengende og kontekstuelt relevant bildegenerering.  
Den gamle modellen serverte uklare resultatet.
Den nye modellen.
Dette brette-iPhone konseptet hadde sett mye mer grumsete ut med den gamle modellen.

«Førsteplass i matematikk, vanskelige forespørsler og koding»

GPT-4o er samtidig oppdatert med mye nytt. Nå er den tilgjengelig for betalende ChatGPT-brukere. Gratisbrukere får tilgang i løpet av noen uker.

  • Smartere problemløsing innen STEM og koding, inkludert renere og enklere frontend-kode, bedre forståelse av eksisterende kode og høyere suksessrate for kompilerbare og kjørbare løsninger
  • Bedre evne til å følge detaljerte instruksjoner, spesielt ved komplekse eller sammensatte forespørsler, med forbedret nøyaktighet i format og klassifisering
  • Forbedret forståelse av underforståtte intensjoner i kreative og samarbeidspregede oppgaver
  • Mer konsise og tydelige svar med færre hierarkier i markdown og redusert bruk av emojis

💬 Hopp til kommentarene

Annonse