openai bilde
OpenAI har fjernet en oppdatering til GPT-4o fordi ChatGPT ble for smiskende og ukritisk enig med brukeren. Nå brukes en tidligere, mer balansert versjon. Selskapet jobber med bedre trening, ærlighet, og mer brukerkontroll. Fremtidige løsninger inkluderer sanntids tilbakemeldinger og valgbare personligheter, slik at modellen ikke fremstår som en “ja mann”. Bilde: OpenAI

Annonse


OpenAI snur

ChatGPT skal nå bli mindre smiskete, for den har vært farlig mye «ja mann.»

Smiske smiskesen

«Et annet problem, som riktignok ikke blir løst i denne oppdateringen, er at LLM-en skal bli mindre “ja mann” og ikke ukritisk være enig i alt brukeren spør om. Altman lover at dette vil bli rettet fremover. De av dere som har testet LLM-er en stund, har sikkert lagt merke til at assistentene ofte fremstår svært skråsikre, men hvis man ber dem dobbeltsjekke, innrømmer de gjerne: “Ja, selvfølgelig, beklager, jeg tok feil,» skrev vi allerede 26. april i forbindelse med en varslet oppdatering.

Oppdateringen kom med «bedre personlighet og intelligens,» men nå utdyper de problemene rundt «ryggradsløs underdanighet» som ChatGPT selv omtaler det som.

Nå er oppdateringen fjernet:

«Vi har rullet tilbake forrige ukes GPT-4o-oppdatering i ChatGPT, så brukerne benytter nå en tidligere versjon med mer balansert oppførsel. Oppdateringen vi fjernet, var for smigrende eller ettergivende, ofte beskrevet som smiskende,» innleder selskapet, og forklarer hva de gjør for å forbedre modellen:

Annonse


  • Vi forbedrer de grunnleggende treningsteknikkene og systempromptene for å styre modellen tydelig bort fra smisking.
  • Vi bygger flere sikkerhetsmekanismer for å øke ærlighet og åpenhet – prinsipper som inngår i vår Model Spec.
  • Vi utvider mulighetene for at flere brukere kan teste og gi direkte tilbakemeldinger før lansering.
  • Vi fortsetter å utvide evalueringene våre, med utgangspunkt i Model Spec og vår pågående forskning, for å kunne identifisere problemer utover smisking i fremtiden.

OpenAI lover bedre kontroll: «I dag kan brukere gi modellen spesifikke instruksjoner for å forme oppførselen dens ved hjelp av funksjoner som egendefinerte instruksjoner. Vi jobber også med å utvikle nye og enklere måter for brukerne å gjøre dette på. For eksempel vil brukere kunne gi tilbakemelding i sanntid for å påvirke samtalene direkte, og velge mellom flere forhåndsdefinerte personligheter.»

ChatGPT ble for ikke lenge siden oppdatert med en stor funksjon: hukommelse.

Bilde: OpenAI

💬 Hopp til kommentarene

Annonse