Skip to content
Alle ressurser

Ut til fronten

Training Language Models to Follow Instructions (InstructGPT)

OpenAI2 min lesingGratis

Et enkelt sammendrag, så du får med deg poenget her uten å dra videre.

I 2022 viste OpenAI hvordan man får en språkmodell til virkelig å følge instruksjoner ved å justere den på menneskelige preferanser, en metode kalt RLHF som ble grunnlaget for ChatGPT.

Hva det er

En rå språkmodell er god til å forutsi tekst, men det er ikke det samme som å være hjelpsom. Den kan ignorere instruksjonen din eller svare på en lite nyttig måte. InstructGPT løser dette ved å legge et lag med menneskelig tilbakemelding til treningen.

Folk vurderer modellens svar og angir hvilke som er bedre. Modellen justeres så til å produsere mer av den typen svar mennesker foretrekker. Denne teknikken er kjent som forsterkende læring fra menneskelig tilbakemelding, eller RLHF.

Kjernetanken

I stedet for bare å lære av rå tekst, lærer modellen av menneskelige vurderinger om kvalitet. Vurderere rangerer svar, de rangeringene trener en modell av hva folk liker, og den preferansemodellen styrer så språkmodellen mot mer hjelpsomme, ærlige og treffsikre svar.

Resultatet er en modell som faktisk gjør det du ber om. En mindre modell justert på denne måten kan føles mer nyttig enn en større som bare ble trent til å forutsi tekst, fordi det å følge instruksjonen er det folk bryr seg om.

Hvorfor det betyr noe

Denne tilpasningsoppskriften er det som gjorde kraftige, men ustyrlige språkmodeller om til assistenter folk kan snakke med. ChatGPT og bølgen av samtaleassistenter som fulgte, er bygd på denne ideen.

For byggere er lærdommen at evne og hjelpsomhet er to forskjellige ting, og menneskelig tilbakemelding er en praktisk måte å bygge bro mellom dem. Mye av det som får moderne KI til å føles samarbeidsvillig, kommer fra dette steget.

Hovedpunkter
  • Publisert i 2022 av OpenAI.
  • Bruker menneskelig tilbakemelding til å lære en modell å følge instruksjoner.
  • Metoden er forsterkende læring fra menneskelig tilbakemelding (RLHF).
  • Gjør modeller mer hjelpsomme, ærlige og treffsikre enn rå forutsigelse alene.
  • Grunnlaget for ChatGPT og moderne samtaleassistenter.
Åpne originalkilden

OpenAI

Ny til dette? Kom og bygg med oss.

Å lese er bra. Å bygge sammen med andre er bedre. Samlingene våre er gratis og åpne for helt ferske.