NLP Cloudissa halusimme nähdä, voisiko GPT-J:tä hienosäätää käskymalliksi, jotta se pystyisi ymmärtämään luonnollisen kielen inhimillisiä ohjeita oikein ilman muutaman askeleen oppimista. Muut yritykset ovat antaneet mielenkiintoisia tuloksia avoimen lähdekoodin yhteisössä, kuten Flan-T5, BloomZ tai Stanfordin Alpaca, joten halusimme tehdä saman GPT-J:lle käyttäen Alpacan tietokokonaisuutta. Tulokset ovat erittäin hyviä!
Generatiiviset tekoälymallit eivät oletusarvoisesti ole hyviä ymmärtämään ihmisten pyyntöjä.
Jotta nämä tekstinmuodostusmallit ymmärtäisivät, mitä haluat, paras ratkaisu on käyttää muutaman otoksen oppimista. Teimme erityisen oppaan few-shot-oppimisesta. löydät sen täältä. GPT-J on hyvä esimerkki erittäin kyvykkäästä mallista, joka toimii oikein vain muutaman laukauksen oppimisella.
Vaikka näiden esimerkkien rakentaminen ei yleensä vie kovin paljon aikaa, se on silti hyvin hämmentävää uusille tulokkaille, jotka haluavat käyttää näitä tekoälymalleja oikein. On paljon helpompaa kysyä asioita luonnollisesti kuten ihmiseltä.
Sanotaan esimerkiksi, että haluat korjata oikeinkirjoitusvirheitä GPT-J:llä. Tässä on esimerkki kehotteesta, jota sinun on käytettävä:
I love goin to the beach.
Correction: I love going to the beach.
###
Let me hav it!
Correction: Let me have it!
###
It have too many drawbacks.
Correction: It has too many drawbacks.
###
I do not wan to go
Correction:
Kuten huomaat, tämä ei ole monimutkaista mutta ei myöskään yksinkertaista. Jos GPT-J:tä hienosäädetään kunnolla, siitä voidaan tehdä "ohjeistava" malli, mikä tarkoittaa, että voit nyt kysyä seuraavaa:
Correct spelling and grammar from the following text.
I do not wan to go
Ja se palauttaisi seuraavan tuloksen:
I do not want to go.
Eikö olekin paljon parempi? Miten voimme saavuttaa tämän?
Stanford Alpaca julkaistiin pari päivää sitten. Se on hienosäädetty versio Facebookin kehittämästä Llama-mallista. Katso lisää tästä hankkeesta täältä.
Periaatteessa Stanfordin Alpaca-tiimi onnistui kehittämään huippuluokan käskymallin hienosäätämällä Llamaa melko pienellä tietokokonaisuudella (52 000 esimerkkiä), joka koostui ihmisten antamista ohjeista. Mielenkiintoista on se, että he tuottivat tämän tietokokonaisuuden ohjelmallisesti käyttämällä suurempaa kielimallia (GPT-3). Voit ladata tietokokonaisuuden täältä.
NLP Cloudissa yritimme hienosäätää GPT-J:tä tämän datasetin avulla, ja saimme yllättävän hyviä tuloksia!
Uusi luomamme Instruct GPT-J -malli on nyt Hugging Face Hubissa, joten voit käyttää sitä helposti: Klikkaa tästä nähdäksesi mallin.
Näin voit käyttää mallia käyttäen Hugging Face Transformers -muuntajia:
from transformers import pipeline
import torch
generator = pipeline(model="nlpcloud/instruct-gpt-j-fp16", torch_dtype=torch.float16, device=0)
prompt = "Correct spelling and grammar from the following text.\nI do not wan to go\n"
print(generator(prompt))
Tässä on muutamia kehotuksia, joita voit kokeilla:
Write a short story about space.\n
Generate a C++ program that sorts a list of integers in ascending order.\n
Paraphrase the following text.\nAfter a war lasting 20 years, following the decision taken first by President Trump and then by President Biden to withdraw American troops, Kabul, the capital of Afghanistan, fell within a few hours to the Taliban, without resistance.\n
Summarize the following text.\nFor all its whizz-bang caper-gone-wrong energy, and for all its subsequent emotional troughs, this week’s Succession finale might have been the most important in its entire run. Because, unless I am very much wrong, Succession – a show about people trying to forcefully mount a succession – just had its succession. And now everything has to change. The episode ended with Logan Roy defying his children by selling Waystar Royco to idiosyncratic Swedish tech bro Lukas Matsson. It’s an unexpected twist, like if King Lear contained a weird new beat where Lear hands the British crown to Jack Dorsey for a laugh, but it sets up a bold new future for the show. What will happen in season four? Here are some theories. Season three of Succession picked up seconds after season two ended. It was a smart move, showing the immediate swirl of confusion that followed Kendall Roy’s decision to undo his father, and something similar could happen here. This week’s episode ended with three of the Roy siblings heartbroken and angry at their father’s grand betrayal. Perhaps season four could pick up at that precise moment, and show their efforts to reorganise their rebellion against him. This is something that Succession undoubtedly does very well – for the most part, its greatest moments have been those heart-thumping scenes where Kendall scraps for support to unseat his dad – and Jesse Armstrong has more than enough dramatic clout to centre the entire season around the battle to stop the Matsson deal dead in its tracks.\n
Huomaa, että tämän mallin hienosäädön vuoksi ohjeiden lopussa on aina käytettävä uusia rivejä.
Tämä malli on fp16-versio hienosäädetystä mallistamme, joka toimii erittäin hyvin näytönohjaimella, jossa on 16 Gt VRAMia, kuten NVIDIA Tesla T4.
Emme huomanneet mitään eroa fp32- ja fp16-versioiden välillä laadun suhteen.
GPT-J oli jo ennestään erittäin hyvä malli, ja nyt se on vielä parempi, kun sitä käytetään ohjausmallina.
Tämän tekniikan ansiosta kuka tahansa voi nyt muuttaa tekoälynsä generatiivisen mallin ohjausmalliksi!
Jos sinulla on kysyttävää tai kommentteja edellä mainitusta, älä epäröi ottaa yhteyttä!.
François
Data Scientist at NLP Cloud