Grūtības ar mākslīgā intelekta vai pilnas paketes izstrādi? Mūsu eksperti ir gatavi jums palīdzēt: individuāli pielāgoti padomi, tehniskā integrācija un daudz kas cits. Sazinieties ar [email protected].

GPT-J instrukcijas versija, izmantojot Stenfordas Alpakas datu kopu

Uzņēmumā NLP Cloud mēs vēlējāmies noskaidrot, vai GPT-J var precīzi pielāgot kā instrukciju modeli, lai pareizi saprastu cilvēka norādījumus dabiskajā valodā, neizmantojot mācīšanos ar dažiem kadriem. Citi mēģinājumi ir devuši interesantus rezultātus atvērtā koda kopienā, piemēram, Flan-T5, BloomZ vai Stanford Alpaca, tāpēc mēs vēlējāmies to pašu izdarīt ar GPT-J, izmantojot Alpaca datu kopu. Rezultāti ir ļoti labi!

Stenfordas alpaka

Mācīšanās ar dažiem kadriem VS dabiskās valodas instrukcijas

Ģeneratīvie mākslīgā intelekta modeļi pēc noklusējuma labi nesaprot cilvēku pieprasījumus.

Lai šie teksta ģenerēšanas modeļi saprastu, ko vēlaties, vislabākais risinājums ir izmantot mācīšanos ar dažiem kadriem. Mēs izveidojām īpašu rokasgrāmatu par dažu kadru mācīšanos. to var atrast šeit. GPT-J ir labs piemērs ļoti spējīgam modelim, kas pareizi darbojas tikai ar mācīšanos ar dažiem kadriem.

Lai gan šo piemēru izveide parasti neaizņem pārāk daudz laika, tas tomēr ir ļoti mulsinoši jaunpienācējiem, kuri vēlas pareizi izmantot šos mākslīgā intelekta modeļus. Daudz vieglāk ir uzdot jautājumus dabiski, kā to darītu ar cilvēku.

Piemēram, pieņemsim, ka vēlaties labot pareizrakstības kļūdas, izmantojot GPT-J. Šeit ir redzams uzvednes piemērs, kas jums jāizmanto:

I love goin to the beach.
Correction: I love going to the beach.
###
Let me hav it!
Correction: Let me have it!
###
It have too many drawbacks.
Correction: It has too many drawbacks.
###
I do not wan to go
Correction:

Kā redzat, tas nav sarežģīti, bet nav arī vienkārši. Ja GPT-J tiek pareizi noregulēts, to var pārvērst par "instrukciju" modeli, kas nozīmē, ka tagad varat uzdot šādus jautājumus:

Correct spelling and grammar from the following text.
I do not wan to go

Un tas atgriež šādu informāciju:

I do not want to go.

Daudz labāk, vai ne? Kā mēs to varam panākt?

Stenfordas alpaka

Pirms pāris dienām tika izdota Stenfordas alpaka. Tā ir Facebook izstrādātā modeļa Llama pilnveidota versija. Vairāk par šo projektu lasiet šeit.

Būtībā Stenfordas Alpakas komandai izdevās izveidot vismodernāko instrukciju modeli, precīzi pielāgojot Llama diezgan nelielam datu kopumam (52 000 piemēru), kas sastāv no cilvēka instrukcijām. Interesanti ir tas, ka viņi šo datu kopu izveidoja programmatiski, izmantojot lielāku valodas modeli (GPT-3). Datu kopu varat lejupielādēt šeit.

Izmantojot šo datu kopu, mēs mēģinājām precīzi pielāgot GPT-J, un saņēmām pārsteidzoši labus rezultātus!

Instrukcija GPT-J

Mūsu izveidotais jaunais Instruct GPT-J modelis tagad ir pieejams vietnē Hugging Face Hub, lai jūs varētu to ērti izmantot: klikšķiniet šeit, lai apskatītu modeli.

Lūk, kā jūs varat izmantot modeli, izmantojot Apskāviena sejas transformatorus:

from transformers import pipeline
import torch

generator = pipeline(model="nlpcloud/instruct-gpt-j-fp16", torch_dtype=torch.float16, device=0)

prompt = "Correct spelling and grammar from the following text.\nI do not wan to go\n"

print(generator(prompt))

Šeit ir daži ieteikumi, kurus varat izmēģināt:

Write a short story about space.\n

Generate a C++ program that sorts a list of integers in ascending order.\n

Paraphrase the following text.\nAfter a war lasting 20 years, following the decision taken first by President Trump and then by President Biden to withdraw American troops, Kabul, the capital of Afghanistan, fell within a few hours to the Taliban, without resistance.\n

Summarize the following text.\nFor all its whizz-bang caper-gone-wrong energy, and for all its subsequent emotional troughs, this week’s Succession finale might have been the most important in its entire run. Because, unless I am very much wrong, Succession – a show about people trying to forcefully mount a succession – just had its succession. And now everything has to change. The episode ended with Logan Roy defying his children by selling Waystar Royco to idiosyncratic Swedish tech bro Lukas Matsson. It’s an unexpected twist, like if King Lear contained a weird new beat where Lear hands the British crown to Jack Dorsey for a laugh, but it sets up a bold new future for the show. What will happen in season four? Here are some theories. Season three of Succession picked up seconds after season two ended. It was a smart move, showing the immediate swirl of confusion that followed Kendall Roy’s decision to undo his father, and something similar could happen here. This week’s episode ended with three of the Roy siblings heartbroken and angry at their father’s grand betrayal. Perhaps season four could pick up at that precise moment, and show their efforts to reorganise their rebellion against him. This is something that Succession undoubtedly does very well – for the most part, its greatest moments have been those heart-thumping scenes where Kendall scraps for support to unseat his dad – and Jesse Armstrong has more than enough dramatic clout to centre the entire season around the battle to stop the Matsson deal dead in its tracks.\n

Ņemiet vērā, ka, ņemot vērā to, kā šis modelis tika precīzi pielāgots, instrukciju beigās vienmēr jāizmanto jaunas rindas.

Aparatūras prasības

Šis modelis ir mūsu precīzi noregulētā modeļa fp16 versija, kas ļoti labi darbojas uz GPU ar 16 GB VRAM, piemēram, NVIDIA Tesla T4.

Starp fp32 un fp16 versijām mēs nepamanījām nekādu atšķirību kvalitātes ziņā.

Secinājums

GPT-J jau iepriekš bija ļoti labs modelis, un tagad tas ir vēl labāks, ja to izmanto kā mācību modeli.

Pateicoties šai tehnikai, ikviens tagad var pārvērst savu mākslīgā intelekta ģeneratīvo modeli par instruktīvu modeli!

Ja jums ir jautājumi vai komentāri par iepriekš minēto, lūdzu, sazinieties ar mums!.

François
NLP Cloud datu zinātnieks