Имате проблеми с ИИ или разработката на пълен пакет? Нашите експерти са тук, за да ви напътстват: индивидуални съвети, техническа интеграция и др. Свържете се с [email protected].

Инструктивна версия на GPT-J с използване на набора от данни на Stanford Alpaca

В NLP Cloud искахме да проверим дали GPT-J може да бъде прецизиран като модел за инструкции, за да разбира правилно човешките инструкции на естествен език, без да използва обучение с няколко избора. Други опити са дали интересни резултати в общността на отворения код, като Flan-T5, BloomZ или Stanford Alpaca, така че искахме да направим същото за GPT-J, използвайки набор от данни на Alpaca. Резултатите са много добри!

Станфордска алпака

Учене с няколко изстрела срещу инструкции на естествен език

Генеративните модели на ИИ по подразбиране не разбират добре човешките заявки.

За да могат тези модели за генериране на текст да разберат това, което искате, най-доброто решение е да се използва обучение с няколко кадъра. Направихме специално ръководство за обучение с няколко кадъра можете да го намерите тук. GPT-J е добър пример за много способен модел, който работи правилно само при обучение с няколко изстрела.

Въпреки че изграждането на тези примери обикновено не отнема много време, то все още е много объркващо за начинаещите, които искат да използват правилно тези модели на изкуствен интелект. Много по-лесно е да задавате въпроси по естествен начин, както бихте направили с човек.

Например да кажем, че искате да коригирате правописни грешки с GPT-J. Ето един пример за подкана, която трябва да използвате:

I love goin to the beach.
Correction: I love going to the beach.
###
Let me hav it!
Correction: Let me have it!
###
It have too many drawbacks.
Correction: It has too many drawbacks.
###
I do not wan to go
Correction:

Както виждате, това не е сложно, но не е и просто. Ако правилно настроите GPT-J, той може да се превърне в модел "инструктиране", което означава, че вече можете да зададете следните въпроси:

Correct spelling and grammar from the following text.
I do not wan to go

И тя ще върне следното:

I do not want to go.

Много по-добре, нали? Как можем да го постигнем?

Станфордска алпака

Преди няколко дни бе пуснат в продажба алпака Stanford. Това е усъвършенствана версия на модела Llama, разработен от Facebook. Вижте повече за този проект тук.

По принцип екипът на Stanford Alpaca успява да създаде най-съвременен модел за инструкции, като настройва Llama върху сравнително малък набор от данни (52 хил. примера), съставен от човешки инструкции. Интересното е, че те са генерирали този набор от данни програмно, използвайки по-голям езиков модел (GPT-3). Можете да изтеглите набора от данни от тук.

В NLP Cloud се опитахме да настроим GPT-J с помощта на този набор от данни и получихме изненадващо добри резултати!

Инструкция GPT-J

Създаденият от нас нов модел Instruct GPT-J вече е в центъра за прегръщане на лица, за да можете лесно да го използвате: Кликнете тук, за да видите модела.

Ето как можете да използвате модела, като използвате трансформърс за прегръщане на лицето:

from transformers import pipeline
import torch

generator = pipeline(model="nlpcloud/instruct-gpt-j-fp16", torch_dtype=torch.float16, device=0)

prompt = "Correct spelling and grammar from the following text.\nI do not wan to go\n"

print(generator(prompt))

Ето няколко предложения, които можете да опитате:

Write a short story about space.\n

Generate a C++ program that sorts a list of integers in ascending order.\n

Paraphrase the following text.\nAfter a war lasting 20 years, following the decision taken first by President Trump and then by President Biden to withdraw American troops, Kabul, the capital of Afghanistan, fell within a few hours to the Taliban, without resistance.\n

Summarize the following text.\nFor all its whizz-bang caper-gone-wrong energy, and for all its subsequent emotional troughs, this week’s Succession finale might have been the most important in its entire run. Because, unless I am very much wrong, Succession – a show about people trying to forcefully mount a succession – just had its succession. And now everything has to change. The episode ended with Logan Roy defying his children by selling Waystar Royco to idiosyncratic Swedish tech bro Lukas Matsson. It’s an unexpected twist, like if King Lear contained a weird new beat where Lear hands the British crown to Jack Dorsey for a laugh, but it sets up a bold new future for the show. What will happen in season four? Here are some theories. Season three of Succession picked up seconds after season two ended. It was a smart move, showing the immediate swirl of confusion that followed Kendall Roy’s decision to undo his father, and something similar could happen here. This week’s episode ended with three of the Roy siblings heartbroken and angry at their father’s grand betrayal. Perhaps season four could pick up at that precise moment, and show their efforts to reorganise their rebellion against him. This is something that Succession undoubtedly does very well – for the most part, its greatest moments have been those heart-thumping scenes where Kendall scraps for support to unseat his dad – and Jesse Armstrong has more than enough dramatic clout to centre the entire season around the battle to stop the Matsson deal dead in its tracks.\n

Обърнете внимание, че поради начина, по който е настроен този модел, винаги трябва да използвате нови редове в края на инструкциите си.

Изисквания към хардуера

Този модел е fp16 версия на нашия фино настроен модел, който работи много добре с графичен процесор с 16 GB VRAM, като NVIDIA Tesla T4.

Не забелязахме никаква разлика между версиите fp32 и fp16 по отношение на качеството.

Заключение

GPT-J вече беше много добър модел, а сега е още по-добър, когато се използва като модел за обучение.

Благодарение на тази техника всеки вече може да превърне своя генеративен модел на изкуствен интелект в модел за инструктиране!

Ако имате въпроси или коментари относно горното, моля, не се колебайте да се свържете с нас!.

François
Учен по данните в NLP Cloud