В NLP Cloud мы хотели проверить, можно ли доработать GPT-J как модель инструкций, чтобы правильно понимать человеческие инструкции на естественном языке, не прибегая к малоинформативному обучению. Другие попытки дали интересные результаты в сообществе open-source, такие как Flan-T5, BloomZ или Stanford Alpaca, поэтому мы хотели сделать то же самое с GPT-J, используя набор данных Alpaca. Результаты очень хорошие!
Генеративные модели ИИ по умолчанию не умеют понимать человеческие запросы.
Для того чтобы эти модели генерации текста понимали то, что вы хотите, лучшим решением будет использование обучения по нескольким снимкам. Мы подготовили специальное руководство по обучению несколькими выстрелами вы можете найти его здесь. GPT-J является хорошим примером очень способной модели, которая работает правильно только при обучении с несколькими выстрелами.
Даже если создание таких примеров обычно не занимает много времени, это все равно очень запутывает новичков, которые хотят правильно использовать эти модели ИИ. Гораздо проще спрашивать естественным образом, как вы бы сделали это с человеком.
Допустим, вы хотите исправить орфографические ошибки с помощью GPT-J. Вот пример подсказки, которую вы должны использовать:
I love goin to the beach.
Correction: I love going to the beach.
###
Let me hav it!
Correction: Let me have it!
###
It have too many drawbacks.
Correction: It has too many drawbacks.
###
I do not wan to go
Correction:
Как видите, это не сложно, но и не просто. Если правильно настроить GPT-J, его можно превратить в "инструктивную" модель, что означает, что теперь вы можете спросить следующее:
Correct spelling and grammar from the following text.
I do not wan to go
И это вернет следующее:
I do not want to go.
Намного лучше, не так ли? Как мы можем этого добиться?
Stanford Alpaca был выпущен несколько дней назад. Это доработанная версия модели Llama, разработанной Facebook. Подробнее об этом проекте можно узнать здесь.
По сути, команде Stanford Alpaca удалось создать самую современную модель инструкций путем тонкой настройки Llama на довольно небольшом наборе данных (52 тыс. примеров), состоящем из человеческих инструкций. Интересно то, что они сгенерировали этот набор данных программно, используя более крупную языковую модель (GPT-3). Вы можете скачать набор данных здесь.
В NLP Cloud мы попытались точно настроить GPT-J с помощью этого набора данных и получили удивительно хорошие результаты!
Новая модель Instruct GPT-J, которую мы создали, теперь находится на Hugging Face Hub, чтобы вы могли легко ее использовать: нажмите здесь, чтобы увидеть модель.
Вот как вы можете использовать модель, используя трансформер Hugging Face:
from transformers import pipeline
import torch
generator = pipeline(model="nlpcloud/instruct-gpt-j-fp16", torch_dtype=torch.float16, device=0)
prompt = "Correct spelling and grammar from the following text.\nI do not wan to go\n"
print(generator(prompt))
Вот несколько подсказок, которые вы можете попробовать:
Write a short story about space.\n
Generate a C++ program that sorts a list of integers in ascending order.\n
Paraphrase the following text.\nAfter a war lasting 20 years, following the decision taken first by President Trump and then by President Biden to withdraw American troops, Kabul, the capital of Afghanistan, fell within a few hours to the Taliban, without resistance.\n
Summarize the following text.\nFor all its whizz-bang caper-gone-wrong energy, and for all its subsequent emotional troughs, this week’s Succession finale might have been the most important in its entire run. Because, unless I am very much wrong, Succession – a show about people trying to forcefully mount a succession – just had its succession. And now everything has to change. The episode ended with Logan Roy defying his children by selling Waystar Royco to idiosyncratic Swedish tech bro Lukas Matsson. It’s an unexpected twist, like if King Lear contained a weird new beat where Lear hands the British crown to Jack Dorsey for a laugh, but it sets up a bold new future for the show. What will happen in season four? Here are some theories. Season three of Succession picked up seconds after season two ended. It was a smart move, showing the immediate swirl of confusion that followed Kendall Roy’s decision to undo his father, and something similar could happen here. This week’s episode ended with three of the Roy siblings heartbroken and angry at their father’s grand betrayal. Perhaps season four could pick up at that precise moment, and show their efforts to reorganise their rebellion against him. This is something that Succession undoubtedly does very well – for the most part, its greatest moments have been those heart-thumping scenes where Kendall scraps for support to unseat his dad – and Jesse Armstrong has more than enough dramatic clout to centre the entire season around the battle to stop the Matsson deal dead in its tracks.\n
Обратите внимание, что из-за того, что эта модель была доработана, вы всегда должны использовать новые строки в конце ваших инструкций.
Эта модель представляет собой fp16-версию нашей тонко настроенной модели, которая очень хорошо работает на GPU с 16 ГБ VRAM, например, NVIDIA Tesla T4.
Мы не заметили никакой разницы между версиями fp32 и fp16 в плане качества.
GPT-J и так был очень хорошей моделью, а теперь он стал еще лучше, когда используется в качестве обучающей модели.
Теперь любой может превратить свою генеративную модель ИИ в обучающую модель благодаря этой технике!
Если у вас есть вопросы или комментарии по вышеизложенному, пожалуйста, обращайтесь!.
François
Специалист по анализу данных в NLP Cloud