Instruct verze GPT-J s využitím datové sady Stanford Alpaca

Učení několika snímků VS instrukce v přirozeném jazyce

Generativní modely umělé inteligence nejsou ve výchozím nastavení dobré v porozumění lidským požadavkům.

Aby tyto modely pro generování textu rozuměly tomu, co chcete, je nejlepším řešením použít učení s několika snímky. Vytvořili jsme speciální příručku o učení několika snímků. najdete ji zde. GPT-J je dobrým příkladem velmi schopného modelu, který správně funguje pouze při učení několika snímků.

I když sestavení těchto příkladů obvykle nezabere příliš mnoho času, pro nováčky, kteří chtějí tyto modely umělé inteligence správně používat, je to stále velmi matoucí. Mnohem jednodušší je ptát se na věci přirozeně, jako byste to dělali s člověkem.

Řekněme například, že chcete opravit pravopisné chyby pomocí GPT-J. Zde je příklad výzvy, kterou musíte použít:

I love goin to the beach.
Correction: I love going to the beach.
###
Let me hav it!
Correction: Let me have it!
###
It have too many drawbacks.
Correction: It has too many drawbacks.
###
I do not wan to go
Correction:

Jak vidíte, není to složité, ale ani jednoduché. Pokud GPT-J správně vyladíte, lze z něj udělat "instruktážní" model, což znamená, že se nyní můžete ptát na následující:

Correct spelling and grammar from the following text.
I do not wan to go

A vrátí následující:

I do not want to go.

Mnohem lepší, že? Jak toho můžeme dosáhnout?

Stanfordská alpaka

Stanfordská alpaka byla vydána před několika dny. Jedná se o vyladěnou verzi modelu Llama, který vyvinula společnost Facebook. Více informací o tomto projektu naleznete zde.

Stanfordskému týmu Alpaca se v podstatě podařilo vytvořit nejmodernější model instrukcí vyladěním Lamy na poměrně malém souboru dat (52 tisíc příkladů) složeném z lidských instrukcí. Zajímavé je, že tuto datovou sadu vytvořili programově pomocí většího jazykového modelu (GPT-3). Datovou sadu si můžete stáhnout zde.

Ve společnosti NLP Cloud jsme se pokusili vyladit GPT-J pomocí této sady dat a dosáhli jsme překvapivě dobrých výsledků!

Pokyn GPT-J

Nový model Instruct GPT-J, který jsme vytvořili, je nyní umístěn na centru Hugging Face, takže jej můžete snadno používat: klikněte zde pro zobrazení modelu.

Zde se dozvíte, jak můžete model použít, a to pomocí aplikace Hugging Face Transformers:

from transformers import pipeline
import torch

generator = pipeline(model="nlpcloud/instruct-gpt-j-fp16", torch_dtype=torch.float16, device=0)

prompt = "Correct spelling and grammar from the following text.\nI do not wan to go\n"

print(generator(prompt))

Zde je několik podnětů, které můžete vyzkoušet:

Write a short story about space.\n

Generate a C++ program that sorts a list of integers in ascending order.\n

Paraphrase the following text.\nAfter a war lasting 20 years, following the decision taken first by President Trump and then by President Biden to withdraw American troops, Kabul, the capital of Afghanistan, fell within a few hours to the Taliban, without resistance.\n

Summarize the following text.\nFor all its whizz-bang caper-gone-wrong energy, and for all its subsequent emotional troughs, this week’s Succession finale might have been the most important in its entire run. Because, unless I am very much wrong, Succession – a show about people trying to forcefully mount a succession – just had its succession. And now everything has to change. The episode ended with Logan Roy defying his children by selling Waystar Royco to idiosyncratic Swedish tech bro Lukas Matsson. It’s an unexpected twist, like if King Lear contained a weird new beat where Lear hands the British crown to Jack Dorsey for a laugh, but it sets up a bold new future for the show. What will happen in season four? Here are some theories. Season three of Succession picked up seconds after season two ended. It was a smart move, showing the immediate swirl of confusion that followed Kendall Roy’s decision to undo his father, and something similar could happen here. This week’s episode ended with three of the Roy siblings heartbroken and angry at their father’s grand betrayal. Perhaps season four could pick up at that precise moment, and show their efforts to reorganise their rebellion against him. This is something that Succession undoubtedly does very well – for the most part, its greatest moments have been those heart-thumping scenes where Kendall scraps for support to unseat his dad – and Jesse Armstrong has more than enough dramatic clout to centre the entire season around the battle to stop the Matsson deal dead in its tracks.\n

Všimněte si, že vzhledem k tomu, jak byl tento model vyladěn, byste měli na konci pokynů vždy používat nové řádky.

Požadavky na hardware

Tento model je verzí fp16 našeho vyladěného modelu, který velmi dobře funguje na GPU s 16 GB VRAM, jako je NVIDIA Tesla T4.

Mezi verzemi fp32 a fp16 jsme nezaznamenali žádný rozdíl v kvalitě.

Závěr

GPT-J byl již dříve velmi dobrým modelem a nyní je ještě lepší, když se používá jako model pro výuku.

Díky této technice může nyní kdokoli proměnit svůj generativní model umělé inteligence v model instruktážní!

Pokud máte dotazy nebo připomínky k výše uvedenému, neváhejte se na nás obrátit!.

François
Datový vědec ve společnosti NLP Cloud