NLP Cloud'da GPT-J'nin insan talimatlarını doğal dilde düzgün bir şekilde anlamak için bir talimat modeli olarak ince ayarlanıp ayarlanamayacağını görmek istedik. Açık kaynak topluluğunda Flan-T5, BloomZ veya Stanford Alpaca gibi diğer girişimler ilginç sonuçlar verdi, bu yüzden Alpaca'nın veri setini kullanarak GPT-J üzerinde aynı şeyi yapmak istedik. Sonuçlar çok iyi!
Üretken yapay zeka modelleri, varsayılan olarak insan isteklerini anlama konusunda iyi değildir.
Bu metin oluşturma modellerinin ne istediğinizi anlamasını sağlamak için en iyi çözüm birkaç vuruşlu öğrenmeyi kullanmaktır. Az vuruşlu öğrenme hakkında özel bir rehber hazırladık burada bulabilirsiniz. GPT-J, yalnızca birkaç atışlık öğrenme ile doğru çalışan çok yetenekli bir modelin iyi bir örneğidir.
Bu örnekleri oluşturmak genellikle çok fazla zaman almasa bile, bu yapay zeka modellerini doğru bir şekilde kullanmak isteyen yeni başlayanlar için hala çok kafa karıştırıcıdır. Bir insana yaptığınız gibi doğal bir şekilde bir şeyler sormak çok daha kolaydır.
Örneğin, GPT-J ile yazım hatalarını düzeltmek istediğinizi varsayalım. İşte kullanmanız gereken bir komut istemi örneği:
I love goin to the beach.
Correction: I love going to the beach.
###
Let me hav it!
Correction: Let me have it!
###
It have too many drawbacks.
Correction: It has too many drawbacks.
###
I do not wan to go
Correction:
Gördüğünüz gibi, bu karmaşık değil ama basit de değil. GPT-J'ye uygun şekilde ince ayar yaparsanız, bir "talimat" modeline dönüştürülebilir, bu da artık aşağıdakileri sorabileceğiniz anlamına gelir:
Correct spelling and grammar from the following text.
I do not wan to go
Ve aşağıdaki sonucu döndürür:
I do not want to go.
Çok daha iyi değil mi? Bunu nasıl başarabiliriz?
Stanford Alpaca birkaç gün önce piyasaya sürüldü. Bu, Facebook tarafından geliştirilen Llama modelinin ince ayarlanmış bir versiyonudur. Bu proje hakkında daha fazla bilgiye buradan ulaşabilirsiniz.
Temel olarak Stanford Alpaca ekibi, insan talimatlarından oluşan oldukça küçük bir veri kümesi (52 bin örnek) üzerinde Llama'ya ince ayar yaparak son teknoloji ürünü bir talimat modeli bulmayı başardı. İşin ilginç yanı, bu veri kümesini daha büyük bir dil modeli (GPT-3) kullanarak programlı bir şekilde oluşturmuş olmalarıdır. Veri setini buradan indirebilirsiniz.
NLP Cloud'da bu veri setini kullanarak GPT-J'ye ince ayar yapmaya çalıştık ve şaşırtıcı derecede iyi sonuçlar aldık!
Oluşturduğumuz yeni Instruct GPT-J modeli, kolayca kullanabilmeniz için artık Hugging Face Hub'da: modeli görmek için buraya tıklayın.
Hugging Face Transformers'ı kullanarak modeli nasıl kullanabileceğinizi aşağıda bulabilirsiniz:
from transformers import pipeline
import torch
generator = pipeline(model="nlpcloud/instruct-gpt-j-fp16", torch_dtype=torch.float16, device=0)
prompt = "Correct spelling and grammar from the following text.\nI do not wan to go\n"
print(generator(prompt))
İşte deneyebileceğiniz bazı ipuçları:
Write a short story about space.\n
Generate a C++ program that sorts a list of integers in ascending order.\n
Paraphrase the following text.\nAfter a war lasting 20 years, following the decision taken first by President Trump and then by President Biden to withdraw American troops, Kabul, the capital of Afghanistan, fell within a few hours to the Taliban, without resistance.\n
Summarize the following text.\nFor all its whizz-bang caper-gone-wrong energy, and for all its subsequent emotional troughs, this week’s Succession finale might have been the most important in its entire run. Because, unless I am very much wrong, Succession – a show about people trying to forcefully mount a succession – just had its succession. And now everything has to change. The episode ended with Logan Roy defying his children by selling Waystar Royco to idiosyncratic Swedish tech bro Lukas Matsson. It’s an unexpected twist, like if King Lear contained a weird new beat where Lear hands the British crown to Jack Dorsey for a laugh, but it sets up a bold new future for the show. What will happen in season four? Here are some theories. Season three of Succession picked up seconds after season two ended. It was a smart move, showing the immediate swirl of confusion that followed Kendall Roy’s decision to undo his father, and something similar could happen here. This week’s episode ended with three of the Roy siblings heartbroken and angry at their father’s grand betrayal. Perhaps season four could pick up at that precise moment, and show their efforts to reorganise their rebellion against him. This is something that Succession undoubtedly does very well – for the most part, its greatest moments have been those heart-thumping scenes where Kendall scraps for support to unseat his dad – and Jesse Armstrong has more than enough dramatic clout to centre the entire season around the battle to stop the Matsson deal dead in its tracks.\n
Bu modelin ince ayarlı olması nedeniyle, talimatlarınızın sonunda her zaman yeni satırlar kullanmanız gerektiğini unutmayın.
Bu model, NVIDIA Tesla T4 gibi 16 GB VRAM'e sahip bir GPU'da çok iyi çalışan ince ayarlı modelimizin fp16 sürümüdür.
Kalite açısından fp32 ve fp16 sürümleri arasında herhangi bir fark görmedik.
GPT-J zaten çok iyi bir modeldi ve şimdi bir talimat modeli olarak kullanıldığında daha da iyi.
Bu teknik sayesinde artık herkes yapay zeka jeneratif modelini bir talimat modeline dönüştürebilir!
Yukarıdakiler hakkında sorularınız veya yorumlarınız varsa, lütfen iletişime geçmekten çekinmeyin!.
François
NLP Cloud'da Veri Bilimcisi