Feinabstimmung von GPT-J, der Open-Source-Alternative zu GPT-3

GPT-J mag das derzeit leistungsfähigste Open-Source-NLP-Modell sein (es ist die einzige Open-Source-Alternative, die mit GPT-3 konkurriert), aber vielleicht finden Sie es zu allgemein und nicht perfekt für Ihren Anwendungsfall geeignet. In diesem Fall, ist die Feinabstimmung von GPT-J mit Ihren eigenen Daten der Schlüssel.

Die Macht des GPT-J

Seit der Veröffentlichung durch EleutherAI im Juni 2021, , GPT-J has attracted tons of NLP users - data scientists or developers - who believe that this powerful NLP model will help them take their AI application to the next level.

Das Logo von EleutherAI

GPT-J ist so leistungsfähig, weil es mit 6 Milliarden Parametern trainiert wurde. Dies hat zur Folge, dass es sich um ein sehr vielseitiges Modell ist, das Sie für fast jeden fortgeschrittenen NLP-Anwendungsfall (Sentiment-Analyse, Textklassifizierung Textklassifikation, Chatbots, Übersetzung, Codegenerierung, Paraphrasengenerierung und vieles mehr). Wenn es richtig eingestellt ist, ist GPT-J so flüssig, dass man nicht sagen kann, dass der Text von einer Maschine erzeugt wurde...

Es ist möglich, GPT-J mit Hilfe der so genannten "few-shot"-Lerntechnik einfach und schnell an Ihren Anwendungsfall anzupassen. However, if few-shot learning is not enough, you need to go for a more advanced technique: fine-tuning.

Was ist Feinabstimmung?

Bei der Erstellung eines eigenen Modells geht es bei der traditionellen Technik darum, ein neues Modell von Grund auf von Grund auf mit Ihren eigenen Daten. Das Problem ist, dass moderne Modelle wie GPT-J so umfangreich sind, dass es fast unmöglich ist, dieses Modell von Grund auf zu trainieren. EleutherAI sagte, sie hätten 5 Wochen gebraucht, um GPT-J auf TPUs v3-256 zu trainieren, was bedeutet, dass es Hunderttausende von Dollar kostete...

Die gute Nachricht ist, dass ein erneutes Training des GPT-J nicht notwendig ist, da wir eine Feinabstimmung haben! Bei der Feinabstimmung geht es darum das bestehende GPT-J-Modell zu nehmen und es leicht anzupassen. In der Vergangenheit erforderte das Training traditioneller NLP-Modelle von Grund auf neu zu trainieren, brauchte man Tonnen von Beispielen. Bei den Transformer-basierten Modellen der neuen Generation ist das anders: Es sind weniger Beispiele erforderlich, die zu großartigen Ergebnissen führen können. Falls Sie schon einmal etwas von "Transfer-Lernen" gehört haben, wissen Sie, worum es dabei geht.

Wie lässt sich GPT-J feinabstimmen?

Auch wenn die Feinabstimmung von GPT-J viel einfacher ist als das Training des Modells von Grund auf, ist es dennoch eine Herausforderung aus mehreren Gründen:

• Dies ist ein sehr rechenintensiver Vorgang, der auf der GPU schmerzhaft lange dauern kann. Die beste Option ist dafür eine TPU zu verwenden.
• Der Feinabstimmungsprozess erfordert etwas Übung, einige Parameter sollten optimiert werden, und man kann kann leicht zu einer suboptimalen Genauigkeit führen.
• Sobald Sie Ihr brandneues, fein abgestimmtes Modell haben, ist es noch nicht vorbei: Sie müssen es einsetzen und es zuverlässig in der Produktion verwenden.

Wenn Sie selbst eine Feinabstimmung von GPT-J vornehmen möchten, können Sie dies folgendermaßen tun:

• Folgen Sie der Anleitung vom Mesh Transformer Jax-Team.
• Stellen Sie sicher, dass Sie die Feinabstimmung auf einer TPU V3 durchführen, da Ihnen auf einer TPU V2 der Speicher ausgeht. Dank des TPU Research Cloud (TRC) Programms können Sie einen kostenlosen TPU-Zugang für 1 Monat beantragen.
• Vergessen Sie nicht, Ihr Ergebnis in eine schlanke GPT-J-Version umzuwandeln, die für die Produktion besser geeignet ist Inferenz.

Feinabstimmung von GPT-J in der NLP-Cloud

Bei NLP Cloud haben wir hart an einer Feinabstimmungsplattform für GPT-J gearbeitet. Es ist nun möglich, eine einfache Feinabstimmung von GPT-J zu verfeinern: Laden Sie einfach Ihren Datensatz mit Ihren Beispielen hoch, und lassen Sie uns das Modell für Sie verfeinern und Modell für Sie. Sobald der Prozess abgeschlossen ist, können Sie Ihr neues Modell als privates Modell auf unserer API verwenden.

GPT-J-Feinabstimmung in der NLP-Cloud

Der Feinabstimmungsprozess selbst ist kostenlos, und anschließend müssen Sie einen Feinabstimmungsplan auswählen, der von dem Volumen der Anfragen, die Sie an Ihr neu eingesetztes Modell stellen wollen.

Wenn Sie nicht zu viel Zeit für die Feinabstimmung und den Einsatz aufwenden wollen, ist dies eine Option die Sie vielleicht in Betracht ziehen sollten.

Schlussfolgerung

GPT-J ist ein erstaunliches NLP-Modell. Mischen Sie es mit "few-shot learning" und Feinabstimmung, und Sie erhalten eine hochmoderne KI-Anwendung!

Wenn Sie Fragen haben, zögern Sie bitte nicht, uns zu kontaktieren.

Julien Salinas
CTO bei NLP Cloud