Võitlevad tehisintellekti või täieliku arendusega? Meie eksperdid on siin, et teid juhendada: kohandatud nõuanded, tehniline integratsioon ja palju muud. Võtke ühendust aadressil [email protected].

GPT-J, GPT-3 avatud lähtekoodiga alternatiiv, peenhäälestamine

GPT-J võib olla tänapäeval kõige võimsam avatud lähtekoodiga loodusliku keele töötlemise mudel (see on ainus avatud lähtekoodiga alternatiiv, mis konkureerib GPT-3), võib see olla liiga üldine ega sobi ideaalselt teie kasutusjuhtumi jaoks. Sellisel juhul, GPT-J peenhäälestamine teie enda andmetega on võtmetähtsusega.

GPT-J võimsus

Alates selle vabastamisest 2021. aasta juunis on GPT-J meelitanud ligi hulgaliselt loomuliku keele töötlemise kasutajaid - andmeteadlasi või arendajad -, kes usuvad, et see võimas loodusliku keele töötlemise mudel aitab neil viia oma tehisintellekti rakenduse järgmisele tasemele (vt EleutherAI veebisait).

EleutherAI logo
EleutherAI logo

GPT-J on nii võimas, sest see on koolitatud 6 miljardi parameetriga. Selle tulemusena on see väga mitmekülgne mudel, mida saab kasutada peaaegu kõikide arenenud loodusliku keeletöötluse kasutusjuhtumite jaoks (sentimentaalanalüüs, tekstianalüüs, teksti klassifitseerimine, juturobotid, tõlkimine, koodide genereerimine, parafraaside genereerimine ja palju muud). Kui see on õigesti häälestatud, GPT-J on nii sujuv, et on võimatu öelda, et tekst on masina poolt genereeritud...

GPT-J on võimalik hõlpsasti kohandada oma kasutusjuhtumile, kasutades nn tehnikat (vaata, kuidas seda kasutada siin). Kui aga väheste laskude õppimine ei ole piisab, peate kasutama edasijõudnumat tehnikat: peenhäälestustehnikat.

Mis on peenhäälestus?

Kui tegemist on oma mudeli loomisega, siis traditsiooniline tehnika seisneb uue mudeli treenimises alates nullist, kasutades oma andmeid. Probleem on selles, et moodsad mudelid, nagu GPT-J, on nii suured, et see on peaaegu kellelgi on võimatu seda mudelit nullist välja õpetada. EleutherAI ütles, et neil kulus 5 nädalat, et treenida GPT-J TPU-del v3-256, mis tähendab, et see maksis sadu tuhandeid dollareid...

Hea uudis on see, et GPT-J ümberõpetamine ei ole vajalik, sest meil on peenhäälestus! Peenhäälestus on umbes olemasoleva GPT-J mudeli kasutamine ja selle mõningane kohandamine. Varem on traditsiooniliste loodusliku keele töötlemise mudelite treenimine nullist alustades kulus tohutul hulgal näiteid. Uue põlvkonna Transformeril põhinevate mudelite puhul on see teisiti: vaja on vähem näiteid ja see võib viia suurepäraste tulemusteni. Kui te olete kunagi kuulnud "ülekandeõppimisest", siis on tegemist just sellega.

Kuidas häälestada GPT-J?

Isegi kui GPT-J peenhäälestamine on palju lihtsam kui mudeli treenimine nullist, on see siiski väljakutse. mitmel põhjusel:

Kui soovite GPT-J-d ise peenhäälestada, saate seda teha järgmiselt:

GPT-J peenhäälestamine NLP Cloudis

NLP Cloudis töötasime kõvasti GPT-J peenhäälestusplatvormi kallal. Nüüd on võimalik hõlpsasti peenhäälestada GPT-J: laadige lihtsalt üles oma näidiseid sisaldav andmekogum ning laske meil häälestada ja kasutusele võtta mudelit teie jaoks. Kui protsess on lõppenud, saate oma uut mudelit kasutada meie API-s privaatse mudelina.

GPT-J peenhäälestus NLP Cloudis
GPT-J peenhäälestus NLP Cloudis

Peenhäälestusprotsess ise on tasuta ja seejärel peate valima peenhäälestusplaani sõltuvalt taotluste mahust, mida soovite teha oma äsja kasutusele võetud mudeliga.

Kui te ei soovi kulutada liiga palju aega peenhäälestus- ja kasutuselevõtutoimingutele, siis on võimalus mida võiksite kaaluda.

Kokkuvõte

GPT-J on hämmastav loodusliku keele töötlemise mudel. Segage see kokku väheste õppimise ja peenhäälestusega ning saate tipptasemel tehisintellekti rakenduse!

Kui teil on küsimusi, võtke meiega julgelt ühendust.

Julien Salinas
NLP Cloud tehnoloogiajuht