GPT-4 ir "ChatGPT" atvirojo kodo alternatyvos: LLaMA 3 ir Mixtral 8x7b

Šiame tinklaraščio straipsnyje nagrinėjame GPT-4 ir "ChatGPT" atvirojo kodo alternatyvas: LLaMA 3 ir Mixtral 8x7b. Šie pažangiausi kalbos modeliai kelia bangas dirbtinio intelekto bendruomenėje ir atveria kelią veiksmingesniam ir efektyvesniam natūralios kalbos apdorojimui. Prisijunkite prie mūsų, kai gilinsimės į šių perspektyvių modelių savybes ir galimybes bei jų palyginimą su labiau žinomais analogais.

LLaMA 3 ir

ChatGPT / GPT-4 proveržis

"ChatGPT" ir "GPT-4" yra pažangūs kalbos modeliai, kuriuos sukūrė "OpenAI". "ChatGPT" yra pokalbio AI modelis, kuris naudoja natūralios kalbos apdorojimą, kad sukurtų į žmogaus atsakymus į naudotojo įvestis, o "GPT-4" yra galingesnis ir sudėtingesnis modelis, galintis sukurti tekstą, kuris beveik nesiskiria nuo žmogaus rašto.

Abu modeliai buvo apmokyti apdoroti didelius tekstinių duomenų kiekius, todėl jie gali generuoti labai tikslius ir kontekstą atitinkančius atsakymus į įvairius klausimus ir užklausas. Jie plačiai taikomi tokiose srityse kaip klientų aptarnavimas, turinio kūrimas ir vertimas į kitas kalbas, o tobulėjant technologijoms toliau vystosi ir tobulėja.

"ChatGPT" ir GPT-4 apribojimai

Nors "OpenAI" neabejotinai sukėlė revoliuciją dirbtinio intelekto srityje, ypač natūralios kalbos apdorojimo srityje, jų modeliai turi tam tikrų trūkumų, palyginti su atvirojo kodo alternatyvomis, tokiomis kaip LLaMA 3 arba Mixtral 8x7b.

Vienas pagrindinių trūkumų - su "OpenAI" paslaugomis susijusios išlaidos, nes jas reikia prenumeruoti arba mokėti už naudojimąsi, o tai kai kuriems asmenims ir organizacijoms gali būti pernelyg brangu.

Dar vienas susirūpinimą keliantis dalykas, susijęs su ChatGPT ir GPT-4, yra duomenų privatumo aspektas: "OpenAI" nesuteikia tvirtų garantijų, kaip tvarkomi kliento duomenys, o tai yra problema jautrioms programoms, pavyzdžiui, medicininėms ar finansinėms programoms.

Galiausiai "OpenAI" įdiegė "ChatGPT" ir "GPT-4" turinio apribojimus, kad užtikrintų, jog dirbtinio intelekto sukurtas tekstas atitiktų jų gaires, stebėdama ir reguliuodama jų modelių sukuriamą turinį. Kai kurie naudojimo atvejai tiesiog nesuderinami su "OpenAI" modeliais, todėl kai kurie mano, kad dėl šių apribojimų "ChatGPT" ir "GPT-4" yra ne tokios originalios ir tikslios kaip jų analogai be apribojimų.

Pažiūrėkime, kokias galimybes galite apsvarstyti kaip "ChatGPT" ir "GPT-4" alternatyvas.

LLaMA 3

"Meta" išleista "LLaMA 3" modelių šeima yra originalių "LLaMa 1" modelių įpėdinė, kurioje pateikiami ir baziniai pagrindo modeliai, ir tiksliai suderinti "pokalbių" modeliai. Skirtingai nei 2022 m. pagal nekomercinę licenciją išleisti LLaMa 1 modeliai, LLaMA 3 modeliai yra nemokami ir dirbtinio intelekto tyrimams, ir komerciniam naudojimui.

"Meta Llama" modeliais siekiama demokratizuoti generatyvinio dirbtinio intelekto ekosistemą, nes kodas ir modelio svoriai yra laisvai prieinami, o pagrindinis dėmesys skiriamas mažesnių modelių našumo galimybėms, o ne parametrų skaičiaus didinimui. Turėdamos 7 milijardus, 13 milijardų arba 70 milijardų parametrų, mažesnės organizacijos gali diegti vietinius "LLaMA 3" modelių egzempliorius arba "Llama" pagrįstus modelius, kuriuos sukūrė dirbtinio intelekto bendruomenė, nereikalaudamos brangaus skaičiavimo laiko ar investicijų į infrastruktūrą.

Lyginant su patentuotais analogais, "LLaMA 3" pasižymi geresnėmis charakteristikomis, pavyzdžiui, saugumo ir faktinio teisingumo aspektais. Nors "LLaMA 3" neturi tokių išsamių gebėjimų kaip daug didesni modeliai, jo atvirumas ir didesnis efektyvumas suteikia išskirtinių privalumų.

"LLaMA 3" galima diegti rankiniu būdu vietoje arba naudoti per specialią API, pvz., "NLP Cloud".

"Mixtral 8x7b

Prancūzijos startuolio "Mistral AI" išleistas "Mixtral" yra tinklas, kuris sujungia kelių ekspertų funkcijas į vieną modelį. Tai tik dekoderio modelis, t. y. jis tik dekoduoja, o ne koduoja informaciją. Modelyje yra 8 skirtingos parametrų grupės, o kiekviename sluoksnyje ir kiekvienam ženklui apdoroti maršrutizatorių tinklas pasirenka dvi iš šių grupių ir sujungia jų rezultatus.

Taikant šį metodą galima padidinti modelio parametrų skaičių ir kartu kontroliuoti sąnaudas ir delsą, nes vienam simboliui naudojama tik dalis viso parametrų rinkinio. Pavyzdžiui, "Mixtral" turi 46,7 mlrd. visų parametrų, tačiau vienam žetonui naudojama tik 12,9 mlrd. parametrų. Tai reiškia, kad jis apdoroja įvestį ir generuoja išvestį tokiu pačiu greičiu ir sąnaudomis kaip 12,9 mlrd. parametrų modelis.

Palyginti su kitais modeliais, "Mixtral" daugumoje lyginamųjų testų lenkia "LLaMA 3 70B", o išvados daromos 6 kartus greičiau. Tai stipriausias atvirasis modelis su leidžiamąja licencija ir siūlo geriausią sąnaudų ir našumo kompromisą. Daugumoje lyginamųjų testų jis prilygsta arba lenkia GPT3.5.

"Mixtral 8x7b" galima diegti rankiniu būdu vietoje arba naudoti per specialią API, pvz., "NLP Cloud".

Kaip naudoti "LLaMA 3" ir "Mixtral 8x7b"?

Dideli kalbos modeliai, tokie kaip LLaMA 3 ir Mixtral, yra įdomūs variantai, nes juos galite diegti patys arba pasinaudoti dirbtinio intelekto pardavėjo paslaugomis, kuris šiuos modelius pateikia iš karto.

Įdiegti "LLaMA 3" ir "Mixtral" patiems gali būti įdomu, jei jūsų komanda turi tinkamų "devops" ir dirbtinio intelekto įgūdžių ir jei jums pasisekė, kad turite prieigą prie tinkamos aparatinės įrangos. Tai leis jums išlaikyti pažangų savo taikomosios programos duomenų privatumą, nes jums nereikės dalytis duomenimis su debesijos paslaugų teikėju.

Atminkite, kad generatyvinio modelio diegimas gali būti varginantis, o tokių LLM priežiūra, kad jie patikimai veiktų gamyboje, yra dar sunkesnė. Rasti tokiam darbui tinkamų inžinierių gali būti sudėtinga. Pavyzdžiui, norint įdiegti LLaMA 3 70b fp16 režimu be kvantavimo, reikia mažiausiai 140 GB vRAM aparatinės įrangos. Atsižvelgiant į dabartinę didelę NVIDIA GPU paklausą, aprūpinti pažangius GPU 140 GB arba vRAM yra labai sudėtinga.

Jei norite naudoti "LLaMA 3" arba "Mixtral" naudodami valdomą AI API, kuri neaukoja duomenų privatumo, raginame išbandyti mūsų NLP Cloud API. (Peržiūrėkite "NLP Cloud" generatyvinio dirbtinio intelekto API čia)! Be to, "NLP Cloud" galite tiksliai suderinti "LLaMA 3" ir "Mixtral 8x7b", kad modelis būtų puikiai pritaikytas jūsų naudojimo atvejui.

Dokumentai apie LLaMA 3, Mixtral 8x7b ir daugiau LLM

Išvada

"GPT-4" ir "ChatGPT" yra nuostabūs dirbtinio intelekto modeliai, kurie tikrai pakeitė dirbtinio intelekto žaidimą. Pirmą kartą dirbtinio intelekto istorijoje neįmanoma pasakyti, ar generuojamą turinį sukūrė žmogus, ar mašina, todėl daugelis įmonių integruoja GPT-4 ir ChatGPT į savo produktus arba vidines darbo eigas.

Tačiau GPT-4 ir ChatGPT gali nuvilti dėl prastų duomenų privatumo garantijų ir dėl "OpenAI" apribojimų. Atvirojo kodo bendruomenė atliko didelį darbą kurdama atvirojo kodo alternatyvas GPT-4 ir ChatGPT, pavyzdžiui, LLaMA 3 ir Mixtral 8x7b.

Jei norite pasinaudoti "LLaMA 3" ir "Mixtral", nedvejodami išbandykite "NLP Cloud" API. (pabandykite čia)!

Juliette
"NLP Cloud" rinkodaros vadovas