GPT-4 og ChatGPT-alternativer med åpen kildekode: LLaMA 3 og Mixtral 8x7b

I denne bloggartikkelen utforsker vi alternativene GPT-4 og ChatGPT med åpen kildekode: LLaMA 3 og Mixtral 8x7b. Disse banebrytende språkmodellene skaper bølger i AI-miljøet og baner vei for mer effektiv behandling av naturlig språk. Bli med når vi ser nærmere på funksjonene og egenskapene til disse nye modellene og hvordan de kan sammenlignes med mer kjente modeller.

LLaMA 3 og Mixtral 8x7b

ChatGPT / GPT-4-gjennombruddet

ChatGPT og GPT-4 er avanserte språkmodeller utviklet av OpenAI. ChatGPT er en samtalebasert AI-modell som bruker naturlig språkbehandling til å generere menneskelignende svar på brukerens input, mens GPT-4 er en kraftigere og mer kompleks modell som er i stand til å generere tekst som er nesten umulig å skille fra menneskeskrift.

Begge modellene er trent på store mengder tekstdata, noe som gjør dem i stand til å generere svært nøyaktige og kontekstavhengige svar på et bredt spekter av spørsmål og instruksjoner. De har en lang rekke bruksområder innen områder som kundeservice, innholdsgenerering og språkoversettelse, og de utvikles og forbedres stadig i takt med den teknologiske utviklingen.

Begrensningene til ChatGPT og GPT-4

Selv om OpenAI utvilsomt har revolusjonert feltet kunstig intelligens, spesielt innen naturlig språkbehandling, har modellene deres noen ulemper sammenlignet med åpen kildekode-alternativer som LLaMA 3 eller Mixtral 8x7b.

En stor ulempe er kostnadene forbundet med å bruke OpenAIs tjenester, ettersom de krever abonnement eller betaling per bruk, noe som kan være uoverkommelig dyrt for enkelte enkeltpersoner og organisasjoner.

Et annet problem med ChatGPT og GPT-4 er personvernaspektet: OpenAI gir ingen sterke garantier for hvordan kundens data behandles, noe som er et problem for sensitive applikasjoner som medisinske eller finansielle applikasjoner.

Sist, men ikke minst, har OpenAI implementert innholdsbegrensninger i ChatGPT og GPT-4 for å sikre at AI-generert tekst følger deres retningslinjer, ved å overvåke og regulere innholdet som genereres av modellene. Noen bruksområder er rett og slett ikke kompatible med OpenAIs modeller, og noen mener at disse begrensningene gjør ChatGPT og GPT-4 mindre originale og nøyaktige enn deres ubegrensede motstykker.

La oss se hvilke alternativer du kan vurdere som alternativer til ChatGPT og GPT-4.

LLaMA 3

LLaMA 3-modellfamilien, utgitt av Meta, er etterfølgeren til de opprinnelige LLaMa 1-modellene, og inneholder både grunnmodeller og finjusterte "chat"-modeller. I motsetning til LLaMa 1-modellene som ble utgitt i 2022 under en ikke-kommersiell lisens, er LLaMA 3-modellene gratis tilgjengelig for både AI-forskning og kommersiell bruk.

Metas Llama-modeller har som mål å demokratisere det generative AI-økosystemet ved å gjøre koden og modellvektene fritt tilgjengelige og fokusere på å forbedre ytelsen til mindre modeller i stedet for å øke antallet parametere. Med 7 milliarder, 13 milliarder eller 70 milliarder parametere kan mindre organisasjoner distribuere lokale forekomster av LLaMA 3-modeller eller Llama-baserte modeller utviklet av AI-fellesskapet uten å måtte investere i kostbar databehandling eller infrastruktur.

Sammenlignet med sine proprietære motstykker viser LLaMA 3 overlegen ytelse når det gjelder aspekter som sikkerhet og faktakorrekthet. Selv om LLaMA 3 kanskje ikke er like omfattende som de langt større modellene, har LLaMA 3 åpenhet og økt effektivitet, noe som gir klare fordeler.

LLaMA 3 kan enten distribueres manuelt på stedet eller brukes via et dedikert API som NLP Cloud.

Mixtral 8x7b

Mixtral, lansert av den franske oppstartsbedriften Mistral AI, er et nettverk som kombinerer funksjonaliteten til flere eksperter i én enkelt modell. Det er en ren dekodermodell, noe som betyr at den bare dekoder informasjon, ikke koder den. Modellen består av åtte ulike parametergrupper, og på hvert lag og for hvert token velger et ruternettverk to av disse gruppene til å behandle tokenet og kombinerer resultatene.

Denne tilnærmingen gjør det mulig for modellen å øke antallet parametere og samtidig kontrollere kostnader og ventetid, ettersom bare en brøkdel av det totale antallet parametere brukes per token. Mixtral har for eksempel 46,7 milliarder parametere totalt, men bare 12,9 milliarder brukes per token. Det betyr at den behandler input og genererer output med samme hastighet og kostnad som en modell med 12,9 milliarder parametere.

Sammenlignet med andre modeller overgår Mixtral LLaMA 3 70B på de fleste benchmarks med 6 ganger raskere inferens. Det er den sterkeste modellen med åpen vekt med en permissiv lisens og gir det beste forholdet mellom kostnad og ytelse. Den matcher eller overgår GPT3.5 på de fleste benchmarks.

Mixtral 8x7b kan enten distribueres manuelt på stedet eller brukes via et dedikert API som NLP Cloud.

Hvordan bruke LLaMA 3 og Mixtral 8x7b?

Store språkmodeller som LLaMA 3 og Mixtral er interessante alternativer fordi du enten kan implementere dem selv eller bruke en AI-leverandør som leverer disse modellene som standard.

Det kan være interessant å distribuere LLaMA 3 og Mixtral på egen hånd hvis du har den rette devops- og AI-kompetansen i teamet ditt, og hvis du er heldig nok til å ha tilgang til riktig maskinvare. Det vil gjøre det mulig for deg å opprettholde avansert personvern for applikasjonen din, siden du ikke trenger å dele dataene dine med en skyleverandør.

Husk imidlertid at det kan være krevende å implementere en generativ modell, og det er enda vanskeligere å vedlikeholde slike LLM-er slik at de fungerer pålitelig i produksjon. Det kan være utfordrende å finne de rette ingeniørene til en slik jobb. For eksempel vil maskinvarekravene for å installere LLaMA 3 70b i fp16-modus uten kvantisering være minst 140 GB vRAM. Med tanke på den høye etterspørselen etter NVIDIA GPU-er er det svært komplisert å skaffe avanserte GPU-er med 140 GB vRAM.

Hvis du foretrekker å bruke LLaMA 3 eller Mixtral via et administrert AI-API som ikke går på bekostning av personvernet, oppfordrer vi deg til å prøve vårt NLP Cloud API. (Se NLP Clouds generative AI-API her.)! Og du kan også finjustere LLaMA 3 og Mixtral 8x7b på NLP Cloud, slik at modellen er perfekt tilpasset ditt bruksområde.

Dokumentasjon om LLaMA 3, Mixtral 8x7b og flere LLM-er

Konklusjon

GPT-4 og ChatGPT er fantastiske AI-modeller som virkelig har endret AI-spillet. For første gang i AI-historien er det umulig å avgjøre om det genererte innholdet kommer fra et menneske eller en maskin, noe som har fått mange bedrifter til å integrere GPT-4 og ChatGPT i sine produkter eller interne arbeidsflyter.

GPT-4 og ChatGPT kan imidlertid være skuffende på grunn av deres dårlige garantier når det gjelder personvern, og deres begrensede bruksområder på grunn av OpenAI-restriksjoner. Open source-miljøet har gjort en god jobb med å utvikle alternativer til GPT-4 og ChatGPT, som LLaMA 3 og Mixtral 8x7b.

Hvis du ønsker å utnytte LLaMA 3 og Mixtral, er det bare å prøve NLP Cloud API. (prøv det her)!

Juliette
Markedssjef i NLP Cloud