GPT-4 og ChatGPT Open Source-alternativer: LLaMA 3 og Mixtral 8x7b

I denne blogartikel udforsker vi open source-alternativerne GPT-4 og ChatGPT: LLaMA 3 og Mixtral 8x7b. Disse banebrydende sprogmodeller skaber bølger i AI-fællesskabet og baner vejen for mere effektiv behandling af naturligt sprog. Vær med, når vi dykker ned i funktionerne og mulighederne i disse up-and-coming modeller, og hvordan de sammenlignes med deres mere velkendte modstykker.

LLaMA 3 og Mixtral 8x7b

ChatGPT / GPT-4-gennembruddet

ChatGPT og GPT-4 er avancerede sprogmodeller udviklet af OpenAI. ChatGPT er en AI-konversationsmodel, der bruger naturlig sprogbehandling til at generere menneskelignende svar på brugerinput, mens GPT-4 er en mere kraftfuld og kompleks model, der er i stand til at generere tekst, der næsten ikke kan skelnes fra menneskelig skrift.

Begge modeller er blevet trænet på store mængder tekstdata, så de kan generere meget præcise og kontekstuelt passende svar på en lang række spørgsmål og opfordringer. De har en lang række anvendelsesmuligheder inden for områder som kundeservice, indholdsgenerering og sprogoversættelse, og de udvikles og forbedres fortsat i takt med, at teknologien skrider frem.

Begrænsningerne ved ChatGPT og GPT-4

Selvom OpenAI utvivlsomt har revolutioneret området for kunstig intelligens, især inden for naturlig sprogbehandling, har deres modeller nogle ulemper sammenlignet med open source-alternativer som LLaMA 3 eller Mixtral 8x7b.

En stor ulempe er de omkostninger, der er forbundet med at bruge OpenAI's tjenester, da de kræver et abonnement eller betaling pr. brug, hvilket kan være uoverkommeligt dyrt for nogle enkeltpersoner og organisationer.

En anden bekymring ved ChatGPT og GPT-4 er databeskyttelsesaspektet: OpenAI tilbyder ikke stærke garantier for, hvordan kundens data behandles, hvilket er et problem for følsomme applikationer som medicinske eller finansielle applikationer.

Sidst men ikke mindst har OpenAI implementeret indholdsbegrænsninger på ChatGPT og GPT-4 for at sikre, at den AI-genererede tekst overholder deres retningslinjer ved at overvåge og regulere det indhold, der genereres af deres modeller. Nogle use cases er simpelthen ikke kompatible med OpenAI's modeller, og nogle mener, at disse begrænsninger gør ChatGPT og GPT-4 mindre originale og præcise end deres ubegrænsede modstykker.

Lad os se, hvilke muligheder du kan overveje som alternativer til ChatGPT og GPT-4.

LLaMA 3

LLaMA 3-modelfamilien, udgivet af Meta, fungerer som efterfølgeren til de originale LLaMa 1-modeller og leverer både basismodeller og finjusterede "chat"-modeller. I modsætning til LLaMa 1-modellerne, der blev udgivet i 2022 under en ikke-kommerciel licens, er LLaMA 3-modellerne gratis tilgængelige til både AI-forskning og kommerciel brug.

Metas Llama-modeller sigter mod at demokratisere det generative AI-økosystem ved at gøre koden og modelvægtene frit tilgængelige og fokusere på at fremme ydeevnen for mindre modeller i stedet for at øge antallet af parametre. Med 7 milliarder, 13 milliarder eller 70 milliarder parametre kan mindre organisationer implementere lokale forekomster af LLaMA 3-modeller eller Llama-baserede modeller udviklet af AI-samfundet uden at kræve dyr computertid eller infrastrukturinvesteringer.

Sammenlignet med sine proprietære modstykker viser LLaMA 3 overlegen ydeevne i aspekter som sikkerhed og faktuel korrekthed. Selvom LLaMA 3 måske ikke har de samme omfattende evner som meget større modeller, giver dens åbne natur og øgede effektivitet markante fordele.

LLaMA 3 kan enten implementeres manuelt on-premise eller bruges via en dedikeret API som NLP Cloud.

Mixtral 8x7b

Mixtral, som er udgivet af den franske startup Mistral AI, er et netværk, der kombinerer funktionaliteten fra flere eksperter i en enkelt model. Det er en dekoder-model, hvilket betyder, at den kun afkoder information, ikke koder den. Inden for modellen er der 8 forskellige grupper af parametre, og på hvert lag og for hvert token vælger et routernetværk to af disse grupper til at behandle tokenet og kombinerer deres output.

Denne tilgang gør det muligt for modellen at øge antallet af parametre, mens den stadig kontrollerer omkostninger og latenstid, da kun en brøkdel af det samlede sæt parametre bruges pr. token. For eksempel har Mixtral 46,7 milliarder parametre i alt, men kun 12,9 milliarder bruges pr. token. Det betyder, at den behandler input og genererer output med samme hastighed og omkostninger som en model med 12,9 milliarder parametre.

I sammenligning med andre modeller overgår Mixtral LLaMA 3 70B på de fleste benchmarks med 6 gange hurtigere inferens. Det er den stærkeste open-weight model med en permissiv licens, og den giver det bedste forhold mellem omkostninger og ydeevne. Den matcher eller overgår GPT3.5 på de fleste benchmarks.

Mixtral 8x7b kan enten implementeres manuelt on-premise eller bruges via en dedikeret API som NLP Cloud.

Hvordan bruger man LLaMA 3 og Mixtral 8x7b?

Store sprogmodeller som LLaMA 3 og Mixtral er interessante muligheder, fordi du enten selv kan implementere dem eller bruge en AI-leverandør, der leverer disse modeller out of the box.

Det kan være interessant selv at implementere LLaMA 3 og Mixtral, hvis du har de rette devops- og AI-kompetencer i dit team, og hvis du er heldig nok til at have adgang til den rette hardware. Det vil give dig mulighed for at opretholde avanceret databeskyttelse for din applikation, da du ikke behøver at dele dine data med en cloud-udbyder.

Husk dog på, at det kan være besværligt at implementere en generativ model, og det er endnu sværere at vedligeholde sådanne LLM'er, så de kan opføre sig pålideligt i produktionen. Det kan være en udfordring at finde de rigtige ingeniører til sådan et job. For eksempel vil hardwarekravene for at installere LLaMA 3 70b i fp16-tilstand uden kvantisering være mindst 140 GB vRAM. Med den nuværende høje efterspørgsel på NVIDIA GPU'er er det meget komplekst at forsyne avancerede GPU'er med 140 GB eller vRAM.

Hvis du foretrækker at bruge LLaMA 3 eller Mixtral via en administreret AI API, der ikke går på kompromis med databeskyttelse, opfordrer vi dig til at prøve vores NLP Cloud API. (Se NLP Clouds generative AI API her)! Og du kan også finjustere LLaMA 3 og Mixtral 8x7b på NLP Cloud, så modellen er perfekt skræddersyet til din brugssituation.

Dokumentation om LLaMA 3, Mixtral 8x7b og flere LLM'er

Konklusion

GPT-4 og ChatGPT er fantastiske AI-modeller, der virkelig har ændret AI-spillet. For første gang i AI-historien er det umuligt at sige, om det genererede indhold kommer fra et menneske eller en maskine, hvilket får mange virksomheder til at integrere GPT-4 og ChatGPT i deres produkt eller deres interne arbejdsgange.

GPT-4 og ChatGPT kan dog være skuffende på grund af deres dårlige garantier for databeskyttelse og deres begrænsninger i brug på grund af OpenAI-begrænsninger. Open source-fællesskabet har gjort et stort stykke arbejde med at designe open source-alternativer til GPT-4 og ChatGPT som LLaMA 3 og Mixtral 8x7b.

Hvis du vil udnytte LLaMA 3 og Mixtral, så tøv ikke med at prøve NLP Cloud API'en (Prøv det her)!

Juliette
Marketingchef hos NLP Cloud