GPT-4 och ChatGPT alternativ med öppen källkod: LLaMA 3 och Mixtral 8x7b

I den här bloggartikeln utforskar vi alternativen GPT-4 och ChatGPT med öppen källkod: LLaMA 3 och Mixtral 8x7b. Dessa banbrytande språkmodeller gör vågor i AI-samhället och banar väg för mer effektiv och effektiv naturlig språkbehandling. Följ med oss när vi fördjupar oss i funktionerna och kapaciteten hos dessa kommande modeller och hur de jämförs med sina mer välkända motsvarigheter.

LLaMA 3 och Mixtral 8x7b

ChattenGPT / GPT-4-genombrott

ChatGPT och GPT-4 är avancerade språkmodeller som utvecklats av OpenAI. ChatGPT är en AI-konversationsmodell som använder naturlig språkbehandling för att generera människoliknande svar på användarens input, medan GPT-4 är en mer kraftfull och komplex modell som kan generera text som är praktiskt taget omöjlig att skilja från mänsklig skrift.

Båda modellerna har tränats på stora mängder textdata, vilket gör att de kan generera mycket exakta och kontextuellt lämpliga svar på ett brett spektrum av frågor och uppmaningar. De har ett stort antal tillämpningar inom områden som kundservice, innehållsgenerering och språköversättning, och fortsätter att utvecklas och förbättras i takt med att tekniken går framåt.

Begränsningar för ChatGPT och GPT-4

OpenAI har utan tvekan revolutionerat området artificiell intelligens, särskilt inom naturlig språkbehandling, men deras modeller har vissa nackdelar jämfört med open source-alternativ som LLaMA 3 eller Mixtral 8x7b.

En stor nackdel är kostnaden för att använda OpenAI:s tjänster, eftersom de kräver en prenumeration eller betalning per användning, vilket kan vara oöverkomligt dyrt för vissa individer och organisationer.

Ett annat problem med ChatGPT och GPT-4 är integritetsaspekten: OpenAI erbjuder inga starka garantier för hur kundens uppgifter behandlas, vilket är ett problem för känsliga tillämpningar som medicinska eller finansiella tillämpningar.

Slutligen har OpenAI infört innehållsbegränsningar för ChatGPT och GPT-4 för att säkerställa att den AI-genererade texten följer deras riktlinjer, genom att övervaka och reglera det innehåll som genereras av deras modeller. Vissa användningsfall är helt enkelt inte kompatibla med OpenAI:s modeller och vissa anser att dessa begränsningar gör ChatGPT och GPT-4 mindre originella och korrekta än deras obegränsade motsvarigheter.

Låt oss se vilka alternativ du kan överväga som alternativ till ChatGPT och GPT-4.

LLaMA 3

LLaMA 3-modellfamiljen, som släpptes av Meta, fungerar som efterföljare till de ursprungliga LLaMa 1-modellerna och tillhandahåller både basmodeller och finjusterade "chatt"-modeller. Till skillnad från LLaMa 1-modellerna som släpptes 2022 under en icke-kommersiell licens, är LLaMA 3-modellerna tillgängliga gratis för både AI-forskning och kommersiell användning.

Metas Llama-modeller syftar till att demokratisera det generativa AI-ekosystemet genom att göra koden och modellvikterna fritt tillgängliga och fokusera på att förbättra prestandafunktionerna hos mindre modeller istället för att öka parameterantalet. Med 7 miljarder, 13 miljarder eller 70 miljarder parametrar kan mindre organisationer distribuera lokala instanser av LLaMA 3-modeller eller Llama-baserade modeller som utvecklats av AI-samhället utan att kräva dyr datortid eller infrastrukturinvesteringar.

I jämförelse med sina egenutvecklade motsvarigheter uppvisar LLaMA 3 överlägsen prestanda när det gäller aspekter som säkerhet och faktakorrekthet. Även om LLaMA 3 kanske inte har samma omfattande kapacitet som mycket större modeller, erbjuder dess öppna natur och ökade effektivitet tydliga fördelar.

LLaMA 3 kan antingen driftsättas manuellt på plats eller användas via ett särskilt API som NLP Cloud.

Mixtral 8x7b

Mixtral, som lanserats av den franska startupen Mistral AI, är ett nätverk som kombinerar funktionaliteten hos flera experter i en enda modell. Det är en renodlad avkodningsmodell, vilket innebär att den endast avkodar information, inte kodar den. Inom modellen finns det 8 olika grupper av parametrar, och i varje lager och för varje token väljer ett routernätverk ut två av dessa grupper för att bearbeta token och kombinera deras resultat.

Detta tillvägagångssätt gör det möjligt för modellen att öka antalet parametrar och samtidigt kontrollera kostnader och latens, eftersom endast en bråkdel av den totala uppsättningen parametrar används per token. Mixtral har till exempel totalt 46,7 miljarder parametrar, men endast 12,9 miljarder används per token. Det innebär att den bearbetar indata och genererar utdata med samma hastighet och kostnad som en modell med 12,9 miljarder parametrar.

I jämförelse med andra modeller överträffar Mixtral LLaMA 3 70B i de flesta benchmarks med 6x snabbare inferens. Det är den starkaste öppna viktmodellen med en tillåtande licens och erbjuder de bästa avvägningarna mellan kostnad och prestanda. Den matchar eller överträffar GPT3.5 på de flesta riktmärken.

Mixtral 8x7b kan antingen driftsättas manuellt på plats eller användas via ett särskilt API som NLP Cloud.

Hur använder man LLaMA 3 och Mixtral 8x7b?

Stora språkmodeller som LLaMA 3 och Mixtral är intressanta alternativ eftersom du antingen kan implementera dem själv eller anlita en AI-leverantör som tillhandahåller dessa modeller out of the box.

Att driftsätta LLaMA 3 och Mixtral själv kan vara intressant om man har rätt kompetens inom devops och AI i sitt team, och om man har turen att ha tillgång till rätt hårdvara. Det gör att du kan upprätthålla avancerad datasekretess för din applikation eftersom du inte behöver dela dina data med en molnleverantör.

Tänk på att det kan vara svårt att implementera en generativ modell, och att det är ännu svårare att underhålla sådana LLM-modeller så att de fungerar tillförlitligt i produktion. Att hitta rätt ingenjörer för ett sådant jobb kan vara en utmaning. Till exempel kommer hårdvarukraven för att installera LLaMA 3 70b i fp16-läge utan kvantisering att vara minst 140 GB vRAM. Med tanke på den nuvarande höga efterfrågan på NVIDIA GPU:er är det mycket komplicerat att tillhandahålla avancerade GPU:er med 140 GB eller vRAM.

Om du föredrar att använda LLaMA 3 eller Mixtral via ett hanterat AI API som inte äventyrar dataintegriteten, rekommenderar vi att du provar vårt NLP Cloud API. (Se NLP Clouds generativa AI API här)! Du kan också finjustera LLaMA 3 och Mixtral 8x7b på NLP Cloud, så att modellen är perfekt anpassad till ditt användningsområde.

Dokumentation om LLaMA 3, Mixtral 8x7b och fler LLM

Slutsats

GPT-4 och ChatGPT är fantastiska AI-modeller som verkligen förändrade AI-spelet. För första gången i AI-historien är det omöjligt att säga om det genererade innehållet kommer från en människa eller en maskin, vilket får många företag att integrera GPT-4 och ChatGPT i sin produkt eller i sina interna arbetsflöden.

GPT-4 och ChatGPT kan dock vara en besvikelse på grund av deras dåliga garantier när det gäller datasekretess och deras användningsbegränsningar på grund av OpenAI-begränsningar. Open source-communityn har gjort ett fantastiskt jobb med att utforma open source-alternativ till GPT-4 och ChatGPT som LLaMA 3 och Mixtral 8x7b.

Om du vill utnyttja LLaMA 3 och Mixtral, tveka inte att prova på NLP Cloud API (prova här)!

Juliette
Marknadschef på NLP Cloud