Worstel je met AI of full-stack ontwikkeling? Onze experts staan klaar om je te begeleiden: advies op maat, technische integratie en meer. Neem contact op met [email protected].

De ChatGPT Open-Source Alternatieven

ChatGPT is een geavanceerde chatbot-engine, gebaseerd op de GPT-3.5 en GPT-4 modellen van OpenAI. Het is een krachtig model, maar het kan interessant zijn om open-source alternatieven te overwegen.

Het verkennen van open-source alternatieven voor ChatGPT maakt maatwerk en aanpassing aan specifieke behoeften of projecten mogelijk, en biedt mogelijk meer controle over de technologie met behoud van gegevensprivacy. Open-source modellen zorgen voor transparantie en stellen gebruikers in staat om de onderliggende mechanismen van het AI-model te begrijpen.

Er zijn tegenwoordig zeer goede open-source ChatGPT-alternatieven beschikbaar, zoals LLaMA 3, Mixtral 8x7B, Yi 34B en DBRX. Laten we deze alternatieven eens onderzoeken.

Chatbot

Generatieve AI-modellen: Hoe ze werken

ChatGPT is afgeleid van GPT-3.5 en GPT-4, moderne generatieve AI-modellen gebaseerd op de Transformer-architectuur. De Transformer-architectuur is een specifiek type neuraal netwerk dat in 2017 is uitgevonden door Google. Bekijk hier meer.

Generatieve AI-modellen zijn in principe goed in het genereren van tekst op basis van een specifieke invoer. Afhankelijk van je input kun je je AI-model verschillende dingen voor je laten doen. Je kunt je model bijvoorbeeld vragen om een stuk tekst te categoriseren, specifieke entiteiten uit een stuk tekst te halen, grote inhoud samen te vatten, inhoud te parafraseren, vragen te beantwoorden... en natuurlijk om als chatbot te fungeren.

Alle modellen die hieronder worden geïntroduceerd zijn "fundamentele" modellen, wat betekent dat het ruwe modellen zijn die meestal een paar keer moeten worden geleerd of bijgesteld om je instructies goed op te volgen. Het betekent ook dat deze modellen standaard geen beperkingen implementeren.

Om beter te begrijpen hoe je deze generatieve AI-modellen kunt gebruiken, raden we je aan onze gids te lezen over het gebruik van generatieve modellen met few-shot learning: lees het hier.

ChatGPT is een generatief model dat specifiek is geïnstrueerd om zich te gedragen als een chatbot. In de rest van dit artikel gaan we open-source alternatieven voor ChatGPT verkennen. Om ze te gebruiken in de conversatiemodus moet je ofwel gebruikmaken van 'few-shot learning' voor conversatie-AI of van 'fine-tuning'. Lees hier meer over leren op basis van een paar patronen voor conversationele AI. Lees hier meer over fijnafstelling.

LLaMA 3 van Meta

Meta heeft de LLaMA 3 serie van grote taalmodellen (LLM's) gelanceerd. Dit is een suite van generatieve tekstmodellen die vooraf getraind en verfijnd zijn, variërend in grootte van 7 tot 70 miljard parameters. De versies van deze modellen die specifiek zijn afgestemd op conversatie, bekend als Llama-2-Chat, zijn ontworpen voor dialoogtoepassingen. Vergeleken met vrij beschikbare chatmodellen laten de Llama-2-Chat modellen superieure prestaties zien in de meeste geëvalueerde benchmarks en, gebaseerd op onze beoordelingen van bruikbaarheid en veiligheid, evenaren ze de prestaties van enkele bekende eigen modellen zoals ChatGPT en PaLM.

LLaMA 3 bevat een autoregressief taalmodel dat is gebaseerd op een verbeterd transformatorraamwerk. De verbeterde versies ondergaan supervised fine-tuning (SFT) en reinforcement learning with human feedback (RLHF) om beter aan te sluiten bij de menselijke verwachtingen met betrekking tot bruikbaarheid en veiligheid.

De ontwikkeling van LLaMA 3 duurde van januari tot juli 2023, waarbij de pre-training fase gebruik maakte van meer dan 2 biljoen tokens uit gegevens die toegankelijk zijn voor het publiek. De fijnafstemmingsfase maakte gebruik van openbaar beschikbare instructiedatasets en bevatte meer dan een miljoen nieuwe voorbeelden die door mensen waren geannoteerd. Geen van de gegevens die gebruikt zijn in de pre-training of fine-tuning fases zijn afkomstig van Meta's gebruikersgegevens. Terwijl de pre-traininggegevens werden verzameld tot september 2022, zijn sommige gegevens voor fine-tuning recenter, namelijk tot juli 2023.

LLaMA 3 is ontworpen voor zowel commerciële als onderzoekstoepassingen, voornamelijk in het Engels. De verfijnde modellen zijn op maat gemaakt voor het maken van chattoepassingen die lijken op digitale assistenten, terwijl de voorgetrainde modellen veelzijdig genoeg zijn om te worden aangepast voor diverse toepassingen voor het genereren van natuurlijke taal.

Je kunt LLaMA 3 eenvoudig gebruiken op NLP Cloud: probeer het hier.

Mixtral 8x7B van Mistral AI

Mixtral overtreft LLaMA 3 70B in de meeste beoordelingen en levert zes keer snellere inferentiesnelheden. Het onderscheidt zich als het krachtigste model met open toegang en de beste keuze als het gaat om kostenefficiëntie. Het evenaart of overtreft met name de prestaties van GPT3.5 in de meeste erkende tests.

De mogelijkheden van Mixtral omvatten het probleemloos beheren van tot 32k tokens, de ondersteuning van meerdere talen zoals Engels, Frans, Italiaans, Duits en Spaans, uitzonderlijke mogelijkheden voor het genereren van code en de mogelijkheid om instructies nauwkeurig op te volgen, wat resulteerde in een score van 8,3 op MT-Bench.

In de kern is Mixtral een dun mixture-of-experts-netwerk, dat functioneert als een model dat alleen decodert. De structuur maakt het mogelijk om 8 verschillende parametergroepen te selecteren binnen het feedforward blok. Een speciaal router-netwerk op elke laag selecteert twee van deze groepen, of "experts", om elk token te verwerken, waarbij hun resultaten op een additieve manier worden gecombineerd.

Deze methode maakt het mogelijk om de parameters van een model uit te breiden en tegelijkertijd de kosten en latentie efficiënt te beheren door slechts een deel van de beschikbare parameters voor elk token te gebruiken. Specifiek beschikt Mixtral over een totaal van 46,7B parameters, maar past slechts 12,9B parameters toe per token, waardoor de verwerkingssnelheid en kosten gelijk zijn aan een 12,9B model.

Mixtral is ontwikkeld met behulp van gegevens van het openbare internet, waarbij de training van experts en routers gelijktijdig plaatsvond.

Je kunt Mixtral 8x7B eenvoudig uitproberen op NLP Cloud: probeer het hier.

Yi 34B bij 01 AI

De modellen uit de Yi-serie vertegenwoordigen de nieuwste vooruitgang in open-source grote taalmodellen die vanaf de grond zijn ontwikkeld door 01.AI. Deze modellen, gericht op tweetalig gebruik, zijn getraind op een enorme meertalige dataset van 3 terabyte, waardoor ze tot de krachtigste grote taalmodellen ter wereld behoren met sterke capaciteiten op het gebied van taalbegrip, redeneren en begrijpend lezen.

Het Yi-34B-Chat model veroverde de tweede positie, net achter GPT-4 Turbo, en overtrof andere grote taalmodellen zoals GPT-4, Mixtral en Claude op het AlpacaEval Leaderboard, met deze rangschikking gebaseerd op gegevens tot januari 2024. In termen van open-source modellen, eiste de Yi-34B de toppositie op voor zowel Engelse als Chinese taaltaken in verschillende benchmarks, en overtrof modellen als Falcon-180B, Llama-70B en Claude, volgens de standen op het Hugging Face Open LLM Leaderboard (voorgetraind) en C-Eval, met gegevens tot november 2023.

Gestructureerd op dezelfde manier als de Llama modelarchitectuur, geeft de Yi serie gebruikers toegang tot en gebruik van het bestaande ecosysteem van tools, bibliotheken en hulpmiddelen ontworpen voor Llama. Deze compatibiliteit vereenvoudigt het proces voor ontwikkelaars, maakt de ontwikkeling van nieuwe tools overbodig en verhoogt de productiviteit van het ontwikkelproces.

Je kunt Yi 34B eenvoudig uitproberen op NLP Cloud: probeer het hier.

DBRX van Databricks

DBRX is een groot taalmodel dat is gebouwd op een transformatorarchitectuur die zich alleen richt op decodering en gebruikt een methode die bekend staat als next-token prediction voor zijn training. Het beschikt over een gedetailleerde mixture-of-experts (MoE) structuur, met een totaal van 132 miljard parameters, waarvan 36 miljard worden gebruikt voor een gegeven invoer. Het model is voorgetraind op een enorm corpus van 12 biljoen tokens, met zowel tekst als code, tot een cut-off in december 2023. Deze mix van trainingsgegevens bevat zowel natuurlijke taal als codeervoorbeelden, met een aanzienlijk deel in het Engels.

DBRX onderscheidt zich door zijn fijnkorrelige aanpak in het gebruik van experts, waarbij 16 experts worden ingezet en 4 experts worden geselecteerd voor elke taak, in tegenstelling tot andere MoE-modellen zoals Mixtral-8x7B en Grok-1, die 8 experts hebben maar er slechts 2 kiezen. Deze aanpak levert 65 keer meer potentiële expertcombinaties op, wat leidt tot een aanzienlijke verbetering in de prestaties van het model. DBRX bevat geavanceerde functies zoals roterende positiecoderingen (RoPE), gated linear units (GLU) en gegroepeerde query attention (GQA) voor zijn bewerkingen.

Voor de pre-training werd DBRX gevoed met 12 biljoen tokens uit een zorgvuldig samengestelde dataset, met een contextbereik tot 32.000 tokens. Het achterliggende team, Databricks, gelooft dat deze dataset twee keer zoveel kwaliteit per token biedt in vergelijking met de gegevens die gebruikt worden voor de MPT-modelreeks.

De dataset werd gecreëerd met behulp van Databricks' uitgebreide toolkit, die Apache Spark™ en Databricks notebooks bevat voor het verwerken van de data, samen met Unity Catalog voor het beheren en besturen ervan. Databricks implementeerde een curriculum leerbenadering tijdens de pre-training fase, waarbij de datamix werd aangepast op een manier die de kwaliteit van het model aanzienlijk verhoogde.

DBRX is geprogrammeerd om alleen tekstgebaseerde invoer te verwerken en kan invoer verwerken met een lengte tot 32.768 tokens.

Conclusie

ChatGPT is een verbazingwekkende chatbot-engine die zeer geavanceerde vragen kan beantwoorden. Deze AI-engine is op veel gebieden zelfs relevanter dan de meeste mensen.

ChatGPT kan echter problemen opleveren op het gebied van gegevensprivacy en is beperkt voor veel gebruikssituaties. Het is interessant om ChatGPT te vergelijken met de meest geavanceerde open-source alternatieven: LLaMA 3, Mixtral 8x7B, Yi 34B en DBRX. En ongetwijfeld zullen er binnenkort nog meer geavanceerde open-source AI-modellen worden uitgebracht.

Als je LLaMA 3, Yi 34B en Mixtral 8x7B in productie wilt gebruiken, aarzel dan niet om de NLP Cloud API uit te proberen. (probeer het hier)!

Juliette
Marketingmanager bij NLP Cloud