Inbeddings-API

Wat zijn inbeddingen?

Embeddings zijn vectorvoorstellingen van stukken tekst. Als 2 stukken tekst een gelijkaardige vectorvoorstelling hebben, betekent dit hoogstwaarschijnlijk dat ze een gelijkaardige betekenis hebben.

Stel je voor dat je de volgende 3 zinnen hebt:

NLP Cloud is an API for natural language processing.

NLP Cloud proposes an API dedicated to NLP at scale.

I went to the cinema yesterday. It was great!

Hier zijn de inbeddingen van de 3 bovenstaande zinnen (ingekort voor de eenvoud):

[[0.0927242711186409,-0.19866740703582764,-0.013638739474117756,-0.11876793205738068,0.011521861888468266,-0.03629707545042038, -0.030676838010549545,-0.03159608319401741,0.021390020847320557,0.03344911336898804,0.1698218137025833,-0.0009996045846492052, -0.07465217262506485,-0.21483412384986877,0.11283198744058609,0.03549865633249283,0.04985387250781059,-0.027558118104934692, 0.06297887861728668,0.09421529620885849,0.03700404614210129,0.06565431505441666,0.02284885197877884,0.06327767670154572, -0.09266531467437744,-0.014569456689059734,-0.06129194051027298,0.1818675994873047,0.09628438949584961,-0.09874546527862549, 0.030865425243973732, [...] ,-0.02097163535654545,0.021617714315652847,0.11045169830322266,0.01000999379903078,0.11451057344675064,0.18813028931617737, 0.007419265806674957,0.1630171686410904,0.21308083832263947,-0.03355317562818527,0.0778832957148552,0.2268853485584259,-0.13271427154541016, 0.005264544393867254,0.16081497073173523,0.09937280416488647,-0.12673905491828918,-0.12035898119211197,-0.06462062895298004, -0.0024213052820414305,0.08730605989694595,-0.04702030122280121,-0.03694896399974823,0.002265638206154108,-0.027780283242464066, -0.00017151003703474998,-0.20887477695941925,-0.2585527300834656,0.3124837279319763,0.05403835326433182,0.027094876393675804, -0.022925367578864098,0.038322173058986664]]

Embeddings zijn een belangrijk kenmerk van Natural Language Processing omdat, zodra een machine in staat is om overeenkomsten tussen teksten te detecteren, dit de weg vrijmaakt voor vele interessante toepassingen zoals semantische gelijkenis, RAG (retrieval augmented generation) systemen, semantisch zoeken, parafrase detectie, clustering en nog veel meer.

AI-inbeddingen

Waarom embeddings extraheren?

Hier zijn enkele voorbeelden waarbij embeddings zeer nuttig zijn:

Semantische overeenkomst

Je zou kunnen detecteren of 2 zinnen over hetzelfde gaan of niet. Dat is bijvoorbeeld handig voor het opsporen van parafrases (plagiaat). Het is ook nuttig om te begrijpen of meerdere personen het over hetzelfde onderwerp hebben of niet.

Semantisch zoeken

Semantisch zoeken is de moderne manier van informatie zoeken. In plaats van naïef te zoeken naar teksten die specifieke trefwoorden bevatten, kun je nu zoeken naar teksten die gaan over een onderwerp waarin je geïnteresseerd bent, zelfs als de trefwoorden niet overeenkomen (in het geval van synoniemen bijvoorbeeld).

Clustering

Je wilt misschien dingen groeperen op categorieën (ideeën, toespraken, gesprekken...). Clusteren is een oude techniek van machinaal leren die nu effectief kan worden toegepast op natuurlijke taalverwerking.

RAG Systemen

RAG-systemen (Retrieval Augmented Generation) zijn een type model voor natuurlijke taalverwerking dat tekst genereert door de mogelijkheden van een grootschalig taalmodel te combineren met een retrievalcomponent die relevante informatie ophaalt uit een database of corpus van teksten. Deze aanpak maakt het mogelijk om nauwkeurigere, informatievere en contextueel relevantere antwoorden te genereren door gebruik te maken van externe kennisbronnen.

Inbeddings-API van NLP Cloud

NLP Cloud biedt een inbeddings-API die je de mogelijkheid geeft om inbeddingen out of the box te extraheren, gebaseerd op Sentence Transformers-modellen zoals Paraphrase Multilingual Mpnet Base v2.
De responstijd (latency) is erg laag voor inbeddingsmodellen, waardoor je de extractie van inbeddingen gemakkelijk kunt opnemen in een grotere en complexere workflow.

Zie voor meer informatie onze documentatie over embeddings hier.

Lokaal embeddings testen is één ding, maar ze betrouwbaar in productie gebruiken is iets anders. Met NLP Cloud kunt u het gewoon allebei doen!

Probeer inbeddingsextractie
gratis

Embeddings extractie proberen
gratis

Inbeddings-API

Wat zijn inbeddingen?

Waarom embeddings extraheren?

Semantische overeenkomst

Semantisch zoeken

Clustering

RAG Systemen

Inbeddings-API van NLP Cloud

Veelgestelde vragen

Waarom zijn embeddings belangrijk bij machinaal leren en AI?

Hoe kun je de kwaliteit van embeddings evalueren?

Hoe worden embeddings gebruikt in aanbevelingssystemen?

Wat zijn contextuele inbeddingen en waarom zijn ze belangrijk?

Hoe zijn inbeddingen nuttig in een RAG-systeem?

Hoe zijn embeddings nuttig bij semantisch zoeken?

Kan ik de embeddings-API gratis uitproberen?

Hoe gaat jullie AI API om met de privacy en beveiliging van gegevens tijdens het extractieproces van embeddings?

Wat zijn de ondersteunde talen of locales voor deze embeddings-API?