Named Entity Recognition (NER) API, met generatieve AI

Wat is NER?

NER staat voor Named Entity Recognition (Named entiteitherkenning). Het is een deeltaak die bestaat uit het identificeren en classificeren van genoemde entiteiten in tekst in vooraf gedefinieerde categorieën, zoals namen van personen, organisaties, locaties, tijdsaanduidingen, hoeveelheden, monetaire waarden, percentages, enz.

Generatieve modellen zoals GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B of Mixtral 8x7B zijn erg goed in het uitvoeren van entiteitsextractie.

NER is cruciaal voor veel NLP-toepassingen zoals vraagbeantwoording, tekstsamenvatting en automatische vertaling, omdat het gedetailleerde informatie geeft over de belangrijkste elementen van een tekst, waardoor een beter begrip en verwerking mogelijk wordt. Bijvoorbeeld, weten dat "Parijs" verwijst naar een locatie in een bepaalde tekst kan de interpretatie van die tekst en het antwoord gegenereerd door een NLP-systeem aanzienlijk beïnvloeden.

Laten we zeggen dat je de volgende zin hebt:

John Doe is een webontwikkelaar bij Google.

Je wilt automatisch detecteren dat "John Doe" een naam is, "webontwikkelaar" een functietitel en "Google" een bedrijf. En dit is precies wat NER gaat doen.

NER-annotatie

Enkele toepassingen voor het extraheren van entiteiten

De wereld zit vol ongestructureerde gegevens, vooral op het web. Als je daar gestructureerde informatie uit kunt halen, kun je toegang krijgen tot veel waardevolle informatie. Hier zijn een paar voorbeelden.

Klantverzoeken sorteren

Wanneer je te maken hebt met veel verzoeken van klanten (ondersteuning, verkoop, ...) helpt het zeker om NER toe te passen om deze inkomende verzoeken automatisch te sorteren. Je kunt bijvoorbeeld automatisch het type product uit het verzoek halen en dit naar de juiste service routeren.

Financiële gegevens extraheren

Het extraheren en consolideren van financiële gegevens kan lang en vervelend zijn. NER kan je productiviteit hier zeker een boost geven door je te helpen de juiste gegevens in een seconde te extraheren.

Voorverwerking cv's/sollicitaties

HR-diensten hebben het soms moeilijk om al deze sollicitaties te lezen. Het kan voor hen interessant zijn om interessante entiteiten zoals bedrijfsnamen, vaardigheden,... automatisch te markeren om tijd te besparen.

Leads uitpakken

Veel B2B leads zijn te vinden op openbare websites of bedrijfsbrochures, maar het handmatig extraheren kan soms lastig zijn. Dankzij NER kun je automatisch een persoon extraheren, met haar functietitel en bedrijf, als die bestaan.

NER API van NLP Cloud

NLP Cloud biedt een entiteitsextractie-API die het mogelijk maakt om Named Entity Recognition out of the box uit te voeren, gebaseerd op spaCy, Ginza, of meer geavanceerde generatieve AI-modellen die gelijkwaardig zijn aan GPT-5 of GPT-4, zoals GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B, en meer. Voor geavanceerde entiteitextractie op specifieke documenten raden we aan om uw eigen generatieve modellen voor NER op NLP Cloud te verfijnen.

Raadpleeg voor meer informatie onze documentatie over entiteitsextractie hier. Voor geavanceerd gebruik, zie het tekstgeneratie API eindpunt hier. En entiteitsextractie eenvoudig testen op onze speelplaats.

Lokaal NER testen is één ding, maar het betrouwbaar in productie gebruiken is iets anders. Met NLP Cloud kunt u het gewoon allebei doen!

Probeer NER
gratis

Veelgestelde vragen

Wat is Named Entity Recognition (NER)?

Named Entity Recognition (NER) is een deeltaak van informatie-extractie die genoemde entiteiten in tekst identificeert en classificeert in vooraf gedefinieerde categorieën, zoals de namen van personen, organisaties, locaties, uitdrukkingen van tijden, hoeveelheden, geldwaarden, percentages, enz. Het is een fundamentele techniek van Natural Language Processing (NLP) die wordt gebruikt voor het ophalen van informatie, het beantwoorden van vragen en kennisextractie.

Wat zijn de veelgebruikte categorieën in NER?

Veelgebruikte categorieën in Named Entity Recognition (NER) zijn persoonsnamen, organisaties, locaties, datums, tijden, geldwaarden, percentages en hoeveelheden. Deze categorieën helpen bij het identificeren en classificeren van belangrijke elementen in tekst voor informatie-extractie en analyse.

Hoe gaan moderne NER-systemen om met taalambiguïteiten en complexe structuren?

Moderne Named Entity Recognition (NER)-systemen maken gebruik van geavanceerde algoritmen voor machinaal leren, met name deep learning-architecturen zoals terugkerende neurale netwerken (RNN) en transformatoren, om context en semantische relaties binnen tekst te analyseren, waardoor ze dubbelzinnigheden en complexe linguïstische structuren kunnen beheren. Ze maken gebruik van enorme hoeveelheden geannoteerde trainingsgegevens en vooraf getrainde taalmodellen om entiteiten nauwkeurig te voorspellen, zelfs bij ambigue of ingewikkelde constructies.

Kunnen NER-systemen nieuwe of onbekende entiteiten herkennen?

NER-systemen (Named Entity Recognition) herkennen voornamelijk entiteiten waarop ze getraind zijn, maar hun vermogen om nieuwe of onbekende entiteiten te herkennen hangt af van de algemeenheid van hun trainingsgegevens en het aanpassingsvermogen van hun algoritmen. Sommige geavanceerde systemen, vooral die met deep learning en contextueel begrip, kunnen afleiden of generaliseren om voorheen ongeziene entiteiten te herkennen door te leren van de context waarin ze verschijnen. Op NLP Cloud kunt u perfect nieuwe of onbekende entiteiten herkennen!

Welke talen ondersteunt jullie AI API voor het extraheren van entiteiten?

We ondersteunen entiteitsextractie in 100 talen

Hoe snel retourneert de AI API entiteiten?

Dit hangt af van de grootte van je tekst en het AI-model dat je gebruikt. Over het algemeen is de reactietijd ongeveer een paar seconden.

Hoe evalueer je de nauwkeurigheid van NER?

Om de nauwkeurigheid van een Named Entity Recognition (NER)-systeem te evalueren, wordt meestal gebruikgemaakt van precisie, recall en de F1-score op basis van true positives, false positives en false negatives. Deze statistieken vergelijken de uitvoer van het systeem met een handmatig geannoteerde gouden standaard of ground truth om te bepalen hoe goed het systeem naamentiteiten identificeert en classificeert.

Kan ik jullie NER API gratis uitproberen?

Ja, net als alle modellen op NLP Cloud kan het NER API-eindpunt gratis worden getest.

Hoe gaat uw AI API om met de privacy en beveiliging van gegevens tijdens het extraheren van entiteiten?

NLP Cloud is gericht op data privacy by design: we loggen of slaan de inhoud van de verzoeken die je doet op onze API niet op. NLP Cloud voldoet zowel aan HIPAA als GDPR.