John Doe has been working for the Microsoft company in Seattle since 1999.
Zelfstandige naamwoorden (noun chunks) zijn een kernkenmerk van Natural Language Processing. In de taalkunde staan ze bekend als "zelfstandig naamwoord zinnen". In principe zijn het zelfstandige naamwoorden en alle woorden die van deze zelfstandige naamwoorden afhankelijk zijn.
Laten we bijvoorbeeld zeggen dat je de volgende zin hebt:
John Doe has been working for the Microsoft company in Seattle since 1999.
Hier zijn de zelfstandige naamwoorden uit deze zin:
Gegevenswetenschappers die werken aan de verwerking van natuurlijke taal zijn vaak geïnteresseerd in het extraheren van zelfstandig naamwoordbrokken in hun onderzoeksactiviteiten. Ze moeten ook vaak automatisch aanvullende informatie extraheren, zoals grondtekst, afhankelijkheid van de grondtekst en tekst in de kop van de grondtekst.
Naamwoordchunks kunnen ook worden gebruikt in echte bedrijfssituaties, meestal als onderdeel van een grotere natuurlijke taalverwerkingspijplijn. Sommige bedrijven gebruiken bijvoorbeeld naamwoordchunks om relevante trefwoorden uit artikelen te halen als onderdeel van een SEO-pijplijn.
NLP Cloud biedt een noun chunk API waarmee je deze bewerkingen out of the box kunt uitvoeren, gebaseerd op spaCy en Ginza. Noun chunk extractie is niet erg resource-intensief, dus de responstijd (latency), wanneer u deze uitvoert vanuit de NLP Cloud API, is erg laag. Je kunt het doen in 15 verschillende talen.
Voor meer details, zie onze documentatie over het extraheren van zelfstandig naamwoord brokken hier.