John Doe is a Go developer at Google.
Het doel van een Part-of-Speech tagger is om spraakdelen toe te wijzen aan elk token in je tekst. Een token is meestal een woord, maar het kan ook interpunctie zijn zoals "," "." ";" enz. Uiteindelijk zal de POS tagger je vertellen of een token een zelfstandig naamwoord, een werkwoord, een bijvoeglijk naamwoord, enz. is. Omdat taalstructuren radicaal verschillen van de ene taal tot de andere, moeten goede POS taggers zich aanpassen aan elke taal. Sommige talen zijn veel moeilijker te analyseren dan andere.
Laten we zeggen dat je de volgende zin hebt:
John Doe is a Go developer at Google.
De POS tagger geeft het volgende:
Dependency parsing in Natural Language Processing (NLP) is een techniek voor het analyseren van de grammaticale structuur van een zin. Het helpt te begrijpen hoe woorden in een zin zich tot elkaar verhouden. Dit wordt bereikt door het identificeren van afhankelijkheden tussen woorden, in wezen markeren hoe woorden van elkaar afhankelijk zijn om betekenis te geven.
Het kernidee achter afhankelijkheidsparsing is het construeren van een afhankelijkheidsboom (of -grafiek) waarin de knooppunten de woorden in een zin voorstellen en de randen de relaties tussen deze woorden. Elke rand in de afhankelijkheidsboom wordt gelabeld met het type grammaticale relatie dat bestaat tussen de verbonden woorden, zoals onderwerp, object, modificator, enz. De wortel van de boom is meestal het hoofdwerkwoord of de hoofdzin waar de andere woorden betrekking op hebben.
Gegevenswetenschappers die werken aan natuurlijke taalverwerking zijn vaak geïnteresseerd in het uitvoeren van Part-Of-Speech tagging in hun onderzoeksactiviteiten. Ze moeten ook vaak automatisch afhankelijkheden ontleden (samenstellingen, nominale onderwerpen, determinatoren...).
Afhankelijkheidsparsing is cruciaal voor verschillende NLP-taken zoals automatische vertaling, informatie-extractie, vraagbeantwoording en sentimentanalyse, omdat inzicht in de syntactische structuur van zinnen de nauwkeurigheid en effectiviteit van deze toepassingen aanzienlijk kan verbeteren. Afhankelijkheidsparsing stelt algoritmen in staat om de betekenis van zinnen nauwkeuriger te begrijpen door te begrijpen hoe de componenten van een zin (subjecten, predikaten, objecten, enz.) met elkaar verbonden zijn.
NLP Cloud biedt een Part-Of-Speech tagging en dependency parsing API waarmee u deze bewerking out of the box kunt uitvoeren, gebaseerd op spaCy en GiNZA. Part-Of-Speech tagging en dependency parsing zijn niet erg resource-intensief, dus de responstijd (latency), wanneer u ze uitvoert vanuit de NLP Cloud API, is erg laag. Je kunt het doen in 15 verschillende talen.
Voor meer details, zie onze documentatie over Part-Of-Speech tagging en dependency parsing hier.