John Doe is a Go developer at Google.
Målet med en Part-of-Speech-tagger er at tildele taledele til hvert token i din tekst. Et token er for det meste et ord, men det kan også være tegnsætning som "," "." ";" osv. I sidste ende vil POS-taggeren fortælle dig, om et token er et substantiv, et verbum, et adjektiv osv. Da sprogstrukturer er radikalt forskellige fra et sprog til et andet, er gode POS-taggere nødt til at tilpasse sig hvert enkelt sprog. Nogle sprog er meget sværere at analysere end andre.
Lad os sige, at du har følgende sætning:
John Doe is a Go developer at Google.
POS-taggeren vil returnere følgende:
Dependency parsing i Natural Language Processing (NLP) er en teknik til at analysere den grammatiske struktur i en sætning. Den hjælper med at forstå, hvordan ord i en sætning relaterer til hinanden. Dette opnås ved at identificere afhængigheder mellem ord, hvilket i bund og grund markerer, hvordan ord er afhængige af hinanden for at give mening.
Kerneideen bag dependency parsing er at konstruere et afhængighedstræ (eller en graf), hvor knuderne repræsenterer ordene i en sætning, og kanterne repræsenterer relationerne mellem disse ord. Hver kant i dependenstræet er mærket med den type grammatisk relation, der findes mellem de forbundne ord, såsom subjekt, objekt, modifikator osv. Roden af træet er normalt hovedverbet eller hovedsætningen, som de andre ord relaterer til.
Dataforskere, der arbejder med naturlig sprogbehandling, er ofte interesserede i at udføre Part-Of-Speech-tagging i deres forskningsaktiviteter. De har også ofte brug for automatisk at analysere afhængigheder (forbindelser, nominelle emner, determinanter ...).
Dependency parsing er afgørende for forskellige NLP-opgaver som maskinoversættelse, informationsudvinding, besvarelse af spørgsmål og sentimentanalyse, fordi forståelsen af sætningers syntaktiske struktur kan forbedre nøjagtigheden og effektiviteten af disse applikationer betydeligt. Dependency parsing gør det muligt for algoritmer at forstå betydningen af sætninger mere præcist ved at forstå, hvordan komponenterne i en sætning (subjekter, prædikater, objekter osv.) er forbundet.
NLP Cloud foreslår en Part-Of-Speech tagging og dependency parsing API, der giver dig mulighed for at udføre denne operation out of the box, baseret på spaCy og GiNZA. Part-Of-Speech tagging og dependency parsing er ikke særlig ressourcekrævende, så svartiden (latency), når man udfører dem fra NLP Cloud API, er meget lav. Du kan gøre det på 15 forskellige sprog.
For flere detaljer, se vores dokumentation om Part-Of-Speech tagging og dependency parsing her.