John Doe is a Go developer at Google.
Målet med en Part-of-Speech-taggare är att tilldela varje token i din text en taldel. En token är oftast ett ord, men det kan också vara skiljetecken som "," "." ";" osv. I slutändan kommer POS-taggaren att berätta för dig om en token är ett substantiv, ett verb, ett adjektiv, etc. Eftersom språkstrukturer skiljer sig radikalt från ett språk till ett annat måste bra POS-taggare anpassas till varje språk. Vissa språk är mycket svårare att analysera än andra.
Låt oss säga att du har följande mening:
John Doe is a Go developer at Google.
POS-taggaren kommer att returnera följande:
Dependency parsing inom Natural Language Processing (NLP) är en teknik för att analysera den grammatiska strukturen i en mening. Den hjälper till att förstå hur ord i en mening relaterar till varandra. Detta uppnås genom att identifiera beroenden mellan ord, dvs. hur ord är beroende av varandra för att ge mening.
Den grundläggande idén bakom dependency parsing är att konstruera ett dependensträd (eller en graf) där noderna representerar orden i en mening och kanterna representerar relationerna mellan dessa ord. Varje kant i dependensträdet är märkt med den typ av grammatisk relation som finns mellan de anslutna orden, t.ex. subjekt, objekt, modifierare osv. Roten i trädet är vanligtvis huvudverbet eller huvudsatsen som de andra orden relaterar till.
Datavetare som arbetar med naturlig språkbehandling är ofta intresserade av att utföra Part-Of-Speech-taggning i sin forskningsverksamhet. De behöver också ofta automatiskt analysera beroenden (sammansättningar, nominella subjekt, determinanter ...).
Dependency parsing är avgörande för olika NLP-uppgifter som maskinöversättning, informationsutvinning, frågesvar och sentimentanalys eftersom förståelse av den syntaktiska strukturen hos meningar kan förbättra noggrannheten och effektiviteten hos dessa applikationer avsevärt. Dependency parsing gör det möjligt för algoritmer att förstå innebörden av meningar mer exakt genom att förstå hur komponenterna i en mening (subjekt, predikat, objekt etc.) är sammankopplade.
NLP Cloud föreslår ett API för Part-Of-Speech-taggning och dependency-parsing som gör att du kan utföra denna operation direkt, baserat på spaCy och GiNZA. Part-Of-Speech tagging och dependency parsing är inte särskilt resurskrävande, så svarstiden (latency) när de utförs från NLP Cloud API är mycket låg. Du kan göra det på 15 olika språk.
För mer information, se vår dokumentation om Part-Of-Speech-taggning och dependency parsing här.