John Doe has been working for the Microsoft company in Seattle since 1999.
Substantivklumper er en kernefunktion i Natural Language Processing. De er kendt som "substantivfraser" inden for lingvistik. Grundlæggende er de substantiver og alle de ord, der afhænger af disse substantiver.
Lad os for eksempel sige, at du har følgende sætning:
John Doe has been working for the Microsoft company in Seattle since 1999.
Her er navneordene fra denne sætning:
Dataforskere, der arbejder med naturlig sprogbehandling, er ofte interesserede i at udtrække substantivklumper i deres forskningsaktiviteter. De har også ofte brug for automatisk at udtrække yderligere information som rodtekst, rodafhængighed og rodhovedtekst.
Noun chunks kan også bruges i virkelige forretningssituationer, for det meste som en større pipeline til behandling af naturligt sprog. Nogle virksomheder bruger for eksempel noun chunks til at udtrække relevante søgeord fra artikler som en del af en SEO-pipeline.
NLP Cloud foreslår en noun chunk API, der giver dig mulighed for at udføre disse operationer out of the box, baseret på spaCy og Ginza. Noun chunk extraction er ikke særlig ressourcekrævende, så svartiden (latency), når du udfører dem fra NLP Cloud API, er meget lav. Du kan gøre det på 15 forskellige sprog.
For flere detaljer, se vores dokumentation om udtrækning af substantivklumper her.