John Doe has been working for the Microsoft company in Seattle since 1999.
Substantivklumpar är en central funktion i naturlig språkbehandling. De är kända som "substantivfraser" inom lingvistiken. I grund och botten är de substantiv och alla ord som är beroende av dessa substantiv.
Låt oss till exempel säga att du har följande mening:
John Doe has been working for the Microsoft company in Seattle since 1999.
Här är substantivbitarna från denna mening:
Datavetare som arbetar med naturlig språkbehandling är ofta intresserade av att utföra extraktion av substantivbitar i sina forskningsaktiviteter. De behöver också ofta automatiskt extrahera ytterligare information som rottext, rotberoende och rothuvudtext.
Noun chunks kan också användas i verkliga affärssituationer, oftast som en större pipeline för bearbetning av naturligt språk. Vissa företag använder t.ex. substantivbitar för att extrahera relevanta nyckelord från artiklar som en del av en SEO-pipeline.
NLP Cloud föreslår ett API för substantivbitar som gör att du kan utföra dessa operationer direkt, baserat på spaCy och Ginza. Extraktion av substantivklumpar är inte särskilt resurskrävande, så svarstiden (latensen) när du utför dem från NLP Cloud API är mycket låg. Du kan göra det på 15 olika språk.
För mer information, se vår dokumentation om extrahering av substantivbitar här.