John Doe has been working for the Microsoft company in Seattle since 1999.
Substantiv-Blöcke sind ein zentrales Merkmal der natürlichen Sprachverarbeitung. Sie sind in der Linguistik als "Substantivphrasen" bekannt. Sie bestehen im Wesentlichen aus Substantiven und allen Wörtern, die von diesen Substantiven abhängen.
Ein Beispiel: Sie haben folgenden Satz:
John Doe has been working for the Microsoft company in Seattle since 1999.
Hier sind die Substantivbausteine dieses Satzes:
Datenwissenschaftler, die sich mit der Verarbeitung natürlicher Sprache befassen, sind im Rahmen ihrer Forschungstätigkeit häufig an der Extraktion von Substantivbausteinen interessiert. Außerdem müssen sie oft automatisch zusätzliche Informationen wie Stammtext, Stammabhängigkeit und Stammkopftext extrahieren.
Noun Chunks können auch in realen Geschäftssituationen verwendet werden, meist als Teil einer größeren Pipeline zur Verarbeitung natürlicher Sprache. Einige Unternehmen verwenden beispielsweise Noun Chunks, um relevante Keywords aus Artikeln als Teil einer SEO-Pipeline zu extrahieren.
NLP Cloud bietet eine Substantiv-Chunk-API, mit der Sie diese Operationen auf der Grundlage von spaCy und Ginza sofort durchführen können. Die Extraktion von Substantiven ist nicht sehr ressourcenintensiv, so dass die Reaktionszeit (Latenz) bei der Ausführung über die NLP Cloud API sehr gering ist. Sie können dies in 15 verschiedenen Sprachen tun.
Weitere Einzelheiten finden Sie in unserer Dokumentation über die Extraktion von Substantiv-Blöcken hier.