John Doe has been working for the Microsoft company in Seattle since 1999.
名詞チャンクは自然言語処理の核となる機能である。言語学では「名詞句」と呼ばれる。基本的には、名詞とその名詞に依存するすべての単語を指します。
例えば、次のような文章があったとしよう:
John Doe has been working for the Microsoft company in Seattle since 1999.
以下はこの文の名詞のかたまりである:
自然言語処理に携わるデータサイエンティストは、研究活動において名詞チャンク抽出に関心を持つことが多い。また、ルートテキスト、ルート依存関係、ルートヘッドテキストなどの追加情報を自動的に抽出する必要があることもよくあります。
名詞チャンクは実際のビジネスシーンでも使用でき、ほとんどの場合、より大規模な自然言語処理パイプラインとして使用される。たとえば、SEOパイプラインの一部として、記事から関連キーワードを抽出するために名詞チャンクを使用する企業もあります。
NLPクラウドは、spaCyとGinzaに基づいて、これらの操作をすぐに実行できる名詞チャンクAPIを提案します。名詞チャンク抽出はあまりリソースを消費しないため、NLPクラウドAPIから実行する場合の応答時間(レイテンシ)は非常に低くなります。15種類の言語で実行できます。
詳細については、名詞チャンクの抽出に関するドキュメントを参照してください。 これ.