John Doe has been working for the Microsoft company in Seattle since 1999.
Os noun chunks são uma caraterística essencial do processamento de linguagem natural. São conhecidos como "frases nominais" em linguística. Basicamente, são substantivos e todas as palavras que dependem desses substantivos.
Por exemplo, digamos que tem a seguinte frase:
John Doe has been working for the Microsoft company in Seattle since 1999.
Aqui estão os pedaços de substantivos desta frase:
Os cientistas de dados que trabalham no processamento de linguagem natural estão frequentemente interessados em efetuar a extração de noun chunks nas suas actividades de investigação. Também é frequente precisarem de extrair automaticamente informações adicionais, como texto de raiz, dependência de raiz e texto de cabeça de raiz.
Os noun chunks também podem ser utilizados em situações comerciais reais, na maior parte das vezes como um pipeline de processamento de linguagem natural mais vasto. Por exemplo, algumas empresas utilizam noun chunks para extrair palavras-chave relevantes de artigos como parte de um pipeline de SEO.
O NLP Cloud propõe uma API de noun chunk que lhe permite efetuar estas operações de imediato, com base no spaCy e no Ginza. A extração de noun chunk não é muito intensiva em termos de recursos, pelo que o tempo de resposta (latência), ao realizá-la a partir da API NLP Cloud, é muito baixo. Pode fazê-lo em 15 línguas diferentes.
Para mais informações, consulte a nossa documentação sobre a extração de pedaços de substantivos aqui.