John Doe é um programador Web na Google.
NER significa Named Entity Recognition (reconhecimento de entidades nomeadas). É uma subtarefa que envolve a identificação e classificação de entidades nomeadas no texto em categorias predefinidas, tais como nomes de pessoas, organizações, localizações, expressões de tempos, quantidades, valores monetários, percentagens, etc.
Os modelos generativos como o GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B, ou Mixtral 8x7B, são muito bons na extração de entidades.
O NER é crucial para muitas aplicações de PLN, como a resposta a perguntas, a sumarização de textos e a tradução automática, uma vez que fornece informações pormenorizadas sobre os elementos-chave de um texto, permitindo uma compreensão e um processamento mais profundos. Por exemplo, saber que "Paris" se refere a um local num determinado texto pode influenciar significativamente a interpretação desse texto e a resposta gerada por um sistema de PLN.
Digamos que tem a seguinte frase:
John Doe é um programador Web na Google.
O utilizador gostaria de detetar automaticamente que "John Doe" é um nome, "web developer" é um cargo e "Google" é uma empresa. E é exatamente isso que o NER vai fazer.

O mundo está cheio de dados não estruturados, especialmente a Web. Ser capaz de extrair informações estruturadas desses dados pode dar acesso a muitas informações valiosas. Eis alguns exemplos.
Quando se lida com muitos pedidos de clientes (apoio, vendas, ...) é definitivamente útil aplicar NER para ordenar automaticamente estes pedidos recebidos. Por exemplo, pode extrair automaticamente o tipo de produto mencionado no pedido e encaminhá-lo para o serviço correto em conformidade.
A extração e consolidação de dados financeiros pode ser longa e entediante. O NER pode definitivamente aumentar a sua produtividade neste domínio, ajudando-o a extrair os dados certos num segundo.
Os serviços de RH têm por vezes dificuldade em ler todas estas candidaturas. Pode ser interessante para eles destacar automaticamente entidades interessantes, como nomes de empresas, competências, etc., de modo a poupar tempo.
Muitos contactos B2B podem ser encontrados em sítios Web públicos ou em brochuras de empresas, mas extraí-los manualmente pode, por vezes, ser difícil. Graças ao NER, é possível extrair automaticamente uma pessoa, com o seu cargo e empresa, se existirem.
O NLP Cloud propõe uma API de extração de entidades que permite efetuar o Reconhecimento de Entidades Nomeadas de imediato, com base no spaCy, Ginza ou em modelos de IA generativos mais avançados equivalentes ao GPT-5 ou GPT-4, como o GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B e outros. Para extração avançada de entidades em documentos específicos, recomendamos que afine os seus próprios modelos generativos para NER no NLP Cloud.
Para mais informações, consulte a nossa documentação sobre extração de entidades aqui. Para uma utilização avançada, consulte o ponto de extremidade da API de geração de texto aqui. E testar facilmente a extração de entidades no nosso parque infantil.
Testar o NER localmente é uma coisa, mas utilizá-lo de forma fiável na produção é outra coisa. Com o NLP Cloud, pode fazer as duas coisas!