Está a ter dificuldades com a IA ou com o desenvolvimento full-stack? Os nossos especialistas estão aqui para o orientar: aconselhamento personalizado, integração técnica e muito mais. Entre em contacto com [email protected].

API de reconhecimento de entidades nomeadas (NER), com IA generativa

O que é o NER?

NER significa Named Entity Recognition (reconhecimento de entidades nomeadas). É uma subtarefa que envolve a identificação e classificação de entidades nomeadas no texto em categorias predefinidas, tais como nomes de pessoas, organizações, localizações, expressões de tempos, quantidades, valores monetários, percentagens, etc.

Os modelos generativos como o GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B, ou Mixtral 8x7B, são muito bons na extração de entidades.

O NER é crucial para muitas aplicações de PLN, como a resposta a perguntas, a sumarização de textos e a tradução automática, uma vez que fornece informações pormenorizadas sobre os elementos-chave de um texto, permitindo uma compreensão e um processamento mais profundos. Por exemplo, saber que "Paris" se refere a um local num determinado texto pode influenciar significativamente a interpretação desse texto e a resposta gerada por um sistema de PLN.

Digamos que tem a seguinte frase:

John Doe é um programador Web na Google.

O utilizador gostaria de detetar automaticamente que "John Doe" é um nome, "web developer" é um cargo e "Google" é uma empresa. E é exatamente isso que o NER vai fazer.

Anotação NER

Alguns casos de utilização de extração de entidades

O mundo está cheio de dados não estruturados, especialmente a Web. Ser capaz de extrair informações estruturadas desses dados pode dar acesso a muitas informações valiosas. Eis alguns exemplos.

Ordenar pedidos de clientes

Quando se lida com muitos pedidos de clientes (apoio, vendas, ...) é definitivamente útil aplicar NER para ordenar automaticamente estes pedidos recebidos. Por exemplo, pode extrair automaticamente o tipo de produto mencionado no pedido e encaminhá-lo para o serviço correto em conformidade.

Extrair dados financeiros

A extração e consolidação de dados financeiros pode ser longa e entediante. O NER pode definitivamente aumentar a sua produtividade neste domínio, ajudando-o a extrair os dados certos num segundo.



Pré-processar currículos/candidaturas

Os serviços de RH têm por vezes dificuldade em ler todas estas candidaturas. Pode ser interessante para eles destacar automaticamente entidades interessantes, como nomes de empresas, competências, etc., de modo a poupar tempo.

Extrair contactos

Muitos contactos B2B podem ser encontrados em sítios Web públicos ou em brochuras de empresas, mas extraí-los manualmente pode, por vezes, ser difícil. Graças ao NER, é possível extrair automaticamente uma pessoa, com o seu cargo e empresa, se existirem.

API NER da NLP Cloud

O NLP Cloud propõe uma API de extração de entidades que permite efetuar o Reconhecimento de Entidades Nomeadas de imediato, com base no spaCy, Ginza ou em modelos de IA generativos mais avançados equivalentes ao GPT-5 ou GPT-4, como o GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B e outros. Para extração avançada de entidades em documentos específicos, recomendamos que afine os seus próprios modelos generativos para NER no NLP Cloud.

Para mais informações, consulte a nossa documentação sobre extração de entidades aqui. Para uma utilização avançada, consulte o ponto de extremidade da API de geração de texto aqui. E testar facilmente a extração de entidades no nosso parque infantil.

Testar o NER localmente é uma coisa, mas utilizá-lo de forma fiável na produção é outra coisa. Com o NLP Cloud, pode fazer as duas coisas!

Perguntas mais frequentes

O que é o Reconhecimento de Entidades Nomeadas (NER)?

O reconhecimento de entidades nomeadas (NER) é uma subtarefa da extração de informação que identifica e classifica entidades nomeadas no texto em categorias predefinidas, tais como nomes de pessoas, organizações, localizações, expressões de tempos, quantidades, valores monetários, percentagens, etc. É uma técnica fundamental do Processamento de Linguagem Natural (PLN) utilizada para a recuperação de informações, sistemas de resposta a perguntas e extração de conhecimentos.

Quais são as categorias comuns utilizadas no NER?

As categorias comuns utilizadas no reconhecimento de entidades nomeadas (NER) incluem nomes de pessoas, organizações, localizações, datas, horas, valores monetários, percentagens e quantidades. Estas categorias ajudam a identificar e classificar elementos-chave no texto para extração e análise de informação.

Como é que os sistemas NER modernos lidam com as ambiguidades linguísticas e as estruturas complexas?

Os sistemas modernos de reconhecimento de entidades nomeadas (NER) utilizam algoritmos avançados de aprendizagem automática, nomeadamente arquitecturas de aprendizagem profunda, como redes neuronais recorrentes (RNN) e transformadores, para analisar o contexto e as relações semânticas no texto, permitindo-lhes gerir ambiguidades e estruturas linguísticas complexas. Utilizam grandes quantidades de dados de formação anotados e modelos linguísticos pré-treinados para prever com precisão as entidades, mesmo na presença de construções ambíguas ou complexas.

Os sistemas NER podem reconhecer entidades novas ou desconhecidas?

Os sistemas NER (Reconhecimento de Entidades Nomeadas) reconhecem principalmente entidades para as quais foram treinados, mas a sua capacidade de reconhecer entidades novas ou desconhecidas depende da generalidade dos seus dados de treino e da adaptabilidade dos seus algoritmos. Alguns sistemas avançados, especialmente os que empregam aprendizagem profunda e compreensão contextual, podem inferir ou generalizar para identificar entidades não vistas anteriormente, aprendendo com o contexto em que elas aparecem. No NLP Cloud, pode reconhecer perfeitamente entidades novas ou desconhecidas!

Que línguas suporta a sua API de IA para extração de entidades?

Suportamos a extração de entidades em 100 línguas

Com que rapidez é que a API de IA devolve entidades?

Depende do tamanho do seu texto e do modelo de IA que está a utilizar. Em geral, o tempo de resposta é de cerca de dois segundos.

Como avaliar a exatidão do NER?

Para avaliar a exatidão de um sistema de Reconhecimento de Entidades Nomeadas (NER), utiliza-se normalmente a precisão, a recuperação e a pontuação F1 com base em verdadeiros positivos, falsos positivos e falsos negativos. Estas métricas comparam os resultados do sistema com um padrão de ouro anotado manualmente ou com a verdade fundamental para determinar a eficácia do sistema na identificação e classificação de entidades nomeadas.

Posso experimentar a vossa API NER gratuitamente?

Sim, tal como todos os modelos no NLP Cloud, o ponto de extremidade da API NER pode ser testado gratuitamente

Como é que a sua API de IA lida com a privacidade e a segurança dos dados durante o processo de extração de entidades?

O NLP Cloud está focado na privacidade dos dados desde a conceção: não registamos nem armazenamos o conteúdo dos pedidos que faz na nossa API. O NLP Cloud está em conformidade com a HIPAA e o GDPR.