API de reconocimiento de entidades con nombre (NER), con IA generativa

¿Qué es el NER?

NER son las siglas en inglés de Reconocimiento de Entidades Nombradas. Es una subtarea que consiste en identificar y clasificar entidades con nombre en el texto en categorías predefinidas, como nombres de personas, organizaciones, lugares, expresiones de tiempo, cantidades, valores monetarios, porcentajes, etc.

Los modelos generativos como ChatGPT, GPT-3.5, GPT-4, LLaMA 3, Yi 34B, o Mixtral 8x7B, son muy buenos en la extracción de entidades.

La NER es crucial para muchas aplicaciones de PNL, como la respuesta a preguntas, el resumen de textos y la traducción automática, ya que proporciona información detallada sobre los elementos clave de un texto, lo que permite una comprensión y un procesamiento más profundos. Por ejemplo, saber que "París" se refiere a un lugar en un texto determinado puede influir significativamente en la interpretación de ese texto y en la respuesta generada por un sistema de PLN.

Supongamos que tiene la siguiente frase:

John Doe es desarrollador web en Google.

Le gustaría detectar automáticamente que "John Doe" es un nombre, "desarrollador web" es un cargo y "Google" es una empresa. Y esto es exactamente lo que va a hacer NER.

Anotación NER

Algunos casos de uso de la extracción de entidades

El mundo está lleno de datos no estructurados, especialmente la web. Poder extraer de ellos información estructurada puede dar acceso a mucha información valiosa. He aquí un par de ejemplos.

Ordenar las solicitudes de los clientes

Cuando se gestionan muchas solicitudes de clientes (asistencia, ventas, etc.), resulta muy útil aplicar NER para clasificar automáticamente las solicitudes entrantes. Por ejemplo, se puede extraer automáticamente el tipo de producto mencionado en la solicitud y enviarlo al servicio adecuado.

Extraer datos financieros

Extraer y consolidar datos financieros puede ser largo y tedioso. En este caso, NER puede aumentar tu productividad ayudándote a extraer los datos correctos en un segundo.



Preprocesamiento de currículos/solicitudes

Los servicios de RRHH a veces tienen dificultades para leer todas estas solicitudes. Puede ser interesante para ellos destacar automáticamente entidades interesantes como nombres de empresas, competencias,... para ahorrar tiempo.

Extraer Leads

Muchos clientes potenciales B2B pueden encontrarse en sitios web públicos o en folletos de empresas, pero extraerlos manualmente a veces puede ser un engorro. Gracias a NER puedes extraer automáticamente una persona, con su cargo, y la empresa, si existen.

API NER de NLP Cloud

NLP Cloud propone una API de extracción de entidades que permite realizar el Reconocimiento de Entidades Nombradas de forma inmediata, basándose en spaCy, Ginza, o modelos generativos de IA más avanzados equivalentes a GPT-4, GPT-3.5, o ChatGPT, como LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B, y más. Para la extracción avanzada de entidades en documentos específicos, le recomendamos que ajuste sus propios modelos generativos para NER en NLP Cloud.

Para más detalles, consulte nuestra documentación sobre la extracción de entidades aquí. Para un uso avanzado, consulte el punto final de la API de generación de texto aquí. Y prueba fácilmente la extracción de entidades en nuestro patio de recreo.

Probar NER localmente es una cosa, pero utilizarlo de forma fiable en producción es otra. Con NLP Cloud puede hacer ambas cosas.

Preguntas frecuentes

¿Qué es el reconocimiento de entidades con nombre (NER)?

El reconocimiento de entidades con nombre (NER) es una subtarea de la extracción de información que identifica y clasifica entidades con nombre en el texto en categorías predefinidas como nombres de personas, organizaciones, lugares, expresiones de tiempo, cantidades, valores monetarios, porcentajes, etc. Es una técnica fundamental del Procesamiento del Lenguaje Natural (PLN) que se utiliza para la recuperación de información, los sistemas de respuesta a preguntas y la extracción de conocimiento.

¿Cuáles son las categorías más utilizadas en las RNE?

Las categorías más comunes utilizadas en el reconocimiento de entidades con nombre (NER) son nombres de personas, organizaciones, lugares, fechas, horas, valores monetarios, porcentajes y cantidades. Estas categorías ayudan a identificar y clasificar elementos clave del texto para extraer y analizar información.

¿Cómo gestionan los modernos sistemas NER las ambigüedades lingüísticas y las estructuras complejas?

Los sistemas modernos de reconocimiento de entidades con nombre (NER) utilizan algoritmos avanzados de aprendizaje automático, en particular arquitecturas de aprendizaje profundo como las redes neuronales recurrentes (RNN) y los transformadores, para analizar el contexto y las relaciones semánticas dentro del texto, lo que les permite gestionar ambigüedades y estructuras lingüísticas complejas. Utilizan grandes cantidades de datos de entrenamiento anotados y modelos lingüísticos preentrenados para predecir con precisión entidades incluso en presencia de construcciones ambiguas o intrincadas.

¿Pueden los sistemas NER reconocer entidades nuevas o desconocidas?

Los sistemas NER (reconocimiento de entidades con nombre) reconocen principalmente las entidades para las que han sido entrenados, pero su capacidad para reconocer entidades nuevas o desconocidas depende de la generalidad de sus datos de entrenamiento y de la capacidad de adaptación de sus algoritmos. Algunos sistemas avanzados, especialmente los que emplean aprendizaje profundo y comprensión contextual, pueden inferir o generalizar para identificar entidades no vistas previamente aprendiendo del contexto en el que aparecen. ¡En NLP Cloud puede reconocer perfectamente entidades nuevas o desconocidas!

¿Qué idiomas admite su API de IA para la extracción de entidades?

Extracción de entidades en 100 idiomas

¿Con qué rapidez devuelve entidades la API de IA?

Depende del tamaño del texto y del modelo de IA que utilices. En general, el tiempo de respuesta es de un par de segundos.

¿Cómo evaluar la precisión de la NER?

Para evaluar la precisión de un sistema de reconocimiento de entidades con nombre (NER), se suele utilizar la precisión, la recuperación y la puntuación F1 basada en verdaderos positivos, falsos positivos y falsos negativos. Estas métricas comparan los resultados del sistema con un patrón de referencia o verdad básica anotada manualmente para determinar la eficacia del sistema a la hora de identificar y clasificar entidades con nombre.

¿Puedo probar gratuitamente su API NER?

Sí, como todos los modelos de NLP Cloud, el punto final de la API NER puede probarse de forma gratuita.

¿Cómo gestiona su API de IA la privacidad y seguridad de los datos durante el proceso de extracción de entidades?

NLP Cloud se centra en la privacidad de los datos por diseño: no registramos ni almacenamos el contenido de las solicitudes que realizas en nuestra API. NLP Cloud cumple tanto con la HIPAA como con el GDPR.