John Doe es desarrollador web en Google.
NER son las siglas en inglés de Reconocimiento de Entidades Nombradas. Es una subtarea que consiste en identificar y clasificar entidades con nombre en el texto en categorías predefinidas, como nombres de personas, organizaciones, lugares, expresiones de tiempo, cantidades, valores monetarios, porcentajes, etc.
Los modelos generativos como ChatGPT, GPT-3.5, GPT-4, LLaMA 3, Yi 34B, o Mixtral 8x7B, son muy buenos en la extracción de entidades.
La NER es crucial para muchas aplicaciones de PNL, como la respuesta a preguntas, el resumen de textos y la traducción automática, ya que proporciona información detallada sobre los elementos clave de un texto, lo que permite una comprensión y un procesamiento más profundos. Por ejemplo, saber que "París" se refiere a un lugar en un texto determinado puede influir significativamente en la interpretación de ese texto y en la respuesta generada por un sistema de PLN.
Supongamos que tiene la siguiente frase:
John Doe es desarrollador web en Google.
Le gustaría detectar automáticamente que "John Doe" es un nombre, "desarrollador web" es un cargo y "Google" es una empresa. Y esto es exactamente lo que va a hacer NER.
El mundo está lleno de datos no estructurados, especialmente la web. Poder extraer de ellos información estructurada puede dar acceso a mucha información valiosa. He aquí un par de ejemplos.
Cuando se gestionan muchas solicitudes de clientes (asistencia, ventas, etc.), resulta muy útil aplicar NER para clasificar automáticamente las solicitudes entrantes. Por ejemplo, se puede extraer automáticamente el tipo de producto mencionado en la solicitud y enviarlo al servicio adecuado.
Extraer y consolidar datos financieros puede ser largo y tedioso. En este caso, NER puede aumentar tu productividad ayudándote a extraer los datos correctos en un segundo.
Los servicios de RRHH a veces tienen dificultades para leer todas estas solicitudes. Puede ser interesante para ellos destacar automáticamente entidades interesantes como nombres de empresas, competencias,... para ahorrar tiempo.
Muchos clientes potenciales B2B pueden encontrarse en sitios web públicos o en folletos de empresas, pero extraerlos manualmente a veces puede ser un engorro. Gracias a NER puedes extraer automáticamente una persona, con su cargo, y la empresa, si existen.
NLP Cloud propone una API de extracción de entidades que permite realizar el Reconocimiento de Entidades Nombradas de forma inmediata, basándose en spaCy, Ginza, o modelos generativos de IA más avanzados equivalentes a GPT-4, GPT-3.5, o ChatGPT, como LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B, y más. Para la extracción avanzada de entidades en documentos específicos, le recomendamos que ajuste sus propios modelos generativos para NER en NLP Cloud.
Para más detalles, consulte nuestra documentación sobre la extracción de entidades aquí. Para un uso avanzado, consulte el punto final de la API de generación de texto aquí. Y prueba fácilmente la extracción de entidades en nuestro patio de recreo.
Probar NER localmente es una cosa, pero utilizarlo de forma fiable en producción es otra. Con NLP Cloud puede hacer ambas cosas.