Джон Доу - веб-разработчик в компании Google.
NER расшифровывается как Named Entity Recognition (распознавание именованных сущностей). Это подзадача, которая включает в себя идентификацию и классификацию именованных сущностей в тексте по заранее определенным категориям, таким как имена людей, организаций, местоположения, выражения времени, количества, денежные значения, проценты и т. д.
Генеративные модели, такие как GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B или Mixtral 8x7B, очень хорошо справляются с извлечением сущностей.
NER очень важен для многих приложений НЛП, таких как ответы на вопросы, резюмирование текста и машинный перевод, поскольку он предоставляет подробную информацию о ключевых элементах текста, позволяя глубже понять и обработать его. Например, знание того, что слово "Париж" относится к определенному месту в данном тексте, может существенно повлиять на интерпретацию этого текста и ответ, генерируемый системой НЛП.
Допустим, у вас есть следующее предложение:
Джон Доу - веб-разработчик в компании Google.
Вы хотите автоматически определить, что "Джон Доу" - это имя, "веб-разработчик" - это должность, а "Google" - это компания. Именно это и собирается сделать NER.

Мир полон неструктурированных данных, особенно в Интернете. Умение извлекать из них структурированную информацию может дать доступ к большому количеству ценных сведений. Вот несколько примеров.
При работе с большим количеством запросов клиентов (поддержка, продажи, ...) определенно помогает применение NER для автоматической сортировки входящих запросов. Например, вы можете автоматически извлекать тип продукта, указанный в запросе, и направлять его в нужную службу.
Извлечение и консолидация финансовых данных может быть долгим и утомительным занятием. NER может определенно повысить вашу производительность, помогая извлекать нужные данные за секунду.
HR-службам иногда бывает трудно читать все эти заявки. Для экономии времени им может быть интересно автоматически выделять интересные объекты, такие как названия компаний, навыки...
Многие B2B-ссылки можно найти на публичных веб-сайтах или в брошюрах компаний, но их извлечение вручную иногда может оказаться сложной задачей. Благодаря NER вы можете автоматически извлечь человека, его должность и компанию, если они существуют.
NLP Cloud предлагает API для извлечения сущностей, который позволяет выполнять распознавание именованных сущностей "из коробки" на основе spaCy, Ginza или более продвинутых генеративных моделей ИИ, эквивалентных GPT-5 или GPT-4, таких как GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B и других. Для расширенного извлечения сущностей из конкретных документов мы рекомендуем настраивать собственные генеративные модели для NER на NLP Cloud.
Для получения более подробной информации см. нашу документацию об извлечении сущностей здесь. Для расширенного использования см. конечную точку API генерации текста здесь. И легко протестировать извлечение сущностей на нашей игровой площадке.
Одно дело - тестировать NER локально, а другое - надежно использовать его в производстве. С NLP Cloud вы можете сделать и то, и другое!