Имате проблеми с ИИ или разработката на пълен пакет? Нашите експерти са тук, за да ви напътстват: индивидуални съвети, техническа интеграция и др. Свържете се с [email protected].

API за разпознаване на именувани същности (NER), с генеративен AI

Какво е NER?

NER е съкращение за разпознаване на назовани единици. Това е подзадача, която включва идентифициране и класифициране на назовани същности в текст в предварително определени категории, като имена на лица, организации, местоположения, изрази за време, количества, парични стойности, проценти и др.

Генеративните модели, като GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B или Mixtral 8x7B, са много добри в извличането на същности.

NER е от решаващо значение за много приложения на НЛП, като например отговаряне на въпроси, обобщаване на текст и машинен превод, тъй като предоставя подробна информация за ключовите елементи на текста, което позволява по-задълбочено разбиране и обработка. Например знанието, че "Париж" се отнася за място в даден текст, може да повлияе значително на тълкуването на този текст и на отговора, генериран от система за NLP.

Да речем, че имате следното изречение:

Джон Доу е уеб разработчик в Google.

Искате автоматично да разпознаете, че "John Doe" е име, "web developer" е длъжност, а "Google" е компания. Точно това ще направи NER.

Анотация на NER

Някои случаи на употреба на извличане на обекти

Светът е пълен с неструктурирани данни, особено в интернет. Възможността за извличане на структурирана информация от тях може да даде достъп до много ценна информация. Ето няколко примера.

Сортиране на заявки на клиенти

Когато се работи с много заявки от клиенти (поддръжка, продажби, ...), определено е полезно да се прилага NER, за да се сортират автоматично тези входящи заявки. Например можете автоматично да извлечете вида на продукта, споменат в заявката, и съответно да го насочите към правилната служба.

Извличане на финансови данни

Извличането и консолидирането на финансови данни може да бъде продължително и досадно. NER определено може да повиши производителността ви тук, като ви помогне да извлечете правилните данни за секунда.



Предварителна обработка на автобиографии/заявления

Службите за човешки ресурси понякога се затрудняват да разчитат всички тези заявления. За тях може да бъде интересно автоматично да подчертават интересни елементи като имена на компании, умения..., за да спестят време.

Извличане на водачи

Много B2B потенциални клиенти могат да бъдат намерени в публични уебсайтове или фирмени брошури, но ръчното им извличане понякога може да бъде мъчително. Благодарение на NER можете автоматично да извлечете лице, заедно с неговото длъжностно наименование и компания, ако те съществуват.

API за NER на NLP Cloud

NLP Cloud предлага API за извличане на същности, който позволява да се извършва разпознаване на назовани същности в готов вид въз основа на spaCy, Ginza или по-усъвършенствани генеративни модели на ИИ, еквивалентни на GPT-5 или GPT-4, като GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B и др. За усъвършенствано извличане на същности върху конкретни документи препоръчваме да настроите фино собствените си генеративни модели за NER в NLP Cloud.

За повече подробности вижте нашата документация за извличане на обекти тук. За разширена употреба вижте крайната точка на API за генериране на текст тук. И лесно тестване на извличането на обекти на нашата детска площадка.

Тестването на NER на местно ниво е едно, но надеждното му използване в производството е друго нещо. С NLP Cloud можете да направите и двете!

Често задавани въпроси

Какво е разпознаване на назовани единици (NER)?

Разпознаването на назовани същности (NER) е подзадача на извличането на информация, която идентифицира и класифицира назовани същности в текст в предварително определени категории, като имена на лица, организации, местоположения, изрази за време, количества, парични стойности, проценти и др. Това е основна техника за обработка на естествен език (NLP), използвана за извличане на информация, системи за отговаряне на въпроси и извличане на знания.

Кои са общите категории, използвани в NER?

Общите категории, използвани при разпознаването на именувани обекти (NER), включват имена на лица, организации, местоположения, дати, времена, парични стойности, проценти и количества. Тези категории помагат за идентифициране и класифициране на ключови елементи в текста за извличане и анализ на информация.

Как съвременните системи за НЕР се справят с двусмислиците на езика и сложните структури?

Съвременните системи за разпознаване на именувани същности (NER) използват усъвършенствани алгоритми за машинно обучение, по-специално архитектури за дълбоко обучение, като рекурентни невронни мрежи (RNN) и трансформатори, за да анализират контекста и семантичните връзки в текста, което им позволява да се справят с двусмислици и сложни езикови структури. Те използват огромни количества анотирани данни за обучение и предварително обучени езикови модели, за да предсказват точно същности дори при наличие на двусмислени или сложни конструкции.

Могат ли системите NER да разпознават нови или непознати обекти?

Системите за разпознаване на именувани същности (NER) разпознават предимно същности, за които са били обучени, но способността им да разпознават нови или непознати същности зависи от общия характер на данните за обучение и адаптивността на алгоритмите им. Някои усъвършенствани системи, особено тези, които използват дълбоко обучение и контекстуално разбиране, могат да правят изводи или да обобщават, за да разпознават непознати преди това същности, като се учат от контекста, в който те се появяват. В NLP Cloud можете перфектно да разпознавате нови или непознати същности!

Какви езици поддържа вашият AI API за извличане на обекти?

Поддържаме извличане на същности на 100 езика

Колко бързо AI API връща обекти?

Това зависи от размера на текста и модела на изкуствения интелект, който използвате. Като цяло времето за реакция е около няколко секунди.

Как да оценим точността на NER?

За да се оцени точността на система за разпознаване на назовани същности (NER), обикновено се използват прецизност, отзоваване и резултат F1, основаващ се на истински положителни, фалшиво положителни и фалшиво отрицателни резултати. Тези показатели сравняват резултатите на системата с ръчно анотиран златен стандарт или основна истина, за да се определи колко добре системата идентифицира и класифицира именувани същности.

Мога ли да изпробвам безплатно вашия NER API?

Да, както всички модели в NLP Cloud, крайната точка на NER API може да се тества безплатно.

Как вашият AI API се справя с поверителността и сигурността на данните по време на процеса на извличане на обекти?

NLP Cloud се фокусира върху поверителността на данните по дизайн: ние не записваме и не съхраняваме съдържанието на заявките, които правите в нашия API. NLP Cloud е в съответствие с HIPAA и GDPR.