Nepažįstamasis John Doe yra "Google" žiniatinklio programuotojas.
NER reiškia įvardytų subjektų atpažinimą. Tai dalinis uždavinys, apimantis įvardytų esybių tekste identifikavimą ir klasifikavimą į iš anksto nustatytas kategorijas, pavyzdžiui, asmenų, organizacijų, vietovių pavadinimus, laiko išraiškas, kiekius, pinigines vertes, procentus ir pan.
Generatyviniai modeliai, tokie kaip GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B arba Mixtral 8x7B, labai gerai atlieka esybių išskyrimą.
NER yra labai svarbus daugeliui NLP programų, pavyzdžiui, atsakant į klausimus, apibendrinant tekstą ir atliekant mašininį vertimą, nes jis suteikia išsamios informacijos apie pagrindinius teksto elementus, todėl jį galima geriau suprasti ir apdoroti. Pavyzdžiui, žinojimas, kad žodis "Paryžius" tam tikrame tekste reiškia vietovę, gali turėti didelės įtakos to teksto interpretacijai ir NLP sistemos generuojamam atsakymui.
Tarkime, turite tokį sakinį:
Nepažįstamasis John Doe yra "Google" žiniatinklio programuotojas.
Norėtumėte automatiškai nustatyti, kad "John Doe" yra vardas, "web developer" - pareigos, o "Google" - įmonė. Būtent tai ir padarys NER.

Pasaulyje, ypač internete, gausu nestruktūrizuotų duomenų. Gebėjimas iš jų išgauti struktūrizuotą informaciją gali suteikti prieigą prie daug vertingos informacijos. Štai keletas pavyzdžių.
Kai tvarkoma daug klientų užklausų (palaikymo, pardavimo, ...), neabejotinai naudinga taikyti NER, kad būtų galima automatiškai rūšiuoti gaunamas užklausas. Pavyzdžiui, galite automatiškai išskirti užklausoje nurodyto produkto tipą ir atitinkamai nukreipti jį į reikiamą tarnybą.
Finansinių duomenų išgavimas ir konsolidavimas gali būti ilgas ir varginantis. NER gali neabejotinai padidinti jūsų produktyvumą, nes padės per sekundę išgauti reikiamus duomenis.
Žmogiškųjų išteklių tarnyboms kartais sunku perskaityti visas šias paraiškas. Joms gali būti įdomu automatiškai išskirti įdomius dalykus, pavyzdžiui, įmonių pavadinimus, įgūdžius ir t. t., kad sutaupytų laiko.
Daug B2B potencialių klientų galima rasti viešosiose svetainėse arba įmonių brošiūrose, tačiau kartais juos išgauti rankiniu būdu gali būti varginantis darbas. Naudodami NER galite automatiškai išskirti asmenį, jo pareigų pavadinimą ir įmonę, jei jie egzistuoja.
"NLP Cloud" siūlo esybių išskyrimo API, kuri leidžia atlikti įvardytų esybių atpažinimą iškart, remiantis spaCy, Ginza arba pažangesniais generatyviniais AI modeliais, lygiaverčiais GPT-5 arba GPT-4, tokiais kaip GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B ir kt. Norint atlikti pažangų esybių išskyrimą iš konkrečių dokumentų, rekomenduojame tikslinti savo generatyvinius modelius, skirtus NER NLP debesyje.
Daugiau informacijos rasite mūsų dokumentuose apie esybių išskyrimą čia. Dėl išplėstinio naudojimo žr. teksto generavimo API galinį tašką čia. Ir lengvai išbandykite esybių išskyrimą mūsų žaidimų aikštelėje.
Vienas dalykas yra vietinis NER testavimas, kitas - patikimas naudojimas gamyboje. Naudodami NLP Cloud galite atlikti abu šiuos veiksmus!