Võitlevad tehisintellekti või täieliku arendusega? Meie eksperdid on siin, et teid juhendada: kohandatud nõuanded, tehniline integratsioon ja palju muud. Võtke ühendust aadressil [email protected].

Nimetuste äratundmine (NER) API, koos genereeriva tehisintellektiga

Mis on NER?

NER tähistab Named Entity Recognition (nimetud üksuste tuvastamine). See on alamülesanne, mis hõlmab tekstis esinevate nimeliste üksuste tuvastamist ja klassifitseerimist eelnevalt määratletud kategooriatesse, näiteks isikute, organisatsioonide, asukohtade, aja-, koguste-, raha- ja protsentarvete jne nimedesse.

Generatiivsed mudelid, nagu GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B või Mixtral 8x7B, on väga head üksuste väljavõtete tegemisel.

NER on oluline paljude NLP rakenduste jaoks, nagu küsimustele vastamine, teksti kokkuvõtete tegemine ja masintõlge, kuna see annab üksikasjalikku teavet teksti põhielementide kohta, mis võimaldab teksti sügavamat mõistmist ja töötlemist. Näiteks võib teadmine, et "Pariis" viitab teatavas tekstis mingile kohale, mõjutada oluliselt selle teksti tõlgendamist ja NLP-süsteemi poolt genereeritud vastust.

Oletame, et teil on järgmine lause:

John Doe on Google'i veebiarendaja.

Soovite automaatselt tuvastada, et "John Doe" on nimi, "veebiarendaja" on ametinimetus ja "Google" on ettevõte. Ja just seda teebki NER.

NER märkus

Mõned entiteetide väljavõtte kasutusjuhtumid

Maailm on täis struktureerimata andmeid, eriti veebis. Kui sellest on võimalik struktureeritud teavet eraldada, võib see anda juurdepääsu paljudele väärtuslikele andmetele. Siin on mõned näited.

Sorteerige kliendi taotlusi

Paljude kliendipäringutega (tugi, müük, ...) tegelemisel on kindlasti abiks NER-i kasutamine, et neid sissetulevaid päringuid automaatselt sorteerida. Näiteks võiksite automaatselt eraldada taotluses mainitud toote tüübi ja suunata selle vastavalt õigesse teenistusse.

Finantsandmete väljavõte

Finantsandmete väljavõtete koostamine ja konsolideerimine võib olla pikk ja tüütu. NER võib siin kindlasti suurendada teie tootlikkust, aidates teil sekundiga õiged andmed välja võtta.



Eeltöötlus elulookirjeldused/taotlused

Personaliteenistustel on mõnikord raske kõiki neid taotlusi lugeda. Nende jaoks võib olla huvitav automaatselt esile tõsta huvipakkuvaid üksusi, nagu ettevõtte nimed, oskused, ..., et säästa aega.

Väljavõte juhib

Paljud B2B-liididud on leitavad avalikelt veebilehtedelt või ettevõtte brošüüridest, kuid nende käsitsi väljavõtmine võib mõnikord olla vaevaline. Tänu NERile saate automaatselt eraldada isiku koos tema ametinimetuse ja ettevõttega, kui need on olemas.

NLP Cloudi NER API

NLP Cloud pakub üksuste väljavõtte API-d, mis võimaldab käivitada nimisõnaliste üksuste tuvastamist, mis põhineb spaCy, Ginza või täiustatud genereerivatel AI-mudelitel, mis on samaväärsed GPT-5 või GPT-4, nagu GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B ja muud. Konkreetsete dokumentide edasijõudnud olemuse väljavõtte tegemiseks soovitame, et peenhäälestada oma genereerivaid mudeleid NER-i jaoks NLP Cloudis.

Lisateavet leiate meie dokumentatsioonist üksuse väljavõtte kohta siin. Täiustatud kasutamise kohta vt teksti genereerimise API lõpp-punkti siin. Ja kergesti testida üksuse ekstraheerimist meie mänguväljakul.

NERi kohalik testimine on üks asi, kuid selle usaldusväärne kasutamine tootmises on teine asi. NLP Cloudi abil saate teha mõlemat!

Korduma kippuvad küsimused

Mis on nimetuste tuvastamine (NER)?

Nimede tuvastamine (Named Entity Recognition, NER) on teabe väljavõtte alamülesanne, mis tuvastab ja klassifitseerib tekstis olevaid nimesid, näiteks isikute, organisatsioonide, asukohtade, aja-, koguste, rahaliste väärtuste, protsentide jne. kategooriatesse. See on põhiline loomuliku keeletöötluse (NLP) tehnika, mida kasutatakse teabe otsimisel, küsimustele vastamise süsteemides ja teadmiste ekstraheerimisel.

Millised on tavalised kategooriad, mida kasutatakse NERis?

Nimetuste äratundmisel (NER) kasutatavad üldkategooriad hõlmavad isikute nimesid, organisatsioone, asukohti, kuupäevi, kellaaegu, rahalisi väärtusi, protsente ja koguseid. Need kategooriad aitavad tuvastada ja klassifitseerida teksti põhielemente teabe väljavõtte ja analüüsi jaoks.

Kuidas saavad kaasaegsed NER-süsteemid hakkama keele mitmetähenduslikkusega ja keeruliste struktuuridega?

Kaasaegsed nimetuste tuvastamise süsteemid kasutavad arenenud masinõppe algoritme, eelkõige süvaõppe arhitektuure, nagu rekursiivsed neuronivõrgud (RNN) ja transformaatorid, et analüüsida konteksti ja semantilisi seoseid tekstis, mis võimaldab neil hallata mitmetähenduslikkust ja keerulisi keelelisi struktuure. Nad kasutavad tohutuid annoteeritud koolitusandmeid ja eelnevalt treenitud keelemudeleid, et ennustada täpselt üksusi isegi mitmetähenduslikes või keerulistes konstruktsioonides.

Kas NER-süsteemid suudavad ära tunda uusi või tundmatuid üksusi?

NER-süsteemid (Named Entity Recognition) tuvastavad peamiselt üksusi, mille põhjal nad on välja õpetatud, kuid nende võime tuvastada uusi või tundmatuid üksusi sõltub nende treeningandmete üldisusest ja nende algoritmide kohandatavusest. Mõned täiustatud süsteemid, eriti need, mis kasutavad süvaõpet ja kontekstuaalset mõistmist, suudavad järeldada või üldistada, et tuvastada varem tundmatuid üksusi, õppides kontekstist, milles need esinevad. NLP Cloudil saab suurepäraselt ära tunda uusi või tundmatuid üksusi!

Milliseid keeli toetab teie AI API üksuste väljavõtete tegemiseks?

Toetame üksuste väljavõtteid 100 keeles

Kui kiiresti tagastab AI API üksused?

See sõltub teie teksti suurusest ja kasutatavast tehisintellekti mudelist. Üldiselt on reageerimisaeg umbes paar sekundit.

Kuidas hinnata NER-i täpsust?

Nimetaolise olemuse tuvastamise süsteemi (NER) täpsuse hindamiseks kasutatakse tavaliselt täpsust, tagasikutsumist ja F1-skoori, mis põhineb tõepositiivsetel, valepositiivsetel ja valenegatiivsetel tulemustel. Nende näitajatega võrreldakse süsteemi väljundit käsitsi kommenteeritud kuldstandardi või põhitõega, et määrata kindlaks, kui hästi süsteem tuvastab ja klassifitseerib nimetatud üksusi.

Kas ma võin teie NER API-d tasuta proovida?

Jah, nagu kõiki NLP Cloudi mudeleid, saab ka NER API lõpp-punkti testida tasuta.

Kuidas teie tehisintellekti API käsitleb andmete privaatsust ja turvalisust üksuste väljavõtteprotsessi ajal?

NLP Cloud keskendub andmete privaatsusele: me ei logi ega salvesta meie API-le tehtud päringute sisu. NLP Cloud on nii HIPAA kui ka GDPR-i nõuetele vastav.