Aveți probleme cu inteligența artificială sau cu dezvoltarea full-stack? Experții noștri sunt aici pentru a vă ghida: consiliere personalizată, integrare tehnică și multe altele. Contactați-ne la [email protected].

Recunoașterea entităților numite (NER) API, cu AI generativă

Ce este NER?

NER înseamnă Named Entity Recognition (recunoașterea entităților numite). Este o sarcină secundară care implică identificarea și clasificarea entităților numite din text în categorii predefinite, cum ar fi nume de persoane, organizații, locații, expresii de timp, cantități, valori monetare, procente etc.

Modelele generative precum GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B sau Mixtral 8x7B sunt foarte bune la extragerea entităților.

NER este esențială pentru multe aplicații NLP, cum ar fi răspunsul la întrebări, rezumatul textului și traducerea automată, deoarece oferă informații detaliate despre elementele cheie ale unui text, permițând o înțelegere și o prelucrare mai profundă. De exemplu, faptul de a ști că "Paris" se referă la o locație într-un anumit text poate influența în mod semnificativ interpretarea textului respectiv și răspunsul generat de un sistem NLP.

Să spunem că aveți următoarea propoziție:

John Doe este dezvoltator web la Google.

Doriți să detectați în mod automat că "John Doe" este un nume, "dezvoltator web" este o funcție, iar "Google" este o companie. Și exact acest lucru va face NER.

Adnotare NER

Câteva cazuri de utilizare a extracției entităților

Lumea este plină de date nestructurate, mai ales pe internet. Capacitatea de a extrage informații structurate din acestea poate oferi acces la o mulțime de informații valoroase. Iată câteva exemple.

Sortarea solicitărilor clienților

Atunci când aveți de-a face cu o mulțime de solicitări ale clienților (asistență, vânzări, ...), este cu siguranță util să aplicați NER pentru a sorta automat aceste solicitări primite. De exemplu, ați putea extrage automat tipul de produs menționat în cerere și să îl direcționați către serviciul corespunzător.

Extragerea datelor financiare

Extragerea și consolidarea datelor financiare pot fi lungi și anevoioase. NER vă poate crește cu siguranță productivitatea în acest caz, ajutându-vă să extrageți datele corecte într-o secundă.



Pre-procesarea CV-urilor/aplicațiilor

Serviciile de resurse umane au uneori dificultăți în a citi toate aceste cereri. Ar putea fi interesant pentru ei să evidențieze automat entități interesante, cum ar fi nume de companii, competențe,... pentru a economisi timp.

Extrage lead-uri

Multe lead-uri B2B pot fi găsite pe site-urile web publice sau în broșurile companiilor, dar extragerea manuală a acestora poate fi uneori dificilă. Datorită NER, puteți extrage automat o persoană, cu titlul postului și compania, dacă acestea există.

API-ul NER al NLP Cloud

NLP Cloud propune un API de extragere a entităților care permite efectuarea recunoașterii entităților numite din fabrică, pe baza modelelor spaCy, Ginza sau a modelelor AI generative mai avansate echivalente cu GPT-5 sau GPT-4, precum GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B și altele. Pentru extragerea avansată a entităților din documente specifice, vă recomandăm să vă puneți la punct propriile modele generative pentru NER pe NLP Cloud.

Pentru mai multe detalii, consultați documentația noastră despre extragerea entităților. aici. Pentru o utilizare avansată, consultați punctul final API de generare de text aici. Și testați cu ușurință extragerea entităților pe terenul nostru de joacă.

Testarea NER la nivel local este un lucru, dar utilizarea fiabilă a acestuia în producție este un alt lucru. Cu NLP Cloud le puteți face pe amândouă!

Întrebări frecvente

Ce este Recunoașterea entităților numite (NER)?

Recunoașterea entităților numite (Named Entity Recognition - NER) este o subactivitate a extracției de informații care identifică și clasifică entitățile numite din text în categorii predefinite, cum ar fi nume de persoane, organizații, locații, expresii de timp, cantități, valori monetare, procente etc. Este o tehnică fundamentală de procesare a limbajului natural (NLP) utilizată pentru recuperarea informațiilor, sistemele de răspuns la întrebări și extragerea cunoștințelor.

Care sunt categoriile comune utilizate în NER?

Categoriile comune utilizate în Recunoașterea entităților numite (NER) includ nume de persoane, organizații, locații, date, ore, valori monetare, procente și cantități. Aceste categorii ajută la identificarea și clasificarea elementelor cheie din text pentru extragerea și analiza informațiilor.

Cum gestionează sistemele NER moderne ambiguitățile lingvistice și structurile complexe?

Sistemele moderne de recunoaștere a entităților numite (Named Entity Recognition - NER) utilizează algoritmi avansați de învățare automată, în special arhitecturi de învățare profundă, cum ar fi rețelele neuronale recurente (RNN) și transformatoarele, pentru a analiza contextul și relațiile semantice din text, permițându-le să gestioneze ambiguitățile și structurile lingvistice complexe. Acestea utilizează cantități uriașe de date de formare adnotate și modele lingvistice preinstruite pentru a prezice cu exactitate entitățile chiar și în prezența unor construcții ambigue sau complicate.

Pot sistemele NER să recunoască entități noi sau necunoscute?

Sistemele NER (Named Entity Recognition) recunosc în primul rând entitățile pentru care au fost instruite, dar capacitatea lor de a recunoaște entități noi sau necunoscute depinde de generalitatea datelor de instruire și de capacitatea de adaptare a algoritmilor lor. Unele sisteme avansate, în special cele care utilizează învățarea profundă și înțelegerea contextuală, pot să deducă sau să generalizeze pentru a identifica entități nevăzute anterior, învățând din contextul în care acestea apar. Pe NLP Cloud puteți recunoaște perfect entități noi sau necunoscute!

Ce limbi acceptă API-ul dvs. de inteligență artificială pentru extragerea entităților?

Suportăm extragerea de entități în 100 de limbi

Cât de repede returnează entitățile din AI API?

Depinde de dimensiunea textului și de modelul AI pe care îl utilizați. În general, timpul de răspuns este de aproximativ câteva secunde.

Cum se evaluează acuratețea NER?

Pentru a evalua acuratețea unui sistem de recunoaștere a entităților numite (NER), se utilizează de obicei precizia, reamintirea și scorul F1 bazat pe adevăratele pozitive, falsele pozitive și falsele negative. Aceste măsurători compară rezultatele sistemului cu un standard de referință sau cu un adevăr de bază adnotat manual pentru a determina cât de bine sistemul identifică și clasifică entitățile numite.

Pot să încerc gratuit API-ul NER?

Da, la fel ca toate modelele din NLP Cloud, endpoint-ul NER API poate fi testat gratuit.

Cum gestionează API-ul dvs. de inteligență artificială confidențialitatea și securitatea datelor în timpul procesului de extragere a entităților?

NLP Cloud se concentrează pe confidențialitatea datelor prin proiectare: nu înregistrăm sau stocăm conținutul cererilor pe care le faceți pe API-ul nostru. NLP Cloud este conform atât cu HIPAA, cât și cu GDPR.