Nosaukto vienību atpazīšanas (NER) API, izmantojot ģeneratīvo mākslīgo intelektu

Kas ir NER?

NER ir vārdkopa "Named Entity Recognition". Tas ir apakšuzdevums, kas ietver nosaukto vienību identificēšanu un klasificēšanu tekstā iepriekš noteiktās kategorijās, piemēram, personu, organizāciju, vietu, laika izteicienu, daudzumu, naudas vērtību, procentu u. c. nosaukumos.

Ģeneratīvie modeļi, piemēram, GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B vai Mixtral 8x7B, ļoti labi veic vienību izdalīšanu.

NER ir ļoti svarīga daudzām NLP lietojumprogrammām, piemēram, jautājumu atbildēm, teksta kopsavilkumiem un mašīntulkošanai, jo tā sniedz detalizētu informāciju par teksta galvenajiem elementiem, kas ļauj labāk izprast un apstrādāt tekstu. Piemēram, zinot, ka vārds "Parīze" attiecas uz kādu vietu konkrētā tekstā, var būtiski ietekmēt šī teksta interpretāciju un NLP sistēmas ģenerēto atbildi.

Pieņemsim, ka jums ir šāds teikums:

Doe ir tīmekļa izstrādātājs uzņēmumā Google.

Vēlaties automātiski noteikt, ka "John Doe" ir vārds, "web developer" ir amata nosaukums un "Google" ir uzņēmums. Tieši to arī darīs NER.

NER anotācija

Daži vienību ieguves lietojuma gadījumi

Pasaulē ir daudz nestrukturētu datu, īpaši tīmeklī. Spēja no tā iegūt strukturētu informāciju var sniegt piekļuvi daudz vērtīgai informācijai. Lūk, daži piemēri.

Kārtot klientu pieprasījumus

Strādājot ar daudziem klientu pieprasījumiem (atbalsts, pārdošana, ...), noteikti ir lietderīgi izmantot NER, lai automātiski šķirotu šos ienākošos pieprasījumus. Piemēram, jūs varētu automātiski izdalīt pieprasījumā minētā produkta veidu un attiecīgi novirzīt to pareizajam dienestam.

Finanšu datu iegūšana

Finanšu datu iegūšana un konsolidēšana var būt ilga un garlaicīga. NER noteikti var palielināt jūsu produktivitāti šajā jomā, palīdzot sekundes laikā iegūt pareizos datus.

Iepriekšēja CV/pieteikumu apstrāde

Personāla dienestiem dažkārt ir grūti izlasīt visus šos pieteikumus. Lai ietaupītu laiku, viņiem var būt interesanti automātiski izcelt interesantas vienības, piemēram, uzņēmumu nosaukumus, prasmes... Lai ietaupītu laiku.

Izvilkuma vadlīnijas

Daudzus B2B potenciālos klientus var atrast publiskajās vietnēs vai uzņēmumu brošūrās, taču to manuāla ieguve dažkārt var būt apgrūtinoša. Pateicoties NER, jūs varat automātiski iegūt personu, tās amata nosaukumu un uzņēmumu, ja tādi pastāv.

NLP Cloud NER API

NLP Cloud piedāvā būtņu ieguves API, kas ļauj veikt nosaukto būtņu atpazīšanu, pamatojoties uz spaCy, Ginza vai modernākiem ģeneratīvajiem mākslīgā intelekta modeļiem, kas līdzvērtīgi GPT-5 vai GPT-4, piemēram, GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B un citiem. Uzlabotai īpašību ieguvei konkrētos dokumentos mēs iesakām precizēt savus NER ģeneratīvos modeļus NLP Cloud.

Lai iegūtu sīkāku informāciju, skatiet mūsu dokumentāciju par vienību ieguvi. šeit. Lai uzlabotu lietošanas iespējas, skatiet teksta ģenerēšanas API galapunktu šeit. Un viegli pārbaudiet būtnes ekstrakciju mūsu rotaļu laukumā.

Viena lieta ir testēt NER lokāli, bet pavisam cita lieta ir to droši izmantot ražošanā. Izmantojot NLP Cloud, jūs varat veikt abas šīs darbības!

Izmēģiniet NER
bez maksas

Biežāk uzdotie jautājumi

Kas ir nosaukto vienību atpazīšana (NER)?

Nosaukto vienību atpazīšana (NER) ir informācijas ieguves apakšuzdevums, kas identificē un klasificē nosauktās vienības tekstā iepriekš noteiktās kategorijās, piemēram, personu, organizāciju, vietu nosaukumus, laika izteiksmes formas, daudzumus, naudas vērtības, procentus utt. Tā ir fundamentāla dabiskās valodas apstrādes (NLP) metode, ko izmanto informācijas meklēšanā, jautājumu atbildēšanas sistēmās un zināšanu ieguvē.

Kādas kategorijas parasti izmanto NER?

Nosaukto vienību atpazīšanā (NER) parasti tiek izmantotas šādas kategorijas: personu vārdi, organizācijas, atrašanās vietas, datumi, laiki, naudas vērtības, procenti un daudzumi. Šīs kategorijas palīdz identificēt un klasificēt galvenos teksta elementus informācijas ieguvei un analīzei.

Kā mūsdienu NER sistēmas tiek galā ar valodas neskaidrībām un sarežģītām struktūrām?

Mūsdienu nosaukto vienību atpazīšanas (NER) sistēmās tiek izmantoti mūsdienīgi mašīnmācīšanās algoritmi, jo īpaši dziļas mācīšanās arhitektūras, piemēram, rekurentie neironu tīkli (RNN) un transformatori, lai analizētu kontekstu un semantiskās attiecības tekstā, ļaujot tām pārvaldīt neskaidrības un sarežģītas lingvistiskās struktūras. Tās izmanto milzīgus anotētu mācību datu apjomus un iepriekš apmācītus valodas modeļus, lai precīzi prognozētu vienības pat divdomīgu vai sarežģītu konstrukciju gadījumā.

Vai NER sistēmas spēj atpazīt jaunas vai nezināmas vienības?

NER (Named Entity Recognition) sistēmas galvenokārt atpazīst būtnes, par kurām tās ir apmācītas, taču to spēja atpazīt jaunas vai nezināmas būtnes ir atkarīga no apmācības datu vispārīguma un algoritmu pielāgošanās spējas. Dažas progresīvas sistēmas, jo īpaši tās, kurās izmanto dziļo mācīšanos un kontekstuālo izpratni, var izdarīt secinājumus vai vispārināt, lai atpazītu iepriekš neredzētas vienības, mācoties no konteksta, kurā tās parādās. Izmantojot NLP mākoņus, jūs varat lieliski atpazīt jaunas vai nezināmas vienības!

Kādas valodas jūsu AI API atbalsta būtņu ieguvei?

Mēs atbalstām vienību ieguvi 100 valodās

Cik ātri AI API atgriež vienības?

Tas ir atkarīgs no teksta lieluma un izmantotā mākslīgā intelekta modeļa. Kopumā reakcijas laiks ir aptuveni pāris sekundes.

Kā novērtēt NER precizitāti?

Lai novērtētu nosaukto būtību atpazīšanas (NER) sistēmas precizitāti, parasti izmanto precizitāti, atsaukšanu un F1 rādītāju, pamatojoties uz patiesajiem pozitīvajiem, viltus pozitīvajiem un viltus negatīvajiem rādītājiem. Šie rādītāji salīdzina sistēmas rezultātus ar manuāli anotētu zelta standartu jeb pamatpatiesību, lai noteiktu, cik labi sistēma identificē un klasificē nosauktās būtnes.

Vai varu izmēģināt jūsu NER API bez maksas?

Jā, tāpat kā visus NLP mākoņa modeļus, arī NER API galapunktu var testēt bez maksas.

Kā jūsu AI API tiek nodrošināta datu konfidencialitāte un drošība būtņu ieguves procesā?

NLP mākoņa uzmanības centrā ir datu konfidencialitāte: mēs nereģistrējam un neglabājam jūsu veikto API pieprasījumu saturu. NLP Cloud atbilst HIPAA un GDPR prasībām.