John Doe je spletni razvijalec v Googlu.
NER pomeni prepoznavanje poimenovanih entitet. Gre za podnalogo, ki vključuje prepoznavanje in razvrščanje poimenovanih entitet v besedilu v vnaprej določene kategorije, kot so imena oseb, organizacij, lokacij, časovni izrazi, količine, denarne vrednosti, odstotki itd.
Generativni modeli, kot so GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B ali Mixtral 8x7B, so zelo dobri pri ekstrakciji entitet.
NER je ključnega pomena za številne aplikacije NLP, kot so odgovarjanje na vprašanja, povzemanje besedil in strojno prevajanje, saj zagotavlja podrobne informacije o ključnih elementih besedila, kar omogoča boljše razumevanje in obdelavo. Če na primer vemo, da se beseda "Pariz" nanaša na lokacijo v določenem besedilu, lahko to bistveno vpliva na razlago tega besedila in na odziv, ki ga ustvari sistem NLP.
Recimo naslednji stavek:
John Doe je spletni razvijalec v Googlu.
Želite samodejno zaznati, da je "John Doe" ime, "spletni razvijalec" naziv delovnega mesta in "Google" podjetje. In to je točno to, kar bo storil NER.

Svet je poln nestrukturiranih podatkov, zlasti splet. Če lahko iz njih pridobimo strukturirane informacije, lahko dostopamo do številnih dragocenih informacij. Tukaj je nekaj primerov.
Pri obravnavi številnih zahtevkov strank (podpora, prodaja, ...) vsekakor pomaga uporaba NER za samodejno razvrščanje teh prejetih zahtevkov. Tako lahko na primer samodejno izluščite vrsto izdelka, ki je navedena v zahtevi, in jo ustrezno usmerite v pravo službo.
Pridobivanje in združevanje finančnih podatkov je lahko dolgotrajno in zamudno. NER lahko vsekakor poveča vašo produktivnost, saj vam pomaga pridobiti prave podatke v sekundi.
Kadrovske službe imajo včasih težave pri branju vseh teh vlog. Za njih je lahko zanimivo, da samodejno poudarijo zanimive entitete, kot so imena podjetij, znanja in spretnosti, in tako prihranijo čas.
Veliko potencialnih strank B2B je mogoče najti na javnih spletnih mestih ali v brošurah podjetij, vendar je njihovo ročno pridobivanje včasih zelo težavno. S pomočjo NER lahko samodejno izluščite osebo, njen naziv delovnega mesta in podjetje, če obstajata.
NLP Cloud predlaga API za ekstrakcijo entitet, ki omogoča takojšnje prepoznavanje poimenovanih entitet na podlagi modelov spaCy, Ginza ali naprednejših generativnih modelov umetne inteligence, enakovrednih modelom GPT-5 ali GPT-4, kot so GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B in drugi. Za napredno ekstrakcijo entitet na določenih dokumentih priporočamo, da v oblaku NLP Cloud natančno nastavite lastne generativne modele za NER.
Za več podrobnosti glejte našo dokumentacijo o ekstrakciji entitet. tukaj. Za napredno uporabo glejte končno točko API za generiranje besedila tukaj. In enostavno preizkusite ekstrakcijo entitet na našem igrišču.
Lokalno testiranje NER je ena stvar, zanesljiva uporaba v produkciji pa druga. Z NLP Cloud lahko počnete oboje!