Megnevezett entitások felismerése (NER) API, generatív mesterséges intelligenciával

Mi az a NER?

A NER a Named Entity Recognition (név szerinti entitás felismerés) rövidítése. Ez egy olyan részfeladat, amely a szövegben található megnevezett entitások azonosítását és előre meghatározott kategóriákba való besorolását foglalja magában, mint például személyek, szervezetek, helyszínek, időpontok, mennyiségek, pénzértékek, százalékok stb. nevei.

Az olyan generatív modellek, mint a ChatGPT, GPT-3.5, GPT-4, LLaMA 3, Yi 34B vagy a Mixtral 8x7B, nagyon jók az entitások kinyerésében.

A NER kulcsfontosságú számos NLP-alkalmazás, például a kérdésmegfejtés, a szövegösszefoglalás és a gépi fordítás számára, mivel részletes információt nyújt a szöveg kulcsfontosságú elemeiről, lehetővé téve a mélyebb megértést és feldolgozást. Ha például tudjuk, hogy a "Párizs" egy adott szövegben egy helyre utal, az jelentősen befolyásolhatja a szöveg értelmezését és az NLP-rendszer által generált választ.

Tegyük fel, hogy a következő mondatunk van:

John Doe a Google webfejlesztője.

Automatikusan szeretné felismerni, hogy "John Doe" egy név, "webfejlesztő" egy munkakör, és "Google" egy vállalat. A NER pontosan ezt fogja megtenni.

NER megjegyzés

Néhány entitás-kivonatolási felhasználási eset

A világ tele van strukturálatlan adatokkal, különösen a web. Ha képesek vagyunk strukturált információkat kinyerni belőlük, rengeteg értékes információhoz juthatunk hozzá. Íme néhány példa.

Ügyfélkérelmek rendezése

Ha sok ügyfélkérelemmel foglalkozunk (ügyfélszolgálat, értékesítés, ...), mindenképpen segít a NER alkalmazása a bejövő kérések automatikus rendezése érdekében. Például automatikusan kivonhatja a kérelemben említett termék típusát, és ennek megfelelően továbbíthatja azt a megfelelő szolgáltatáshoz.

Pénzügyi adatok kivonása

A pénzügyi adatok kinyerése és konszolidálása hosszadalmas és fárasztó lehet. A NER itt határozottan növelheti termelékenységét, mivel segíthet a megfelelő adatok másodpercek alatt történő kinyerésében.



Előfeldolgozás önéletrajzok/jelentkezések

A HR-szolgálatoknak néha nehéz dolguk van az összes ilyen kérelem elolvasásával. Érdekes lehet számukra, ha automatikusan kiemelik az olyan érdekes egységeket, mint a vállalat neve, a készségek,..., hogy időt takarítsanak meg.

Kivonat vezet

Sok B2B lead megtalálható a nyilvános weboldalakon vagy a vállalati brosúrákban, de ezek manuális kinyerése néha fájdalmas lehet. A NER-nek köszönhetően automatikusan kinyerheti a személyt, a munkakörét és a vállalatot, ha létezik.

Az NLP Cloud NER API-ja

Az NLP Cloud egy olyan entitás-kivonatoló API-t kínál, amely lehetővé teszi a Named Entity Recognition out of the box elvégzését a spaCy, Ginza vagy a GPT-4, GPT-3.5 vagy ChatGPT modellekkel egyenértékű fejlettebb generatív AI modellek, mint a LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B és mások alapján. Speciális dokumentumokra vonatkozó fejlett entitás-kivonatoláshoz javasoljuk, hogy finomhangolja saját generatív modelljeit a NER-hez az NLP Cloudon.

További részletekért lásd az entitások kinyeréséről szóló dokumentációnkat. itt. A speciális használathoz lásd a szöveggeneráló API végpontot. itt. És könnyen tesztelheti az entitások kinyerését a játszóterünkön.

A NER helyi tesztelése egy dolog, de a megbízható használata a termelésben egy másik dolog. Az NLP Cloud segítségével mindkettőt megteheti!

Gyakran ismételt kérdések

Mi az a Név szerinti entitásfelismerés (NER)?

A megnevezett entitások felismerése (NED) az információkinyerés egyik részfeladata, amely a szövegben található megnevezett entitásokat azonosítja és osztályozza előre meghatározott kategóriákba, például személyek, szervezetek, helyszínek nevei, idők kifejezései, mennyiségek, pénzértékek, százalékok stb. szerint. Ez egy alapvető természetes nyelvfeldolgozási (NLP) technika, amelyet információkereséshez, kérdésválaszoló rendszerekhez és tudáskinyeréshez használnak.

Melyek a NER-ben használt általános kategóriák?

A Név szerinti entitások felismerésében (NER) használt általános kategóriák közé tartoznak a személynevek, szervezetek, helyszínek, dátumok, időpontok, időpontok, pénzértékek, százalékok és mennyiségek. Ezek a kategóriák segítenek a szöveg kulcsfontosságú elemeinek azonosításában és osztályozásában az információ kinyerése és elemzése céljából.

Hogyan kezelik a modern NER-rendszerek a nyelvi kétértelműségeket és az összetett szerkezeteket?

A modern megnevezett entitások felismerő rendszerei (NER) fejlett gépi tanulási algoritmusokat, nevezetesen mély tanulási architektúrákat, például rekurrens neurális hálózatokat (RNN) és transzformátorokat használnak a szövegben lévő kontextus és szemantikai kapcsolatok elemzésére, lehetővé téve számukra a többértelműségek és az összetett nyelvi struktúrák kezelését. Hatalmas mennyiségű annotált képzési adatot és előre betanított nyelvi modelleket használnak, hogy még kétértelmű vagy bonyolult szerkezetek esetén is pontosan megjósolják az entitásokat.

A NER-rendszerek képesek-e felismerni új vagy ismeretlen entitásokat?

A NER-rendszerek (Named Entity Recognition) elsősorban azokat az entitásokat ismerik fel, amelyekre betanították őket, de az új vagy ismeretlen entitások felismerésének képessége a betanított adatok általánosságától és az algoritmusok alkalmazkodóképességétől függ. Egyes fejlett rendszerek, különösen a mély tanulást és kontextuális megértést alkalmazó rendszerek, képesek következtetni vagy általánosítani a korábban nem látott entitások azonosítására azáltal, hogy tanulnak a kontextusból, amelyben azok megjelennek. Az NLP Cloudon tökéletesen felismerheti az új vagy ismeretlen entitásokat!

Milyen nyelveket támogat az Ön AI API-ja az entitások kinyeréséhez?

Támogatjuk az entitások kinyerését 100 nyelven

Milyen gyorsan ad vissza entitásokat az AI API?

Ez a szöveg méretétől és a használt AI-modelltől függ. Általában a válaszidő néhány másodperc körül van.

Hogyan értékelhető a NER pontossága?

A megnevezett entitások felismerő rendszere (NER) pontosságának értékelésére általában a pontosságot, a visszahívást és az F1-pontszámot használják a valódi pozitív, a hamis pozitív és a hamis negatív eredmények alapján. Ezek a mérőszámok a rendszer kimenetét egy kézzel jegyzetelt arany standarddal vagy alapigazsággal hasonlítják össze annak meghatározására, hogy a rendszer mennyire jól azonosítja és osztályozza a megnevezett entitásokat.

Kipróbálhatom ingyen a NER API-t?

Igen, az NLP Cloud összes modelljéhez hasonlóan a NER API végpont is ingyenesen tesztelhető.

Hogyan kezeli az Ön AI API-ja az adatvédelmet és a biztonságot az entitások kinyerése során?

Az NLP Cloud az adatvédelemre összpontosít: nem naplózzuk és nem tároljuk az API-nkban tett kérések tartalmát. Az NLP Cloud megfelel a HIPAA- és a GDPR-szabályozásnak.