John Doe a Google webfejlesztője.
A NER a Named Entity Recognition (név szerinti entitás felismerés) rövidítése. Ez egy olyan részfeladat, amely a szövegben található megnevezett entitások azonosítását és előre meghatározott kategóriákba való besorolását foglalja magában, mint például személyek, szervezetek, helyszínek, időpontok, mennyiségek, pénzértékek, százalékok stb. nevei.
Az olyan generatív modellek, mint a ChatGPT, GPT-3.5, GPT-4, LLaMA 3, Yi 34B vagy a Mixtral 8x7B, nagyon jók az entitások kinyerésében.
A NER kulcsfontosságú számos NLP-alkalmazás, például a kérdésmegfejtés, a szövegösszefoglalás és a gépi fordítás számára, mivel részletes információt nyújt a szöveg kulcsfontosságú elemeiről, lehetővé téve a mélyebb megértést és feldolgozást. Ha például tudjuk, hogy a "Párizs" egy adott szövegben egy helyre utal, az jelentősen befolyásolhatja a szöveg értelmezését és az NLP-rendszer által generált választ.
Tegyük fel, hogy a következő mondatunk van:
John Doe a Google webfejlesztője.
Automatikusan szeretné felismerni, hogy "John Doe" egy név, "webfejlesztő" egy munkakör, és "Google" egy vállalat. A NER pontosan ezt fogja megtenni.
A világ tele van strukturálatlan adatokkal, különösen a web. Ha képesek vagyunk strukturált információkat kinyerni belőlük, rengeteg értékes információhoz juthatunk hozzá. Íme néhány példa.
Ha sok ügyfélkérelemmel foglalkozunk (ügyfélszolgálat, értékesítés, ...), mindenképpen segít a NER alkalmazása a bejövő kérések automatikus rendezése érdekében. Például automatikusan kivonhatja a kérelemben említett termék típusát, és ennek megfelelően továbbíthatja azt a megfelelő szolgáltatáshoz.
A pénzügyi adatok kinyerése és konszolidálása hosszadalmas és fárasztó lehet. A NER itt határozottan növelheti termelékenységét, mivel segíthet a megfelelő adatok másodpercek alatt történő kinyerésében.
A HR-szolgálatoknak néha nehéz dolguk van az összes ilyen kérelem elolvasásával. Érdekes lehet számukra, ha automatikusan kiemelik az olyan érdekes egységeket, mint a vállalat neve, a készségek,..., hogy időt takarítsanak meg.
Sok B2B lead megtalálható a nyilvános weboldalakon vagy a vállalati brosúrákban, de ezek manuális kinyerése néha fájdalmas lehet. A NER-nek köszönhetően automatikusan kinyerheti a személyt, a munkakörét és a vállalatot, ha létezik.
Az NLP Cloud egy olyan entitás-kivonatoló API-t kínál, amely lehetővé teszi a Named Entity Recognition out of the box elvégzését a spaCy, Ginza vagy a GPT-4, GPT-3.5 vagy ChatGPT modellekkel egyenértékű fejlettebb generatív AI modellek, mint a LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B és mások alapján. Speciális dokumentumokra vonatkozó fejlett entitás-kivonatoláshoz javasoljuk, hogy finomhangolja saját generatív modelljeit a NER-hez az NLP Cloudon.
További részletekért lásd az entitások kinyeréséről szóló dokumentációnkat. itt. A speciális használathoz lásd a szöveggeneráló API végpontot. itt. És könnyen tesztelheti az entitások kinyerését a játszóterünkön.
A NER helyi tesztelése egy dolog, de a megbízható használata a termelésben egy másik dolog. Az NLP Cloud segítségével mindkettőt megteheti!