Rozhraní API pro rozpoznávání pojmenovaných entit (NER) s generativní umělou inteligencí

Co je NER?

NER je zkratka pro rozpoznávání pojmenovaných entit. Jedná se o dílčí úlohu, která zahrnuje identifikaci a klasifikaci pojmenovaných entit v textu do předem definovaných kategorií, jako jsou jména osob, organizací, míst, vyjádření času, množství, peněžní hodnoty, procenta atd.

Generativní modely jako GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B nebo Mixtral 8x7B jsou velmi dobré při extrakci entit.

NER má zásadní význam pro mnoho aplikací NLP, jako je zodpovídání otázek, shrnutí textu a strojový překlad, protože poskytuje podrobné informace o klíčových prvcích textu, což umožňuje jeho hlubší pochopení a zpracování. Například znalost toho, že slovo "Paříž" v daném textu odkazuje na určité místo, může významně ovlivnit interpretaci tohoto textu a odpověď generovanou systémem NLP.

Řekněme, že máte následující větu:

Neznámý je webový vývojář ve společnosti Google.

Rádi byste automaticky zjistili, že "John Doe" je jméno, "webový vývojář" je pracovní pozice a "Google" je společnost. A to je přesně to, co NER udělá.

Anotace NER

Některé případy použití extrakce entit

Svět je plný nestrukturovaných dat, zejména web. Schopnost získat z nich strukturované informace může umožnit přístup k mnoha cenným informacím. Zde je několik příkladů.

Třídit požadavky zákazníků

Při vyřizování velkého množství požadavků zákazníků (podpora, prodej, ...) rozhodně pomáhá použití NER k automatickému třídění těchto příchozích požadavků. Například můžete automaticky extrahovat typ produktu uvedený v požadavku a podle toho jej přesměrovat na správnou službu.

Výpis finančních údajů

Získávání a konsolidace finančních dat může být zdlouhavé a únavné. NER zde může rozhodně zvýšit vaši produktivitu tím, že vám pomůže extrahovat správná data během sekundy.

Předběžné zpracování životopisů/žádostí

Personální služby mají někdy problém se čtením všech těchto žádostí. Pro ně může být zajímavé automaticky zvýrazňovat zajímavé entity, jako jsou názvy firem, dovednosti,..., aby se ušetřil čas.

Extrakce vedení

Mnoho potenciálních zákazníků B2B lze nalézt na veřejných webových stránkách nebo ve firemních brožurách, ale jejich ruční extrakce může být někdy obtížná. Díky NER můžete automaticky extrahovat osobu, její pracovní pozici a společnost, pokud existují.

Rozhraní API NER služby NLP Cloud

NLP Cloud nabízí rozhraní API pro extrakci entit, které umožňuje provádět rozpoznávání pojmenovaných entit na základě modelů spaCy, Ginza nebo pokročilejších generativních modelů AI ekvivalentních modelům GPT-5 nebo GPT-4, jako jsou GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B a další. Pro pokročilou extrakci entit na konkrétních dokumentech doporučujeme vyladit vlastní generativní modely pro NER v NLP Cloud.

Další podrobnosti naleznete v naší dokumentaci o extrakci entit. zde. Pokročilé použití naleznete v koncovém bodě API pro generování textu. zde. A snadno otestujte extrakci entit na našem hřišti.

Lokální testování NER je jedna věc, ale jeho spolehlivé použití v produkci je věc druhá. S NLP Cloud můžete dělat obojí!

Zkuste NER
zdarma

Často kladené otázky

Co je rozpoznávání pojmenovaných entit (NER)?

Rozpoznávání pojmenovaných entit (Named Entity Recognition, NER) je dílčí úloha extrakce informací, která identifikuje a klasifikuje pojmenované entity v textu do předem definovaných kategorií, jako jsou jména osob, organizací, míst, vyjádření času, množství, peněžní hodnoty, procenta apod. Jedná se o základní techniku zpracování přirozeného jazyka (NLP), která se používá pro vyhledávání informací, systémy pro zodpovídání otázek a extrakci znalostí.

Jaké jsou běžné kategorie používané v NER?

Mezi běžné kategorie používané při rozpoznávání pojmenovaných entit (NER) patří jména osob, organizací, míst, dat, časů, peněžních hodnot, procent a množství. Tyto kategorie pomáhají při identifikaci a klasifikaci klíčových prvků v textu za účelem extrakce a analýzy informací.

Jak si moderní systémy NER poradí s nejednoznačností jazyka a složitými strukturami?

Moderní systémy rozpoznávání pojmenovaných entit (NER) využívají pokročilé algoritmy strojového učení, zejména architektury hlubokého učení, jako jsou rekurentní neuronové sítě (RNN) a transformátory, k analýze kontextu a sémantických vztahů v textu, což jim umožňuje zvládat nejednoznačnosti a složité jazykové struktury. Využívají obrovské množství anotovaných trénovacích dat a předem natrénovaných jazykových modelů k přesnému předpovídání entit i v případě nejednoznačných nebo složitých konstrukcí.

Dokáží systémy NER rozpoznat nové nebo neznámé entity?

Systémy NER (Named Entity Recognition) primárně rozpoznávají entity, na které byly vyškoleny, ale jejich schopnost rozpoznávat nové nebo neznámé entity závisí na obecnosti jejich trénovacích dat a přizpůsobivosti jejich algoritmů. Některé pokročilé systémy, zejména ty, které využívají hluboké učení a kontextové porozumění, dokáží odvodit nebo zobecnit identifikaci dříve nepoznaných entit tím, že se učí z kontextu, v němž se vyskytují. Na NLP Cloudu lze dokonale rozpoznat nové nebo neznámé entity!

Jaké jazyky podporuje vaše rozhraní API pro extrakci entit?

Podporujeme extrakci entit ve 100 jazycích

Jak rychle vrací rozhraní API umělé inteligence entity?

Záleží na velikosti textu a modelu umělé inteligence, který používáte. Obecně se doba odezvy pohybuje kolem několika sekund.

Jak vyhodnotit přesnost NER?

Pro hodnocení přesnosti systému rozpoznávání pojmenovaných entit (NER) se obvykle používá přesnost, odvolání a skóre F1 založené na pravdivých pozitivních, falešně pozitivních a falešně negativních výsledcích. Tyto metriky porovnávají výstup systému s ručně anotovaným zlatým standardem nebo základní pravdou, aby se určilo, jak dobře systém identifikuje a klasifikuje pojmenované entity.

Mohu si vaše rozhraní NER API vyzkoušet zdarma?

Ano, stejně jako všechny modely na NLP Cloud lze i koncový bod API NER testovat zdarma.

Jak vaše rozhraní API pro umělou inteligenci řeší ochranu soukromí a zabezpečení dat během procesu extrakce entit?

Služba NLP Cloud se zaměřuje na ochranu osobních údajů: obsah vašich požadavků na naše rozhraní API nezaznamenáváme ani neukládáme. Služba NLP Cloud je v souladu s předpisy HIPAA i GDPR.