Neznámý je webový vývojář ve společnosti Google.
NER je zkratka pro rozpoznávání pojmenovaných entit. Jedná se o dílčí úlohu, která zahrnuje identifikaci a klasifikaci pojmenovaných entit v textu do předem definovaných kategorií, jako jsou jména osob, organizací, míst, vyjádření času, množství, peněžní hodnoty, procenta atd.
Generativní modely jako GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B nebo Mixtral 8x7B jsou velmi dobré při extrakci entit.
NER má zásadní význam pro mnoho aplikací NLP, jako je zodpovídání otázek, shrnutí textu a strojový překlad, protože poskytuje podrobné informace o klíčových prvcích textu, což umožňuje jeho hlubší pochopení a zpracování. Například znalost toho, že slovo "Paříž" v daném textu odkazuje na určité místo, může významně ovlivnit interpretaci tohoto textu a odpověď generovanou systémem NLP.
Řekněme, že máte následující větu:
Neznámý je webový vývojář ve společnosti Google.
Rádi byste automaticky zjistili, že "John Doe" je jméno, "webový vývojář" je pracovní pozice a "Google" je společnost. A to je přesně to, co NER udělá.

Svět je plný nestrukturovaných dat, zejména web. Schopnost získat z nich strukturované informace může umožnit přístup k mnoha cenným informacím. Zde je několik příkladů.
Při vyřizování velkého množství požadavků zákazníků (podpora, prodej, ...) rozhodně pomáhá použití NER k automatickému třídění těchto příchozích požadavků. Například můžete automaticky extrahovat typ produktu uvedený v požadavku a podle toho jej přesměrovat na správnou službu.
Získávání a konsolidace finančních dat může být zdlouhavé a únavné. NER zde může rozhodně zvýšit vaši produktivitu tím, že vám pomůže extrahovat správná data během sekundy.
Personální služby mají někdy problém se čtením všech těchto žádostí. Pro ně může být zajímavé automaticky zvýrazňovat zajímavé entity, jako jsou názvy firem, dovednosti,..., aby se ušetřil čas.
Mnoho potenciálních zákazníků B2B lze nalézt na veřejných webových stránkách nebo ve firemních brožurách, ale jejich ruční extrakce může být někdy obtížná. Díky NER můžete automaticky extrahovat osobu, její pracovní pozici a společnost, pokud existují.
NLP Cloud nabízí rozhraní API pro extrakci entit, které umožňuje provádět rozpoznávání pojmenovaných entit na základě modelů spaCy, Ginza nebo pokročilejších generativních modelů AI ekvivalentních modelům GPT-5 nebo GPT-4, jako jsou GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B a další. Pro pokročilou extrakci entit na konkrétních dokumentech doporučujeme vyladit vlastní generativní modely pro NER v NLP Cloud.
Další podrobnosti naleznete v naší dokumentaci o extrakci entit. zde. Pokročilé použití naleznete v koncovém bodě API pro generování textu. zde. A snadno otestujte extrakci entit na našem hřišti.
Lokální testování NER je jedna věc, ale jeho spolehlivé použití v produkci je věc druhá. S NLP Cloud můžete dělat obojí!