API til genkendelse af navngivne entiteter (NER) med generativ AI

Hvad er NER?

NER står for Named Entity Recognition (genkendelse af navngivne enheder). Det er en delopgave, der involverer identifikation og klassificering af navngivne enheder i tekst i foruddefinerede kategorier, såsom navne på personer, organisationer, steder, udtryk for tidspunkter, mængder, pengeværdier, procenter osv.

Generative modeller som GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B eller Mixtral 8x7B er meget gode til at udtrække enheder.

NER er afgørende for mange NLP-applikationer som besvarelse af spørgsmål, opsummering af tekst og maskinoversættelse, da det giver detaljerede oplysninger om de vigtigste elementer i en tekst, hvilket muliggør dybere forståelse og behandling. Hvis man f.eks. ved, at "Paris" henviser til et sted i en given tekst, kan det have stor indflydelse på fortolkningen af teksten og det svar, der genereres af et NLP-system.

Lad os sige, at du har følgende sætning:

John Doe er webudvikler hos Google.

Du vil gerne automatisk opdage, at "John Doe" er et navn, "webudvikler" er en jobtitel, og "Google" er en virksomhed. Og det er præcis, hvad NER vil gøre.

NER-annotation

Nogle eksempler på brug af entitetsudtrækning

Verden er fuld af ustrukturerede data, især internettet. At kunne udtrække struktureret information fra dem kan give adgang til en masse værdifuld information. Her er et par eksempler.

Sorter kundeanmodninger

Når man håndterer mange kundeanmodninger (support, salg, ...), hjælper det helt sikkert at anvende NER for automatisk at sortere disse indgående anmodninger. Du kan f.eks. automatisk udtrække den produkttype, der er nævnt i anmodningen, og dirigere den til den rigtige service i overensstemmelse hermed.

Udtræk af finansielle data

Udtrækning og konsolidering af finansielle data kan være lang og kedelig. NER kan helt sikkert øge din produktivitet her ved at hjælpe dig med at udtrække de rigtige data på et sekund.

Forbehandling af CV'er/ansøgninger

HR-afdelingerne har nogle gange svært ved at læse alle disse ansøgninger. Det kan være interessant for dem automatisk at fremhæve interessante enheder som firmanavne, færdigheder, ... for at spare tid.

Uddrag Leads

Mange B2B-leads kan findes på offentlige hjemmesider eller i virksomhedsbrochurer, men det kan nogle gange være besværligt at udtrække dem manuelt. Takket være NER kan du automatisk udtrække en person med hendes jobtitel og virksomhed, hvis de findes.

NLP Clouds NER API

NLP Cloud tilbyder en API til entitetsekstraktion, der gør det muligt at udføre Named Entity Recognition ud af boksen, baseret på spaCy, Ginza eller mere avancerede generative AI-modeller svarende til GPT-5 eller GPT-4, som GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B m.fl. Til avanceret entitetsekstraktion på specifikke dokumenter anbefaler vi, at du finjusterer dine egne generative modeller til NER på NLP Cloud.

For flere detaljer, se vores dokumentation om enhedsekstraktion her. For avanceret brug, se tekstgenererings-API-endpointet her. Og test nemt udtræk af enheder på vores legeplads.

At teste NER lokalt er én ting, men at bruge det pålideligt i produktionen er en anden ting. Med NLP Cloud kan du bare gøre begge dele!

Prøv NER
gratis

Ofte stillede spørgsmål

Hvad er genkendelse af navngivne entiteter (NER)?

Named Entity Recognition (NER) er en delopgave inden for informationsudvinding, der identificerer og klassificerer navngivne enheder i tekst i foruddefinerede kategorier som navne på personer, organisationer, steder, udtryk for tidspunkter, mængder, pengeværdier, procenter osv. Det er en grundlæggende NLP-teknik (Natural Language Processing), der bruges til informationssøgning, systemer til besvarelse af spørgsmål og videnudvinding.

Hvad er de almindelige kategorier, der bruges i NER?

Almindelige kategorier, der bruges i Named Entity Recognition (NER), omfatter personnavne, organisationer, steder, datoer, tidspunkter, pengeværdier, procentsatser og mængder. Disse kategorier hjælper med at identificere og klassificere nøgleelementer i tekst til informationsudvinding og analyse.

Hvordan håndterer moderne NER-systemer sproglige tvetydigheder og komplekse strukturer?

Moderne Named Entity Recognition (NER)-systemer udnytter avancerede maskinlæringsalgoritmer, især deep learning-arkitekturer som recurrent neural networks (RNN) og transformers, til at analysere kontekst og semantiske relationer i tekst, så de kan håndtere tvetydigheder og komplekse sproglige strukturer. De bruger store mængder af annoterede træningsdata og forudindlærte sprogmodeller til præcist at forudsige entiteter, selv i tilfælde af tvetydige eller indviklede konstruktioner.

Kan NER-systemer genkende nye eller ukendte enheder?

NER-systemer (Named Entity Recognition) genkender primært entiteter, som de er blevet trænet i, men deres evne til at genkende nye eller ukendte entiteter afhænger af generaliteten af deres træningsdata og algoritmernes tilpasningsevne. Nogle avancerede systemer, især dem, der anvender deep learning og kontekstuel forståelse, kan udlede eller generalisere til at identificere tidligere usete entiteter ved at lære af den kontekst, de optræder i. På NLP Cloud kan du perfekt genkende nye eller ukendte enheder!

Hvilke sprog understøtter jeres AI API til udtrækning af enheder?

Vi understøtter udtrækning af enheder på 100 sprog

Hvor hurtigt returnerer AI API'en enheder?

Det afhænger af størrelsen på din tekst og den AI-model, du bruger. Generelt er responstiden omkring et par sekunder.

Hvordan evaluerer man nøjagtigheden af NER?

For at evaluere nøjagtigheden af et Named Entity Recognition (NER)-system bruger man typisk precision, recall og F1-score baseret på true positives, false positives og false negatives. Disse målinger sammenligner systemets output med en manuelt annoteret guldstandard eller ground truth for at afgøre, hvor godt systemet identificerer og klassificerer navngivne enheder.

Kan jeg prøve jeres NER API gratis?

Ja, som alle modellerne på NLP Cloud kan NER API-endepunktet testes gratis.

Hvordan håndterer din AI API databeskyttelse og -sikkerhed under processen med at udtrække enheder?

NLP Cloud er fokuseret på databeskyttelse gennem design: Vi logger eller gemmer ikke indholdet af de anmodninger, du foretager på vores API. NLP Cloud er både HIPAA- og GDPR-kompatibel.