API for navngitt entitetsgjenkjenning (NER) med generativ AI

Hva er NER?

NER står for Named Entity Recognition. Det er en deloppgave som innebærer å identifisere og klassifisere navngitte enheter i tekst i forhåndsdefinerte kategorier, for eksempel navn på personer, organisasjoner, steder, tidsangivelser, mengder, pengeverdier, prosenter osv.

Generative modeller som GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B eller Mixtral 8x7B er svært gode til å utføre entitetsekstraksjon.

NER er avgjørende for mange NLP-applikasjoner som spørsmålssvar, tekstoppsummering og maskinoversettelse, ettersom det gir detaljert informasjon om nøkkelelementene i en tekst, noe som muliggjør dypere forståelse og behandling. Hvis man for eksempel vet at "Paris" refererer til et sted i en gitt tekst, kan det ha stor betydning for tolkningen av teksten og svaret som genereres av et NLP-system.

La oss si at du har følgende setning:

John Doe er webutvikler hos Google.

Du vil gjerne automatisk oppdage at "John Doe" er et navn, "webutvikler" er en stillingstittel og "Google" er et selskap. Og det er akkurat det NER skal gjøre.

NER-kommentarer

Noen eksempler på bruk av entitetsuttrekk

Verden er full av ustrukturerte data, spesielt på nettet. Hvis du kan trekke ut strukturert informasjon fra disse dataene, kan du få tilgang til mye verdifull informasjon. Her er et par eksempler.

Sortere kundeforespørsler

Når du håndterer mange kundeforespørsler (support, salg, ...), er det definitivt nyttig å bruke NER for å sortere disse innkommende forespørslene automatisk. Du kan for eksempel automatisk trekke ut produkttypen som er nevnt i forespørselen, og dirigere den til riktig tjeneste.

Trekk ut finansielle data

Det kan ta lang tid å hente ut og konsolidere finansielle data. NER kan definitivt øke produktiviteten din ved å hjelpe deg med å hente ut de riktige dataene på et øyeblikk.

Forhåndsbehandle CV-er/søknader

HR-tjenestene har av og til problemer med å lese alle disse søknadene. Det kan være interessant for dem å automatisk utheve interessante enheter som firmanavn, kompetanse osv. for å spare tid.

Trekk ut potensielle kunder

Mange B2B-kundeemner finnes på offentlige nettsteder eller i bedriftsbrosjyrer, men det kan være vanskelig å hente dem ut manuelt. Takket være NER kan du automatisk trekke ut en person med stillingstittel og selskap, hvis de finnes.

NLP Clouds NER-API

NLP Cloud tilbyr et API for entitetsekstraksjon som gjør det mulig å utføre Named Entity Recognition uten videre, basert på spaCy, Ginza eller mer avanserte generative AI-modeller som tilsvarer GPT-5 eller GPT-4, som GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B med flere. For avansert entitetsekstraksjon på spesifikke dokumenter anbefaler vi at du finjusterer dine egne generative modeller for NER på NLP Cloud.

Du finner mer informasjon i dokumentasjonen vår om utvinning av enheter. her. For avansert bruk, se API-endepunktet for tekstgenerering. her. Og enkelt teste uttrekk av enheter på lekeplassen vår.

Én ting er å teste NER lokalt, noe annet er å bruke det pålitelig i produksjon. Med NLP Cloud kan du gjøre begge deler!

Prøv NER
gratis

Ofte stilte spørsmål

Hva er Named Entity Recognition (NER)?

Named Entity Recognition (NER) er en deloppgave innen informasjonsutvinning som identifiserer og klassifiserer navngitte enheter i tekst i forhåndsdefinerte kategorier, for eksempel navn på personer, organisasjoner, steder, tidsangivelser, mengder, pengeverdier, prosenter osv. Det er en grunnleggende NLP-teknikk (Natural Language Processing) som brukes til informasjonssøking, systemer for spørsmålssvar og kunnskapsutvinning.

Hva er de vanligste kategoriene som brukes i NER?

Vanlige kategorier som brukes i Named Entity Recognition (NER), er navn på personer, organisasjoner, steder, datoer, klokkeslett, pengeverdier, prosenter og mengder. Disse kategoriene hjelper til med å identifisere og klassifisere nøkkelelementer i tekst for informasjonsutvinning og analyse.

Hvordan håndterer moderne NER-systemer språklig tvetydighet og komplekse strukturer?

Moderne NER-systemer (Named Entity Recognition) utnytter avanserte maskinlæringsalgoritmer, særlig dyplæringsarkitekturer som tilbakevendende nevrale nettverk (RNN) og transformatorer, for å analysere kontekst og semantiske relasjoner i tekst, slik at de kan håndtere tvetydigheter og komplekse språklige strukturer. De bruker store mengder annoterte opplæringsdata og forhåndstrente språkmodeller til å forutsi entiteter nøyaktig, selv ved tvetydige eller kompliserte konstruksjoner.

Kan NER-systemer gjenkjenne nye eller ukjente enheter?

NER-systemer (Named Entity Recognition) gjenkjenner først og fremst entiteter de har blitt trent på, men deres evne til å gjenkjenne nye eller ukjente entiteter avhenger av hvor generelle treningsdataene er og hvor tilpasningsdyktige algoritmene er. Noen avanserte systemer, spesielt de som benytter seg av dyp læring og kontekstuell forståelse, kan utlede eller generalisere for å identifisere tidligere usette entiteter ved å lære av konteksten de opptrer i. På NLP Cloud kan du gjenkjenne nye eller ukjente enheter!

Hvilke språk støtter AI-API-et deres for utvinning av enheter?

Vi støtter entitetsekstraksjon på 100 språk

Hvor raskt returnerer AI-API-et enheter?

Det avhenger av størrelsen på teksten og AI-modellen du bruker. Generelt er responstiden rundt et par sekunder.

Hvordan evaluerer man nøyaktigheten til NER?

For å evaluere nøyaktigheten til et NER-system (Named Entity Recognition) brukes vanligvis presisjon, tilbakekalling og F1-poengsum basert på sanne positive, falske positive og falske negative resultater. Disse beregningene sammenligner systemets resultater med en manuelt annotert gullstandard eller "ground truth" for å fastslå hvor godt systemet identifiserer og klassifiserer navngitte enheter.

Kan jeg prøve NER API gratis?

Ja, i likhet med alle modellene på NLP Cloud kan NER API-endepunktet testes gratis.

Hvordan håndterer AI-API-et ditt personvern og datasikkerhet under uttrekksprosessen?

NLP Cloud er fokusert på personvern: Vi logger eller lagrer ikke innholdet i forespørslene du sender til API-et vårt. NLP Cloud er i samsvar med både HIPAA og GDPR.