John Doe är webbutvecklare på Google.
NER står för Named Entity Recognition. Det är en deluppgift som innebär att identifiera och klassificera namngivna enheter i text i fördefinierade kategorier, t.ex. namn på personer, organisationer, platser, tidsuttryck, kvantiteter, monetära värden, procentsatser etc.
Generativa modeller som ChatGPT, GPT-3.5, GPT-4, LLaMA 3, Yi 34B eller Mixtral 8x7B är mycket bra på att extrahera entiteter.
NER är avgörande för många NLP-applikationer som frågesvar, textsammanfattning och maskinöversättning, eftersom det ger detaljerad information om de viktigaste elementen i en text, vilket möjliggör djupare förståelse och bearbetning. Att veta att "Paris" hänvisar till en plats i en viss text kan till exempel påverka tolkningen av den texten och det svar som genereras av ett NLP-system.
Låt oss säga att du har följande mening:
John Doe är webbutvecklare på Google.
Du vill automatiskt upptäcka att "John Doe" är ett namn, "webbutvecklare" är en yrkestitel och "Google" är ett företag. Och det är precis vad NER kommer att göra.
Världen är full av ostrukturerad data, särskilt webben. Att kunna extrahera strukturerad information från dessa data kan ge tillgång till mycket värdefull information. Här är ett par exempel.
När man hanterar många kundförfrågningar (support, försäljning, ...) hjälper det definitivt att tillämpa NER för att automatiskt sortera dessa inkommande förfrågningar. Till exempel kan du automatiskt extrahera den typ av produkt som nämns i begäran och dirigera detta till rätt tjänst i enlighet därmed.
Att extrahera och konsolidera finansiella data kan vara en lång och tråkig process. NER kan definitivt öka din produktivitet här genom att hjälpa dig att extrahera rätt data på en sekund.
HR-avdelningar har ibland svårt att läsa alla dessa ansökningar. Det kan vara intressant för dem att automatiskt markera intressanta enheter som företagsnamn, färdigheter, ... för att spara tid.
Många B2B-leads kan hittas på offentliga webbplatser eller i företagsbroschyrer, men att extrahera dem manuellt kan ibland vara svårt. Tack vare NER kan du automatiskt extrahera en person, med hennes jobbtitel, och företag, om de finns.
NLP Cloud föreslår ett API för entitetsutvinning som gör det möjligt att utföra Named Entity Recognition direkt, baserat på spaCy, Ginza eller mer avancerade generativa AI-modeller som motsvarar GPT-4, GPT-3.5 eller ChatGPT, som LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B med flera. För avancerad entitetsutvinning i specifika dokument rekommenderar vi att du finjusterar dina egna generativa modeller för NER på NLP Cloud.
För mer information, se vår dokumentation om entitetsutvinning här. För avancerad användning, se API-slutpunkten för textgenerering här. Och enkelt testa entitetsextraktion på vår lekplats.
Att testa NER lokalt är en sak, men att använda det på ett tillförlitligt sätt i produktionen är en annan sak. Med NLP Cloud kan du bara göra båda!