Haben Sie Probleme mit KI oder Full-Stack-Entwicklung? Unsere Experten sind für Sie da: maßgeschneiderte Beratung, technische Integration und mehr. Erreichen Sie uns unter [email protected].

Named Entity Recognition (NER) API, mit generativer KI

Was ist NER?

NER steht für Named Entity Recognition (Erkennung benannter Entitäten). Dabei handelt es sich um eine Teilaufgabe, bei der benannte Entitäten in Texten identifiziert und in vordefinierte Kategorien eingeteilt werden, z. B. Namen von Personen, Organisationen, Orten, Zeitangaben, Mengen, Geldwerte, Prozentsätze usw.

Generative Modelle wie GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B oder Mixtral 8x7B sind sehr gut bei der Entitätsextraktion.

NER ist für viele NLP-Anwendungen wie die Beantwortung von Fragen, Textzusammenfassung und maschinelle Übersetzung von entscheidender Bedeutung, da sie detaillierte Informationen über die Schlüsselelemente eines Textes liefert, die ein tieferes Verständnis und eine bessere Verarbeitung ermöglichen. Zum Beispiel kann das Wissen, dass "Paris" sich auf einen Ort in einem bestimmten Text bezieht, die Interpretation dieses Textes und die von einem NLP-System erzeugte Antwort erheblich beeinflussen.

Nehmen wir an, Sie haben den folgenden Satz:

John Doe ist ein Webentwickler bei Google.

Sie möchten automatisch erkennen, dass "John Doe" ein Name, "Webentwickler" eine Berufsbezeichnung und "Google" ein Unternehmen ist. Und genau das ist es, was NER tun wird.

NER-Anmerkung

Einige Anwendungsfälle der Entitätsextraktion

Die Welt ist voll von unstrukturierten Daten, insbesondere das Internet. Wenn man in der Lage ist, daraus strukturierte Informationen zu extrahieren, kann man Zugang zu einer Menge wertvoller Informationen erhalten. Hier sind ein paar Beispiele.

Kundenanfragen sortieren

Beim Umgang mit vielen Kundenanfragen (Support, Vertrieb, ...) hilft es definitiv, NER anzuwenden, um diese eingehenden Anfragen automatisch zu sortieren. Sie könnten zum Beispiel automatisch den in der Anfrage erwähnten Produkttyp extrahieren und diesen entsprechend an den richtigen Dienst weiterleiten.

Finanzdaten extrahieren

Das Extrahieren und Konsolidieren von Finanzdaten kann langwierig und mühsam sein. NER kann hier definitiv Ihre Produktivität steigern, indem es Ihnen hilft, die richtigen Daten in einer Sekunde zu extrahieren.



Lebensläufe/Bewerbungen vorverarbeiten

Für die Personalabteilung ist es manchmal schwierig, all diese Bewerbungen zu lesen. Es kann für sie interessant sein, interessante Elemente wie Firmennamen, Fähigkeiten usw. automatisch hervorzuheben, um Zeit zu sparen.

Leads extrahieren

Viele B2B-Kontakte können auf öffentlichen Websites oder in Unternehmensbroschüren gefunden werden, aber sie manuell zu extrahieren, kann manchmal mühsam sein. Dank NER können Sie automatisch eine Person mit ihrem Jobtitel und ihrem Unternehmen extrahieren, wenn diese vorhanden sind.

Die NER-API der NLP-Cloud

NLP Cloud bietet eine Entitätsextraktions-API an, die es ermöglicht, Named Entity Recognition (NER) auf der Grundlage von spaCy, Ginza oder fortschrittlicheren generativen KI-Modellen, die GPT-5 oder GPT-4 entsprechen, wie GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B und anderen, sofort auszuführen. Für die fortgeschrittene Entitätsextraktion aus bestimmten Dokumenten empfehlen wir die Feinabstimmung Ihrer eigenen generativen Modelle für NER auf NLP Cloud.

Weitere Details finden Sie in unserer Dokumentation zur Entitätsextraktion hier. Für die erweiterte Verwendung siehe den API-Endpunkt für die Texterstellung hier. Und einfaches Testen der Entitätsextraktion auf unserem Spielplatz.

NER lokal zu testen ist eine Sache, es aber zuverlässig in der Produktion einzusetzen eine andere. Mit NLP Cloud können Sie einfach beides tun!

Häufig gestellte Fragen

Was ist Named Entity Recognition (NER)?

Die Erkennung von benannten Entitäten (Named Entity Recognition, NER) ist eine Teilaufgabe der Informationsextraktion, die benannte Entitäten in Texten identifiziert und in vordefinierte Kategorien einordnet, wie z. B. Namen von Personen, Organisationen, Orten, Zeitangaben, Mengen, Geldwerte, Prozentsätze usw. Es handelt sich um eine grundlegende Technik der natürlichen Sprachverarbeitung (NLP), die für die Informationsbeschaffung, für Systeme zur Beantwortung von Fragen und für die Wissensextraktion verwendet wird.

Welche Kategorien werden in der NER häufig verwendet?

Zu den Kategorien, die in der Named Entity Recognition (NER) häufig verwendet werden, gehören Personennamen, Organisationen, Orte, Daten, Zeiten, Geldwerte, Prozentsätze und Mengen. Diese Kategorien helfen bei der Identifizierung und Klassifizierung von Schlüsselelementen im Text für die Informationsextraktion und -analyse.

Wie gehen moderne NER-Systeme mit sprachlichen Mehrdeutigkeiten und komplexen Strukturen um?

Moderne Systeme zur Erkennung von benannten Entitäten (Named Entity Recognition, NER) nutzen fortschrittliche Algorithmen des maschinellen Lernens, insbesondere Deep-Learning-Architekturen wie rekurrente neuronale Netze (RNN) und Transformatoren, um den Kontext und die semantischen Beziehungen im Text zu analysieren und so Mehrdeutigkeiten und komplexe sprachliche Strukturen zu bewältigen. Sie nutzen große Mengen an kommentierten Trainingsdaten und vorab trainierte Sprachmodelle, um Entitäten auch bei mehrdeutigen oder komplizierten Konstruktionen genau vorherzusagen.

Können NER-Systeme neue oder unbekannte Entitäten erkennen?

NER-Systeme (Named Entity Recognition) erkennen in erster Linie Entitäten, auf die sie trainiert wurden, aber ihre Fähigkeit, neue oder unbekannte Entitäten zu erkennen, hängt von der Allgemeinheit ihrer Trainingsdaten und der Anpassungsfähigkeit ihrer Algorithmen ab. Einige fortgeschrittene Systeme, vor allem solche, die Deep Learning und kontextbezogenes Verstehen einsetzen, können durch Lernen aus dem Kontext, in dem sie auftreten, auf bisher unbekannte Entitäten schließen oder diese verallgemeinern, um sie zu identifizieren. Auf NLP Cloud können Sie neue oder unbekannte Entitäten perfekt erkennen!

Welche Sprachen unterstützt Ihre KI-API für die Entitätsextraktion?

Wir unterstützen die Entitätsextraktion in 100 Sprachen

Wie schnell liefert die KI-API Entitäten zurück?

Dies hängt von der Größe Ihres Textes und dem verwendeten KI-Modell ab. Im Allgemeinen liegt die Reaktionszeit bei ein paar Sekunden.

Wie lässt sich die Genauigkeit der NER bewerten?

Um die Genauigkeit eines Systems zur Erkennung benannter Entitäten (NER) zu bewerten, werden in der Regel Präzision, Wiedererkennungswert und der F1-Score auf der Grundlage wahrer positiver, falsch positiver und falsch negativer Ergebnisse verwendet. Diese Metriken vergleichen die Ausgabe des Systems mit einem manuell annotierten Goldstandard oder Ground Truth, um zu bestimmen, wie gut das System benannte Entitäten identifiziert und klassifiziert.

Kann ich Ihre NER-API kostenlos testen?

Ja, wie alle Modelle auf NLP Cloud kann auch der NER-API-Endpunkt kostenlos getestet werden.

Wie geht Ihre KI-API mit dem Datenschutz und der Sicherheit während des Entitätsextraktionsprozesses um?

NLP Cloud konzentriert sich auf den Datenschutz: wir protokollieren oder speichern den Inhalt der Anfragen, die Sie an unsere API stellen, nicht. NLP Cloud ist sowohl mit dem HIPAA als auch mit der GDPR konform.