无名氏是谷歌的一名网络开发人员。
NER 是命名实体识别(Named Entity Recognition)的缩写。它是一项子任务,包括识别文本中的命名实体并将其归入预定义的类别,例如人名、组织名称、地点、时间表达、数量、货币价值、百分比等。
生成模型,如 GPT-5、GPT-OSS 120B、LLaMA 3、Yi 34B 或 Mixtral 8x7B,在进行实体提取方面非常出色。
NER 对许多 NLP 应用(如问题解答、文本摘要和机器翻译)至关重要,因为它能提供有关文本关键要素的详细信息,从而加深理解和处理。例如,如果知道 "巴黎 "指的是给定文本中的一个地点,就会对该文本的解释和 NLP 系统生成的反应产生重大影响。
比方说,你有下面这个句子:
无名氏是谷歌的一名网络开发人员。
您希望自动检测到 "无名氏 "是一个名字,"网络开发人员 "是一个职位,而 "谷歌 "是一家公司。这正是 NER 要做的事情。

世界充满了非结构化数据,尤其是网络。如果能从中提取结构化信息,就能获取大量有价值的信息。下面是几个例子。
在处理大量客户请求(支持、销售......)时,应用 NER 绝对有助于对这些传入请求进行自动分类。例如,您可以自动提取请求中提到的产品类型,并相应地将其路由到正确的服务。
提取和整合财务数据是一项漫长而乏味的工作。NER 可以帮助您在一秒钟内提取正确的数据,从而显著提高您的工作效率。
人力资源服务部门有时很难读懂所有这些申请。对他们来说,自动突出显示公司名称、技能等有趣的实体以节省时间,可能会很有趣。
许多 B2B 线索都可以在公共网站或公司宣传册上找到,但手动提取有时会很麻烦。多亏了 NER,您可以自动提取个人及其职位和公司(如果存在的话)。
NLP Cloud 提供实体提取应用程序接口(API),可基于 spaCy、Ginza 或更先进的生成式人工智能模型(相当于 GPT-5 或 GPT-4),如 GPT-OSS 120B、LLaMA 3、Dolphin、Yi 34B、Mixtral 8x7B 等,执行开箱即用的命名实体识别(Named Entity Recognition)功能。对于特定文档的高级实体提取,我们建议在 NLP Cloud 上微调您自己的 NER 生成模型。
更多详情,请参阅我们的实体提取文档 这里. 有关高级用法,请参阅文本生成 API 端点 这里. 轻松测试实体提取 在我们的操场上。
在本地测试 NER 是一回事,但在生产中可靠地使用它又是另一回事。有了 NLP Cloud,您就可以同时做到这两点!