생성형 AI를 사용한 명명된 엔티티 인식(NER) API

NER이란 무엇인가요?

NER은 명명된 엔티티 인식의 약자입니다. 텍스트의 명명된 개체를 사람, 조직, 위치, 시간, 수량, 화폐 가치, 백분율 등의 사전 정의된 카테고리로 식별하고 분류하는 하위 작업입니다.

GPT-5, GPT-OSS 120B, LLaMA 3, Yi 34B 또는 Mixtral 8x7B와 같은 생성 모델은 엔티티 추출을 매우 잘 수행합니다.

NER은 텍스트의 핵심 요소에 대한 자세한 정보를 제공하여 더 깊은 이해와 처리를 가능하게 하므로 질문 답변, 텍스트 요약, 기계 번역과 같은 많은 NLP 애플리케이션에 매우 중요합니다. 예를 들어, '파리'가 특정 텍스트의 위치를 가리킨다는 것을 알면 해당 텍스트의 해석과 NLP 시스템에서 생성되는 응답에 상당한 영향을 미칠 수 있습니다.

다음과 같은 문장이 있다고 가정해 보겠습니다:

John Doe는 Google의 웹 개발자입니다.

'신원 미상'은 이름, '웹 개발자'는 직책, 'Google'은 회사라는 것을 자동으로 감지하고 싶다고 가정해 보세요. 이것이 바로 NER이 할 일입니다.

NER 주석

일부 엔티티 추출 사용 사례

세상은 비정형 데이터, 특히 웹으로 가득 차 있습니다. 이로부터 정형화된 정보를 추출할 수 있다면 많은 가치 있는 정보에 접근할 수 있습니다. 다음은 몇 가지 예시입니다.

고객 요청 정렬

많은 고객 요청(지원, 판매 등)을 처리할 때 이러한 수신 요청을 자동으로 분류하기 위해 NER을 적용하는 것은 확실히 도움이 됩니다. 예를 들어 요청에 언급된 제품 유형을 자동으로 추출하고 그에 따라 적절한 서비스로 라우팅할 수 있습니다.

재무 데이터 추출

재무 데이터를 추출하고 통합하는 작업은 길고 지루할 수 있습니다. NER은 순식간에 올바른 데이터를 추출할 수 있도록 도와줌으로써 생산성을 확실히 향상시킬 수 있습니다.

이력서/지원서 사전 처리

HR 서비스는 때때로 이러한 모든 지원서를 읽는 데 어려움을 겪습니다. 시간을 절약하기 위해 회사 이름, 기술 등과 같은 흥미로운 항목을 자동으로 강조 표시하는 기능이 있다면 흥미로울 수 있습니다.

리드 추출

많은 B2B 리드는 공개 웹사이트나 회사 브로셔에서 찾을 수 있지만, 수동으로 추출하는 것은 때때로 번거로울 수 있습니다. NER을 사용하면 직책과 회사가 존재하는 경우 자동으로 사람을 추출할 수 있습니다.

NLP Cloud의 NER API

NLP Cloud는 스파시, 긴자 또는 GPT-OSS 120B, LLaMA 3, Dolphin, Yi 34B, Mixtral 8x7B 등과 같이 GPT-5 또는 GPT-4에 해당하는 고급 생성 AI 모델을 기반으로 네임 엔티티 인식을 바로 수행할 수 있는 엔티티 추출 API를 제안합니다. 특정 문서에 대한 고급 엔티티 추출을 위해서는 NLP Cloud의 NER에 대한 자체 생성 모델을 미세 조정하는 것이 좋습니다.

자세한 내용은 엔티티 추출에 대한 문서를 참조하세요. 여기. 고급 사용법은 텍스트 생성 API 엔드포인트를 참조하세요. 여기. 엔티티 추출을 쉽게 테스트 놀이터에서

로컬에서 NER을 테스트하는 것과 프로덕션 환경에서 안정적으로 사용하는 것은 별개의 문제입니다. NLP Cloud를 사용하면 두 가지를 모두 할 수 있습니다!

NER 체험하기
무료

자주 묻는 질문

네임드 엔티티 인식(NER)이란 무엇인가요?

명명된 개체 인식(NER)은 정보 추출의 하위 작업으로 텍스트의 명명된 개체를 사람, 조직, 위치, 시간, 수량, 화폐 가치, 백분율 등의 사전 정의된 카테고리로 식별하고 분류하는 작업입니다. 정보 검색, 질문 답변 시스템, 지식 추출에 사용되는 기본적인 자연어 처리(NLP) 기술입니다.

NER에서 사용되는 일반적인 카테고리는 무엇인가요?

명명된 개체 인식(NER)에 사용되는 일반적인 범주에는 사람 이름, 조직, 위치, 날짜, 시간, 화폐 가치, 백분율 및 수량이 포함됩니다. 이러한 범주는 정보 추출 및 분석을 위해 텍스트의 주요 요소를 식별하고 분류하는 데 도움이 됩니다.

최신 NER 시스템은 언어의 모호함과 복잡한 구조를 어떻게 처리할까요?

최신 명명된 개체 인식(NER) 시스템은 고급 머신러닝 알고리즘, 특히 순환 신경망(RNN) 및 트랜스포머와 같은 딥러닝 아키텍처를 활용하여 텍스트 내의 문맥과 의미 관계를 분석함으로써 모호성과 복잡한 언어 구조를 관리할 수 있습니다. 방대한 양의 주석이 달린 학습 데이터와 사전 학습된 언어 모델을 활용하여 모호하거나 복잡한 구조가 있는 경우에도 엔티티를 정확하게 예측합니다.

NER 시스템이 새롭거나 알려지지 않은 엔티티를 인식할 수 있나요?

NER(명명된 개체 인식) 시스템은 주로 학습된 개체를 인식하지만, 새롭거나 알려지지 않은 개체를 인식하는 능력은 학습 데이터의 일반성과 알고리즘의 적응력에 따라 달라집니다. 특히 딥 러닝과 문맥 이해를 사용하는 일부 고급 시스템은 엔티티가 나타나는 문맥에서 학습하여 이전에 볼 수 없었던 엔티티를 추론하거나 일반화하여 식별할 수 있습니다. NLP Cloud에서는 새롭거나 알려지지 않은 엔티티를 완벽하게 인식할 수 있습니다!

AI API는 엔티티 추출을 위해 어떤 언어를 지원하나요?

100개 언어로 엔티티 추출을 지원합니다.

AI API는 엔티티를 얼마나 빨리 반환하나요?

텍스트의 크기와 사용 중인 AI 모델에 따라 다릅니다. 일반적으로 응답 시간은 몇 초 정도입니다.

NER의 정확도는 어떻게 평가하나요?

명명된 개체 인식(NER) 시스템의 정확도를 평가하기 위해 일반적으로 정확도, 리콜, 정탐, 오탐, 오탐을 기준으로 한 F1 점수를 사용합니다. 이러한 메트릭은 시스템의 결과물을 수동으로 주석을 단 표준 또는 근거 자료와 비교하여 시스템이 명명된 엔티티를 얼마나 잘 식별하고 분류하는지 판단합니다.

NER API를 무료로 사용해 볼 수 있나요?

예, NLP Cloud의 모든 모델과 마찬가지로 NER API 엔드포인트는 무료로 테스트할 수 있습니다.

AI API는 엔티티 추출 과정에서 데이터 프라이버시 및 보안을 어떻게 처리하나요?

NLP Cloud는 데이터 개인정보 보호에 중점을 두고 설계되어 사용자가 API에서 요청하는 내용을 기록하거나 저장하지 않습니다. NLP Cloud는 HIPAA 및 GDPR을 모두 준수합니다.