John Doe has been working for the Microsoft company in Seattle since 1999.
Фрагменти іменників - це основна особливість обробки природної мови. У лінгвістиці вони відомі як "іменникові фрази". В основному це іменники та всі слова, які залежать від цих іменників.
Наприклад, припустимо, у вас є таке речення:
John Doe has been working for the Microsoft company in Seattle since 1999.
Ось фрагменти іменників з цього речення:
Data scientists, які працюють над обробкою природної мови, часто зацікавлені у вилученні фрагментів іменників у своїй дослідницькій діяльності. Вони також часто потребують автоматичного вилучення додаткової інформації, наприклад, кореневого тексту, кореневих залежностей і кореневого тексту.
Фрагменти іменників також можна використовувати в реальних бізнес-ситуаціях, здебільшого як більший конвеєр обробки природної мови. Наприклад, деякі компанії використовують фрагменти іменників для вилучення релевантних ключових слів зі статей як частину конвеєра SEO.
NLP Cloud пропонує API іменникових фрагментів, який дозволяє виконувати ці операції "з коробки", на основі spaCy та Ginza. Виділення іменникових фрагментів не є дуже ресурсоємним, тому час відгуку (затримка) при виконанні їх з API NLP Cloud дуже низький. Ви можете робити це на 15 різних мовах.
Докладнішу інформацію можна знайти в нашій документації про вилучення іменникових фрагментів тут..