John Doe has been working for the Microsoft company in Seattle since 1999.
Daiktavardžių dalys yra pagrindinė natūralios kalbos apdorojimo funkcija. Lingvistikoje jie vadinami daiktavardžių frazėmis. Iš esmės tai yra daiktavardžiai ir visi žodžiai, kurie priklauso nuo šių daiktavardžių.
Tarkime, sakinys yra toks:
John Doe has been working for the Microsoft company in Seattle since 1999.
Pateikiame šio sakinio daiktavardžių dalis:
Duomenų mokslininkai, dirbantys natūralios kalbos apdorojimo srityje, dažnai domisi daiktavardžių fragmentų išskyrimu. Jiems taip pat dažnai reikia automatiškai išskirti papildomą informaciją, pavyzdžiui, šaknies tekstą, šaknies priklausomybę ir šaknies galvos tekstą.
Daiktavardžių gabalėlius taip pat galima naudoti realiose verslo situacijose, dažniausiai kaip didesnį natūralios kalbos apdorojimo vamzdyną. Pavyzdžiui, kai kurios įmonės daiktavardžių skiemenis naudoja atitinkamiems raktažodžiams iš straipsnių išgauti kaip SEO vamzdyno dalį.
"NLP Cloud" siūlo daiktavardžių dalių API, kuri leidžia atlikti šias operacijas iškart, remiantis "spaCy" ir "Ginza". Daiktavardžių dalių išskyrimas nereikalauja daug išteklių, todėl atsako laikas (uždelsimas), atliekant šias operacijas iš NLP Cloud API, yra labai mažas. Galite tai atlikti 15 skirtingų kalbų.
Daugiau informacijos rasite mūsų dokumentuose apie daiktavardžių fragmentų išskyrimą čia.