John Doe has been working for the Microsoft company in Seattle since 1999.
Nomenikogumid on loomulikus keeletöötluses üks põhijoontest. Neid tuntakse keeleteaduses "nimisõnafraasidena". Põhimõtteliselt on need kõik nimisõnad ja kõik sõnad, mis sõltuvad nendest nimisõnadest.
Oletame näiteks, et teil on järgmine lause:
John Doe has been working for the Microsoft company in Seattle since 1999.
Siin on selle lause substantiiviühendid:
Loomuliku keeletöötlusega tegelevad andmeteadlased on oma uurimistegevuses sageli huvitatud substantiiviüksuste väljavõttest. Samuti on neil sageli vaja automaatselt ekstraheerida lisateavet, nagu juurte tekst, juurte sõltuvus ja juurte päisteksti.
Nomenikomplekte saab kasutada ka reaalsetes ärisituatsioonides, enamasti suurema loomuliku keele töötlemise torustikuna. Näiteks kasutavad mõned ettevõtted noomenikomplekte artiklite asjakohaste märksõnade väljavõtmiseks SEO-putke osana.
NLP Cloud pakub välja nomen chunk API, mis võimaldab neid operatsioone teha spaCy ja Ginza põhjal. Nomen chunk'ide ekstraheerimine ei ole väga ressursimahukas, seega on vastamisaeg (latentsus) nende teostamisel NLP Cloud API-st väga väike. Seda saab teha 15 erinevas keeles.
Lisateavet leiate meie dokumentatsioonist nimisõnade väljavõtte kohta. siin.