John Doe has been working for the Microsoft company in Seattle since 1999.
Grupurile de substantive reprezintă o caracteristică de bază a procesării limbajului natural. În lingvistică, acestea sunt cunoscute sub numele de "fraze substantivale". În principiu, acestea sunt substantive și toate cuvintele care depind de aceste substantive.
De exemplu, să spunem că aveți următoarea propoziție:
John Doe has been working for the Microsoft company in Seattle since 1999.
Iată bucățile de substantiv din această propoziție:
Cercetătorii de date care lucrează în domeniul prelucrării limbajului natural sunt adesea interesați să efectueze extracția de bucăți de substantive în cadrul activităților lor de cercetare. De asemenea, aceștia au adesea nevoie să extragă automat informații suplimentare, cum ar fi textul rădăcinii, dependența de rădăcină și textul capului rădăcinii.
Noun chunks pot fi, de asemenea, utilizate în situații reale de afaceri, de cele mai multe ori ca o conductă mai mare de procesare a limbajului natural. De exemplu, unele companii folosesc substantive pentru a extrage cuvinte cheie relevante din articole ca parte a unui proces de optimizare a SEO.
NLP Cloud propune un API de tip "noun chunk" care vă permite să efectuați aceste operații din start, pe baza spaCy și Ginza. Extracția noun chunk nu este foarte intensivă din punct de vedere al resurselor, astfel încât timpul de răspuns (latența), atunci când le efectuați din API-ul NLP Cloud, este foarte scăzut. Puteți face acest lucru în 15 limbi diferite.
Pentru mai multe detalii, consultați documentația noastră despre extracția de bucăți de substantive aici.