John Doe is a Go developer at Google.
Part-of-Speech-taggerin tavoitteena on määrittää tekstin jokaiselle merkille puhekieliset osat. Merkki on useimmiten sana, mutta se voi olla myös välimerkki, kuten "," "." ";" jne. Loppujen lopuksi POS-tagger kertoo, onko merkki substantiivi, verbi, adjektiivi jne. Koska kielen rakenteet eroavat radikaalisti kielestä toiseen, hyvien POS-taggerien on sopeuduttava kuhunkin kieleen. Joitakin kieliä on paljon vaikeampi analysoida kuin toisia.
Sanotaan, että sinulla on seuraava lause:
John Doe is a Go developer at Google.
POS-tunnisteen antaja palauttaa seuraavan tuloksen:
Riippuvuusjäsennys on luonnollisen kielen prosessoinnissa (Natural Language Processing, NLP) käytetty tekniikka, jolla analysoidaan lauseen kieliopillista rakennetta. Se auttaa ymmärtämään, miten lauseen sanat liittyvät toisiinsa. Tämä saavutetaan tunnistamalla sanojen väliset riippuvuudet eli merkitsemällä, miten sanat riippuvat toisistaan merkityksen antamiseksi.
Riippuvuusanalyysin ydinajatus on rakentaa riippuvuuspuu (tai graafi), jossa solmut edustavat lauseen sanoja ja reunat näiden sanojen välisiä suhteita. Riippuvuuspuun jokaiseen reunaan merkitään, minkä tyyppinen kieliopillinen suhde on yhdistettyjen sanojen välillä, kuten subjekti, objekti, modifioija jne. Puun juurena on yleensä pääverbi tai päälauseke, johon muut sanat liittyvät.
Luonnollisen kielen prosessoinnin parissa työskentelevät tietojenkäsittelytieteilijät ovat usein kiinnostuneita suorittamaan Part-Of-Speech -merkintöjä tutkimustyössään. Heidän on myös usein analysoitava automaattisesti riippuvuuksia (yhdyssanat, nominaaliset subjektit, deterministit...).
Riippuvuuksien jäsentäminen on ratkaisevan tärkeää erilaisissa NLP-tehtävissä, kuten konekääntämisessä, tiedon louhinnassa, kysymysten vastaamisessa ja tunneanalyysissä, koska lauseiden syntaktisen rakenteen ymmärtäminen voi parantaa merkittävästi näiden sovellusten tarkkuutta ja tehokkuutta. Riippuvuusjäsennyksen avulla algoritmit voivat ymmärtää lauseiden merkityksen tarkemmin ymmärtämällä, miten lauseen osat (subjektit, predikaatit, objektit jne.) liittyvät toisiinsa.
NLP Cloud tarjoaa puheosien merkitsemiseen ja riippuvuuksien jäsentämiseen tarkoitetun API:n, jonka avulla voit suorittaa tämän toiminnon suoraan spaCy- ja GiNZA-ohjelmiin perustuen. Part-Of-Speech-taggaus ja riippuvuuksien jäsentäminen eivät ole kovin resurssi-intensiivisiä, joten vasteaika (latenssi) on hyvin pieni, kun ne suoritetaan NLP Cloudin API:n kautta. Voit tehdä sen 15 eri kielellä.
Lisätietoja on dokumentaatiossamme Part-Of-Speech-merkinnöistä ja riippuvuuksien jäsentelystä. täällä.