John Doe has been working for the Microsoft company in Seattle since 1999.
Substantiivikokonaisuudet ovat luonnollisen kielen prosessoinnin keskeinen ominaisuus. Kielitieteessä ne tunnetaan nimellä "substantiivilauseet". Periaatteessa ne koostuvat substantiiveista ja kaikista sanoista, jotka riippuvat näistä substantiiveista.
Sanotaan esimerkiksi, että sinulla on seuraava lause:
John Doe has been working for the Microsoft company in Seattle since 1999.
Tässä ovat tämän lauseen substantiivikappaleet:
Luonnollisen kielen käsittelyn parissa työskentelevät tietojenkäsittelytieteilijät ovat usein kiinnostuneita substantiivikappaleiden poimimisesta tutkimustyössään. Heidän on usein myös automaattisesti poimittava lisätietoa, kuten juuritekstiä, juuririippuvuutta ja juuripäätekstiä.
Substantiivikokonaisuuksia voidaan käyttää myös todellisissa liiketoimintatilanteissa, useimmiten laajempana luonnollisen kielen käsittelyputkena. Esimerkiksi jotkut yritykset käyttävät substantiivikokonaisuuksia poimimaan merkityksellisiä avainsanoja artikkeleista osana SEO-putkea.
NLP Cloud tarjoaa spaCyyn ja Ginzaan perustuvan noun chunk API:n, jonka avulla voit suorittaa nämä operaatiot suoraan laatikosta. Substantiivikappaleiden louhinta ei ole kovin resurssi-intensiivistä, joten vasteaika (latenssi) on hyvin pieni, kun ne suoritetaan NLP Cloudin API:sta. Voit tehdä sen 15 eri kielellä.
Lisätietoja on dokumentaatiossamme substantiivikappaleiden louhinnasta. täällä.