John Doe has been working for the Microsoft company in Seattle since 1999.
Lietvārdu gabali ir dabiskās valodas apstrādes pamatīpašība. Lingvistikā tos dēvē par lietvārdu frāzēm. Pamatā tie ir lietvārdi un visi vārdi, kas atkarīgi no šiem lietvārdiem.
Piemēram, pieņemsim, ka ir šāds teikums:
John Doe has been working for the Microsoft company in Seattle since 1999.
Šeit ir šī teikuma lietvārdu daļas:
Datu zinātnieki, kas nodarbojas ar dabiskās valodas apstrādi, savos pētījumos bieži vien ir ieinteresēti veikt lietvārdu gabalu izdalīšanu. Viņiem bieži vien ir nepieciešams automātiski iegūt arī papildu informāciju, piemēram, saknes tekstu, saknes atkarību un saknes galvas tekstu.
Vietniekvārdu gabalus var izmantot arī reālās uzņēmējdarbības situācijās, lielākoties kā lielāku dabiskās valodas apstrādes cauruļvadu. Piemēram, daži uzņēmumi izmanto lietvārdu gabalus, lai iegūtu attiecīgos atslēgvārdus no rakstiem kā daļu no SEO konveijera.
NLP Cloud piedāvā lietvārda chunk API, kas ļauj veikt šīs operācijas, pamatojoties uz spaCy un Ginza. Lietvārda gabalu ekstrakcija nav resursu ietilpīga, tāpēc atbildes laiks (latence), veicot tās no NLP Cloud API, ir ļoti mazs. To var veikt 15 dažādās valodās.
Lai iegūtu sīkāku informāciju, skatiet mūsu dokumentāciju par lietvārdu gabalu ieguvi. šeit.