Sissejuhatus NLP Cloud API-sse Pythoni kliendi abil

NLP Cloud on API, mis muudab loomuliku keeletöötluse kasutamise tootmises lihtsaks. API põhineb parimatel avatud lähtekoodiga eeltreenitud mudelitel. Võite kasutada ka oma mudeleid või treenida mudeleid platvormil. NLP Cloud kõige tekstimõistmise ja teksti genereerimise funktsioonidest: entiteetide ekstraheerimine (NER), sentimentaalanalüüs, teksti klassifitseerimine, teksti kokkuvõtete tegemine, küsimustele vastamine, tekstide genereerimine ja kõne osa (POS) märgistamine... ja veel palju muudki!

API on saadaval tasuta kuni 3 päringut minutis, mis on hea viis kvaliteedi lihtsaks testimiseks. mudelite kvaliteeti. Seejärel maksavad esimesed tasulised plaanid 29 dollarit kuus (15 päringu eest minutis).

Vaatame, kuidas kasutada API-d selles õpetuses.

Miks NLP Cloud?

Tehisintellekti mudelite kasutuselevõtt tootmisse on sagedane projekti ebaõnnestumise allikas. Loomuliku keele töötlemise mudelid on väga ressurssirohked intensiivsed ja nende mudelite kõrge kättesaadavuse tagamine tootmises, samas on hea reageerimisvõime reageerimisaeg, on väljakutse. Selleks on vaja kallist infrastruktuuri ja arenenud DevOps-, programmeerimis- ja AI-teenuseid. oskusi.

NLP Cloudi eesmärk on aidata ettevõtetel oma mudeleid kiiresti ja ilma kompromissideta tootmises kasutada. kvaliteedis ja taskukohaste hindadega.

Konto loomine

Registreerimine on väga kiire. Lihtsalt külastage registreerimist lehekülg ja täitke oma e-posti aadress + parool (registreeru siin).

Registreeru NLP Cloudis

Nüüd olete oma armatuurlaual ja näete oma API-tokenit. Hoidke seda tokenit turvaliselt, seda on teile vaja kõikide API-kutsete jaoks, mida teete.

Teie armatuurlaual on mitu koodilõiku, et saaksite kiiresti kiirendada. Sest rohkem üksikasju, saate seejärel lugeda dokumentatsiooni (vaata dokumentatsiooni siit).

NLP Cloud dokumentatsioon

NLP Cloud API kliendiliibid

NLP Cloud pakub teile valmisvarustuses enamikku tüüpilisi loomuliku keele töötlemise funktsioone, kas tänu sellele, et eeltreenitud spaCy või Hugging Face mudelitele või laadides üles omaenda spaCy mudelid.

Selleks, et API-d oleks lihtne kasutada, pakub NLP Cloud kliendikirjastikke mitmes keeles. (Python, Ruby, PHP, Go, Node.js). Selle õpetuse ülejäänud osas kasutame Pythoni liba.

Kasutage PIP-i, et paigaldada Python lib:

pip install nlpcloud

Entiteetide eraldamine (NER)

Entiteetide väljavõtmine toimub spaCy kaudu. Kõik spaCy "suured" eeltreenitud mudelid on saadaval, mis see tähendab, et 15 keelt on saadaval (rohkem üksikasju kõigi nende mudelite kohta spaCy kodulehel). Samuti saate üles laadida kohandatud ise väljatöötatud spacy mudelid, et neid tootmises kasutada. Kui see on see, mida soovite, minge lihtsalt oma armatuurlaual jaotisesse "Custom Models" (kohandatud mudelid):

Laadige üles kohandatud loodusliku keele töötlemise mudelid

Kujutame nüüd ette, et soovite eraldada üksusi lausest "John Doe on töötanud Microsoft in Seattle from 1999." tänu eelnevalt treenitud spaCy mudelile inglise keele jaoks ("en_core_web_lg"). Järgnevalt peaksite toimima järgmiselt:

import nlpcloud

client = nlpcloud.Client("en_core_web_lg", "")
client.entities("John Doe has been working for Microsoft in Seattle since 1999.")

See tagastab iga väljavõetud üksuse sisu ja selle positsiooni lauses.

Sentimentaalne analüüs

Sentimentanalüüs saavutatakse tänu Hugging Face'i transformaatoritele ja Distilbert Base Uncased Finetuned SST 2 English. Siin on üks näide:

import nlpcloud

client = nlpcloud.Client("distilbert-base-uncased-finetuned-sst-2-english", "")
client.sentiment("NLP Cloud proposes an amazing service!")

See ütleb teile, kas üldine meeleolu selles tekstis on pigem positiivne või negatiivne, ja selle tõenäosus.

Teksti klassifitseerimine

Teksti klassifitseerimine saavutatakse tänu Hugging Face transformaatoritele ja Facebook's Bart Large MNLI. Siin on üks näide:

import nlpcloud

client = nlpcloud.Client("bart-large-mnli", "")
client.classification("""John Doe is a Go Developer at Google. 
    He has been working there for 10 years and has been 
    awarded employee of the year.""",
    ["job", "nature", "space"],
    True)

Nagu näete, edastame tekstiploki, mida püüame klassifitseerida, koos võimalike kategooriatega. Viimane argument on boolean, mis määrab, kas saab kasutada ühte või mitut kategooriat.

See tagastab iga kategooria tõenäosuse.

Teksti kokkuvõtete tegemine

Teksti kokkuvõte saavutatakse tänu Hugging Face transformaatoritele ja Facebook's Bart Large CNN. Siin on üks näide:

import nlpcloud

client = nlpcloud.Client("bart-large-cnn", "")
client.summarization("""The tower is 324 metres (1,063 ft) tall, 
about the same height as an 81-storey building, and the tallest structure in Paris. 
Its base is square, measuring 125 metres (410 ft) on each side. During its construction, 
the Eiffel Tower surpassed the Washington Monument to become the tallest man-made 
structure in the world, a title it held for 41 years until the Chrysler Building 
in New York City was finished in 1930. It was the first structure to reach a 
height of 300 metres. Due to the addition of a broadcasting aerial at the top of 
the tower in 1957, it is now taller than the Chrysler Building by 5.2 metres (17 ft). 
Excluding transmitters, the Eiffel Tower is the second tallest free-standing structure 
in France after the Millau Viaduct.""")

See tagastab kokkuvõtte ülaltoodust. See on "abstraktne" kokkuvõte, mitte "ekstraktne". mis tähendab, et võidakse genereerida uusi lauseid ja mitteolulised laused eemaldatakse. Siiski mitteolulised laused eemaldatakse loomulikult.

Küsimustele vastamine

Küsimustele vastamine saavutatakse tänu kallistavate näotransformaatorite ja Deepset's Roberta Base Squad 2. Siin on näide:

import nlpcloud

client = nlpcloud.Client("roberta-base-squad2", "")
client.question("""French president Emmanuel Macron said the country was at war
    with an invisible, elusive enemy, and the measures were unprecedented,
    but circumstances demanded them.""",
    "Who is the French president?")

Siin on tegemist küsimusele vastamisega tänu kontekstile.

Näiteks tagastab ülaltoodud näide "Emmanuel Macron".

Kõneosade märgistamine (POS)

Part-Of-Speech tagging saavutatakse tänu samadele spaCy-mudelitele, mida kasutati üksuste väljavõtte tegemiseks. Nii et näiteks kui soovite kasutada inglise keele eeltreenitud mudelit, siis tuleb teha järgmist:

import nlpcloud

client = nlpcloud.Client("en_core_web_lg", "")
client.dependencies("John Doe is a Go Developer at Google")

See tagastab lause iga sõnaosa ja selle sõltuvuse teistest märgenditest.

Kokkuvõte

NLP Cloud on loomuliku keeletöötluse API, mida on lihtne kasutada ja mis aitab teil tootmises palju aega kokku hoida.

Saadaval on rohkem mudeleid, nagu tõlkimine, keele tuvastamine, teksti genereerimine... Ja palju muud.

Pange tähele, et kriitiliste jõudlusvajaduste puhul on pakutud ka GPU-kavasid.

Loodan, et see artikkel oli mõnele teist kasulik! Kui teil on mõni küsimus, palun ärge kartke, et mulle teada.

Julien Salinas
NLP Cloud tehnoloogiajuht

Sissejuhatus NLP Cloud APIsse

8. juuni 2021