Το NLP Cloud είναι ένα API που διευκολύνει τη χρήση της επεξεργασίας φυσικής γλώσσας στην παραγωγή. Το API βασίζεται στα καλύτερα ανοικτού κώδικα προ-εκπαιδευμένα μοντέλα. Μπορείτε επίσης να χρησιμοποιήσετε τα δικά σας μοντέλα ή να εκπαιδεύσετε μοντέλα στην πλατφόρμα. NLP Cloud περισσότερα από τα χαρακτηριστικά κατανόησης κειμένου και παραγωγής κειμένου: εξαγωγή οντοτήτων (NER), ανάλυση συναισθήματος, ταξινόμηση κειμένου, σύνοψη κειμένου, απάντηση ερωτήσεων, παραγωγή κειμένου και Part-of-speech (POS) tagging... και πολλά άλλα!
Το API είναι διαθέσιμο δωρεάν μέχρι 3 αιτήσεις ανά λεπτό, γεγονός που αποτελεί έναν καλό τρόπο για να δοκιμάσετε εύκολα την ποιότητα των μοντέλων. Στη συνέχεια, τα πρώτα πληρωμένα πακέτα κοστίζουν 29 δολάρια το μήνα (για 15 αιτήσεις ανά λεπτό).
Ας δούμε πώς να χρησιμοποιήσουμε το API σε αυτό το σεμινάριο.
Η ανάπτυξη μοντέλων τεχνητής νοημοσύνης στην παραγωγή αποτελεί συχνή πηγή αποτυχίας έργων. Τα μοντέλα Επεξεργασίας Φυσικής Γλώσσας είναι πολύ έντασης, και η εξασφάλιση υψηλής διαθεσιμότητας αυτών των μοντέλων στην παραγωγή, με ταυτόχρονη καλή απόκριση χρόνους απόκρισης, αποτελεί πρόκληση. Χρειάζεται και ακριβή υποδομή και προηγμένα DevOps, προγραμματισμός και AI δεξιότητες.
Στόχος του NLP Cloud είναι να βοηθήσει τις εταιρείες να αξιοποιήσουν γρήγορα τα μοντέλα τους στην παραγωγή, χωρίς κανένα συμβιβασμό. στην ποιότητα, και σε προσιτές τιμές.
Η εγγραφή είναι πολύ γρήγορη. Απλά επισκεφθείτε την εγγραφή σελίδα και συμπληρώστε το email σας + κωδικό πρόσβασης (εγγραφείτε εδώ).

Τώρα βρίσκεστε στο ταμπλό σας και μπορείτε να δείτε το κουπόνι API σας. Φυλάξτε αυτό το token με ασφάλεια, θα το χρειαστείτε για όλες τις κλήσεις API που θα πραγματοποιήσετε.
Στο ταμπλό σας παρέχονται διάφορα αποσπάσματα κώδικα για να μπορέσετε να αναπτύξετε γρήγορα την ταχύτητά σας. Για το περισσότερες λεπτομέρειες, μπορείτε στη συνέχεια να διαβάσετε το τεκμηρίωση (δείτε την τεκμηρίωση εδώ).

Το NLP Cloud σας παρέχει, out-of-the-box, τα περισσότερα από τα τυπικά χαρακτηριστικά της Επεξεργασίας Φυσικής Γλώσσας, είτε χάρη σε προ-εκπαιδευμένα μοντέλα spaCy ή Hugging Face, είτε ανεβάζοντας τα δικά σας μοντέλα spaCy.
Για να είναι εύκολη η χρήση του API, το NLP Cloud σας παρέχει βιβλιοθήκες-πελάτες σε διάφορες γλώσσες. (Python, Ruby, PHP, Go, Node.js). Στο υπόλοιπο αυτού του σεμιναρίου, θα χρησιμοποιήσουμε τη βιβλιοθήκη Python.
Χρησιμοποιήστε το PIP για να εγκαταστήσετε την Python lib:
pip install nlpcloud
Η εξαγωγή οντοτήτων γίνεται μέσω του spaCy. Όλα τα "μεγάλα" προ-εκπαιδευμένα μοντέλα του spaCy είναι διαθέσιμα, τα οποία σημαίνει ότι είναι διαθέσιμες 15 γλώσσες (περισσότερες λεπτομέρειες για όλα αυτά τα μοντέλα στην ιστοσελίδα της spaCy). Μπορείτε επίσης να ανεβάσετε προσαρμοσμένα εσωτερικά μοντέλα spaCy που αναπτύξατε μόνοι σας για να τα χρησιμοποιήσετε στην παραγωγή. Αν αυτό είναι που θέλετε, απλώς μεταβείτε στην ενότητα "Custom Models" (Προσαρμοσμένα μοντέλα) στο ταμπλό σας:
Τώρα ας φανταστούμε ότι θέλετε να εξάγετε οντότητες από την πρόταση "Ο άγνωστος εργάζεται για Microsoft στο Σιάτλ από το 1999." χάρη στο προ-εκπαιδευμένο μοντέλο spaCy για την αγγλική γλώσσα ("en_core_web_lg"). Ακούστε πώς πρέπει να προχωρήσετε:
import nlpcloud
client = nlpcloud.Client("en_core_web_lg", "")
client.entities("John Doe has been working for Microsoft in Seattle since 1999.")
Θα επιστρέψει το περιεχόμενο κάθε εξαγόμενης οντότητας και τη θέση της στην πρόταση.
Η ανάλυση συναισθήματος επιτυγχάνεται χάρη στους μετασχηματιστές Hugging Face και Distilbert Base Uncased Finetuned SST 2 English. Ακολουθεί ένα παράδειγμα:
import nlpcloud
client = nlpcloud.Client("distilbert-base-uncased-finetuned-sst-2-english", "")
client.sentiment("NLP Cloud proposes an amazing service!")
Θα σας πει αν το γενικό συναίσθημα σε αυτό το κείμενο είναι μάλλον θετικό ή αρνητικό, και η πιθανότητα.
Η ταξινόμηση κειμένου επιτυγχάνεται χάρη στους μετασχηματιστές Hugging Face και Facebook's Bart Large MNLI. Ακολουθεί ένα παράδειγμα:
import nlpcloud
client = nlpcloud.Client("bart-large-mnli", "")
client.classification("""John Doe is a Go Developer at Google.
He has been working there for 10 years and has been
awarded employee of the year.""",
["job", "nature", "space"],
True)
Όπως μπορείτε να δείτε, περνάμε ένα μπλοκ κειμένου που προσπαθούμε να ταξινομήσουμε, μαζί με πιθανές κατηγορίες. Το τελευταίο όρισμα είναι ένα boolean που ορίζει αν μπορεί να εφαρμοστεί μία μόνο κατηγορία ή περισσότερες.
Θα επιστρέψει την πιθανότητα για κάθε κατηγορία.
Η περίληψη κειμένου επιτυγχάνεται χάρη στους μετασχηματιστές Hugging Face και Facebook's Bart Large CNN. Ακολουθεί ένα παράδειγμα:
import nlpcloud
client = nlpcloud.Client("bart-large-cnn", "")
client.summarization("""The tower is 324 metres (1,063 ft) tall,
about the same height as an 81-storey building, and the tallest structure in Paris.
Its base is square, measuring 125 metres (410 ft) on each side. During its construction,
the Eiffel Tower surpassed the Washington Monument to become the tallest man-made
structure in the world, a title it held for 41 years until the Chrysler Building
in New York City was finished in 1930. It was the first structure to reach a
height of 300 metres. Due to the addition of a broadcasting aerial at the top of
the tower in 1957, it is now taller than the Chrysler Building by 5.2 metres (17 ft).
Excluding transmitters, the Eiffel Tower is the second tallest free-standing structure
in France after the Millau Viaduct.""")
Θα επιστρέψει μια σύνοψη των παραπάνω. Πρόκειται για μια "αφαιρετική" περίληψη και όχι για μια "εκχυλιστική". που σημαίνει ότι μπορεί να δημιουργηθούν νέες προτάσεις και να αφαιρεθούν μη σημαντικές. Ωστόσο οι μη ουσιώδεις προτάσεις αφαιρούνται φυσικά.
Η απάντηση των ερωτήσεων επιτυγχάνεται χάρη στους μετασχηματιστές Hugging Face και Deepset's Roberta Base Squad 2. Εδώ είναι ένα παράδειγμα:
import nlpcloud
client = nlpcloud.Client("roberta-base-squad2", "")
client.question("""French president Emmanuel Macron said the country was at war
with an invisible, elusive enemy, and the measures were unprecedented,
but circumstances demanded them.""",
"Who is the French president?")
Εδώ πρόκειται για την απάντηση σε μια ερώτηση χάρη σε ένα πλαίσιο.
Για παράδειγμα, το παραπάνω παράδειγμα θα επιστρέψει "Emmanuel Macron".
Η επισήμανση μέρους του λόγου επιτυγχάνεται χάρη στα ίδια μοντέλα spaCy που χρησιμοποιούνται για την εξαγωγή οντοτήτων. Έτσι, για παράδειγμα, αν θέλετε να χρησιμοποιήσετε το αγγλικό προ-εκπαιδευμένο μοντέλο, θα πρέπει να κάνετε τα εξής:
import nlpcloud
client = nlpcloud.Client("en_core_web_lg", "")
client.dependencies("John Doe is a Go Developer at Google")
Θα επιστρέψει το μέρος του λόγου κάθε συμβόλου στην πρόταση, καθώς και την εξάρτησή του από άλλα συμβόλαια.
Το NLP Cloud είναι ένα API για την επεξεργασία φυσικής γλώσσας που είναι εύκολο στη χρήση και σας βοηθά να εξοικονομήσετε πολύ χρόνο στην παραγωγή.
Διατίθενται περισσότερα μοντέλα, όπως μετάφραση, ανίχνευση γλώσσας, παραγωγή κειμένου... Και πολλά άλλα.
Σημειώστε επίσης ότι, για κρίσιμες ανάγκες επιδόσεων, προτείνονται επίσης σχέδια GPU.
Ελπίζω αυτό το άρθρο να ήταν χρήσιμο σε κάποιους από εσάς! Αν έχετε οποιαδήποτε ερώτηση, παρακαλώ μη διστάσετε να με ενημερώσετε να ξέρω.
Julien Salinas
CTO στο NLP Cloud