NLP Cloud is an API for natural language processing.
Încorporările sunt reprezentări vectoriale ale unor fragmente de text. Dacă 2 bucăți de text au o reprezentare vectorială similară, înseamnă, cel mai probabil, că au un înțeles similar.
Imaginați-vă că aveți următoarele 3 propoziții:
NLP Cloud is an API for natural language processing.
NLP Cloud proposes an API dedicated to NLP at scale.
I went to the cinema yesterday. It was great!
Iată incluziunile din cele 3 propoziții de mai sus (trunchiate pentru simplificare):
[[0.0927242711186409,-0.19866740703582764,-0.013638739474117756,-0.11876793205738068,0.011521861888468266,-0.03629707545042038, -0.030676838010549545,-0.03159608319401741,0.021390020847320557,0.03344911336898804,0.1698218137025833,-0.0009996045846492052, -0.07465217262506485,-0.21483412384986877,0.11283198744058609,0.03549865633249283,0.04985387250781059,-0.027558118104934692, 0.06297887861728668,0.09421529620885849,0.03700404614210129,0.06565431505441666,0.02284885197877884,0.06327767670154572, -0.09266531467437744,-0.014569456689059734,-0.06129194051027298,0.1818675994873047,0.09628438949584961,-0.09874546527862549, 0.030865425243973732, [...] ,-0.02097163535654545,0.021617714315652847,0.11045169830322266,0.01000999379903078,0.11451057344675064,0.18813028931617737, 0.007419265806674957,0.1630171686410904,0.21308083832263947,-0.03355317562818527,0.0778832957148552,0.2268853485584259,-0.13271427154541016, 0.005264544393867254,0.16081497073173523,0.09937280416488647,-0.12673905491828918,-0.12035898119211197,-0.06462062895298004, -0.0024213052820414305,0.08730605989694595,-0.04702030122280121,-0.03694896399974823,0.002265638206154108,-0.027780283242464066, -0.00017151003703474998,-0.20887477695941925,-0.2585527300834656,0.3124837279319763,0.05403835326433182,0.027094876393675804, -0.022925367578864098,0.038322173058986664]]
Încorporările sunt o caracteristică de bază a procesării limbajului natural, deoarece, odată ce o mașină este capabilă să detecteze similitudini între texte, aceasta deschide calea pentru multe aplicații interesante, cum ar fi similaritatea semantică, sistemele RAG (retrieval augmented generation), căutarea semantică, detectarea parafrazelor, gruparea și multe altele.
Iată câteva exemple în care încorporările sunt extrem de utile:
S-ar putea să doriți să detectați dacă două propoziții se referă la același lucru sau nu. Acest lucru este util pentru detectarea parafrazei (plagiatului), de exemplu. De asemenea, este util pentru a înțelege dacă mai multe persoane vorbesc sau nu despre același subiect.
Căutarea semantică este un mod modern de căutare a informațiilor. În loc să căutați în mod naiv texte care conțin cuvinte-cheie specifice, acum puteți căuta texte care vorbesc despre un subiect care vă interesează, chiar dacă cuvintele-cheie nu se potrivesc (în cazul sinonimelor, de exemplu).
Poate doriți să grupați lucrurile pe categorii (idei, discursuri, conversații...). Gruparea este o tehnică veche de învățare automată care poate fi acum aplicată în mod eficient la procesarea limbajului natural.
Sistemele RAG (Retrieval Augmented Generation) sunt un tip de model de procesare a limbajului natural care generează text prin combinarea capacităților unui model de limbaj la scară largă cu o componentă de recuperare care extrage informații relevante dintr-o bază de date sau dintr-un corpus de texte. Această abordare permite generarea unor răspunsuri mai precise, mai informative și mai relevante din punct de vedere contextual prin valorificarea surselor externe de cunoștințe.
NLP Cloud propune un API de încorporări care vă oferă posibilitatea de a extrage încorporări din start, pe baza modelelor de transformare a sentințelor precum Paraphrase Multilingual Mpnet Base v2.
Timpul de răspuns (latența) este foarte scăzut pentru modelele de încorporare, ceea ce vă permite să includeți cu ușurință extracția de încorporări într-un flux de lucru mai mare și mai complex.
Pentru mai multe detalii, consultați documentația noastră despre încorporări. aici.
Testarea încorporărilor la nivel local este un lucru, dar utilizarea lor fiabilă în producție este altceva. Cu NLP Cloud le puteți face pe amândouă!