Természetes nyelvfeldolgozás Bevezetés: mi az a természetes nyelvfeldolgozás (NLP)?

Hallottál már a természetes nyelvi feldolgozásról (NLP), de nem tudod, hogy mi is ez pontosan, és mit jelent a természetes nyelvi feldolgozás. mire használják? Ebben a bejegyzésben néhány példával próbálok segíteni a Természetes Nyelvfeldolgozás megértésében.

Mi az a természetes nyelvi feldolgozás (NLP)?

A természetes nyelvfeldolgozás a nyelvészet, az informatika és a mesterséges intelligencia egyik részterülete. Ez a feldolgozás a nyelv, a szavak és a beszéd számítógép általi feldolgozása.

A számítógépek és az emberi nyelv közötti interakciók fejlesztéséről szól, és különösen arról, hogy hogyan lehet a számítógépek programozása nagy mennyiségű természetes nyelvi adat feldolgozására és elemzésére.

Ne kövesse el ezt a hibát: A természetes nyelvfeldolgozás nem csak nyelvészet! A nyelvészet célja az idegen nyelvek megértése szoftverek segítségével.

A természetes nyelvi feldolgozás szabályokon alapul. A szabályok azonban nem elegendőek: a kontextus is nagyon fontos. Amikor egy barátod azt mondja neked: « What a wonderful spring! », Az évszak vagy a víz miatt van ? Itt van egy másik példa: « I go to the bank. ». A folyó partján való sétálásról van szó, vagy arról, hogy pénzt viszünk a bankba?

A természetes nyelvi feldolgozáshoz tehát sok szabályra és szótárra van szükség.

A kontextus a kulcs a természetes nyelvi feldolgozásban

Mire való a természetes nyelvi feldolgozás?

A természetes nyelvi feldolgozásnak köszönhetően egy gép képes "megérteni" a dokumentumok tartalmát, beleértve a kontextuális árnyalatokat is. a bennük lévő nyelvi kifejezéseket. A gép képes a dokumentumokban található információk és meglátások kinyerésére is. valamint kategorizálni és rendszerezni a dokumentumokat.

A természetes nyelvfeldolgozással kapcsolatos kihívások gyakran a beszédfelismerés, a természetes nyelvi megértés (NLU) és a természetes nyelvi generálás (NLG).

Miért érdekes a természetes nyelvi feldolgozás?

A világ tele van strukturálatlan adatokkal (azaz nem gépek számára formázott adatokkal). a digitális adatok 70-90%-át. A természetes nyelvi feldolgozás kiválóan alkalmas arra, hogy feldolgozzuk ezeket a hatalmas adatmennyiségeket.

" 2025-re a mesterséges intelligencia az ügyfélkapcsolatok 95%-át fogja működtetni."

Gartner

A vállalatok számára a természetes nyelvfeldolgozás egy módja annak, hogy automatizált módon megismerjék ügyfeleiket és új lehetőségeket teremtsenek. (jobb ismeretek, jobb célzás,...).

Természetes nyelvi feldolgozás felhasználási esetek

Íme néhány tipikus természetes nyelvfeldolgozási felhasználási eset:

A természetes nyelvi feldolgozás nem újdonság!

A 2. világháború idején Alan Turing létrehozott egy gépet a nácik által küldött kódolt üzenetek megértésére, a Turing-gépet.

Turing-gép

Később a Georgetown-IBM kísérlet volt a gépi fordítás befolyásos demonstrációja, amelyet 1954. január 7-én hajtottak végre. A Georgetown Egyetem és az IBM által közösen kifejlesztett kísérlet során több mint hatvan orosz mondat teljesen automatikus fordítását végezték angolra. Mindössze hat nyelvtani szabályt és 250 lexikai elemet tartalmazott a szókincs.

Egy másik érdekes mérföldkő volt az ELIZA szoftver, amelyet 1966-ban az MIT Mesterséges Intelligencia Laboratóriumában Joseph Weizenbaum fejlesztett ki. A leghíresebb szkript, a DOCTOR egy pszichoterapeutát szimulált, és a szkriptben diktált szabályok segítségével nem irányított kérdésekkel válaszolt a felhasználói bejegyzésekre. Mint ilyen, az ELIZA volt az egyik első chatbot és az egyik első olyan program, amely képes volt megkísérelni a Turing-tesztet.

Következtetés

Ebben a bejegyzésben megtudhatta, mi a természetes nyelvi feldolgozás, és hogyan használható a való életben. Még mindig sok a kihívás, de az elmúlt években nagy előrelépés történt a természetes nyelvfeldolgozás területén. Napjainkban a természetes nyelvfeldolgozás érettsége egyre több vállalatot ösztönöz arra, hogy a természetes nyelvfeldolgozást a termékükben vagy a belső szervezetükben.

Sylvie Krupsky
CMO az NLP Cloud-nál