Kā izveidot tērzēšanas robotu, izmantojot ģeneratīvos modeļus, piemēram, GPT-4, ChatGPT, LLaMA 3 un Mixtral 8x7b

Pieprasījumam pēc sarunvalodas mākslīgā intelekta arvien pieaugot, pieaug arī nepieciešamība pēc progresīvām tērzēšanas robotu tehnoloģijām, kas spēj nodrošināt personalizētu, cilvēkam līdzīgu mijiedarbību. Pēdējos gados tādi ģeneratīvie modeļi kā GPT-4 un ChatGPT, kā arī atvērtā koda alternatīvas, piemēram, LLaMA 3 un Mixtral 8x7b, ir kļuvuši par daudzsološiem rīkiem tērzēšanas robotu izveidei, kas spēj saprast un reaģēt uz dabiskās valodas ievaddatiem ar vēl nebijušu precizitāti un izsmalcinātību.

Šajā rakstā aplūkosim ģeneratīvo modeļu pamatus un to, kā tos var izmantot tērzēšanas robotu izveidē.

Čatbots un sarunvalodas mākslīgais intelekts

LLaMA 3 un Mixtral 8x7b: atvērtā koda alternatīvas ChatGPT un GPT-4

ChatGPT un GPT-4 ir divi uzlaboti valodas modeļi, ko izstrādājusi OpenAI. ChatGPT (saīsinājums no "Chat Generative Pre-training Transformer") ir liels valodas modelis, kas var ģenerēt cilvēkam līdzīgu tekstu, pamatojoties uz mācību datiem. Tas tika ieviests 2022. gada novembrī un ātri ieguva plašu ievērību, jo spēja sarunāties ar lietotājiem, atbildot uz jautājumiem, sniedzot informāciju un iesaistoties dažādu uzdevumu veikšanā.

GPT-4 jeb "Generative Pre-training Transformer 4" ir GPT-3 pēctece, un OpenAI par to paziņoja 2023. gada martā. Tas ir ievērojams lēciens mākslīgā intelekta valodas modeļu jomā, jo salīdzinājumā ar saviem priekšgājējiem var lepoties ar vēl lielāku izmēru un uzlabotām iespējām. GPT-4 spēj ģenerēt ļoti detalizētu un precīzu tekstu dažādās jomās, tostarp dabiskās valodas apstrādē, datorprogrammēšanā un radošajā rakstniecībā.

Gan ChatGPT, gan GPT-4 ir apmācīti, izmantojot milzīgu datu apjomu, izmantojot neuzraudzītu mācīšanos, kas ļauj tiem saprast un ģenerēt cilvēku valodu ar ievērojamu precizitāti un plūdumu. Šie modeļi ir pavēruši jaunas iespējas sarunvalodas mākslīgā intelekta, satura ģenerēšanas un dažādu citu lietojumu izstrādē tādās nozarēs kā klientu apkalpošana, izglītība un izklaide.

Neilgi pēc tam Meta izlaida LLaMA 3, bet Francijas mākslīgā intelekta jaunuzņēmums Mistral AI izdeva Mixtral 8x7b. Šie ģeneratīvie modeļi ir atvērtā koda alternatīvas ChatGPT un GPT-4. Tie ir ļoti labi kandidāti, ja vēlaties izveidot uzlabotu tērzēšanas robotu. Varat vai nu izvietot LLaMA 3 un Mixtral savos serveros, vai arī viegli izmantot tos, izmantojot NLP Cloud API.

Tomēr visiem šiem ģeneratīvajiem mākslīgā intelekta LLM ir nepieciešama neliela prakse. Pirmkārt, tāpēc, ka šiem modeļiem ir jādod pareizie pamudinājumi, lai tie uzvestos, kā paredzēts. Un arī tāpēc, ka tie ir "bezstāvokļa" modeļi, proti, tie neuztur jūsu sarunu vēsturi.

Pareiza uzvedņa izmantošana jūsu čatbotam

Ja jūs naivi nosūtīsiet pieprasījumus šiem modeļiem, neiedziļinoties kontekstā un neveicot formatēšanu, atbildes būs neapmierinošas. Tas ir tāpēc, ka šie modeļi ir ļoti daudzpusīgi. Ar to palīdzību var ne tikai izveidot tērzēšanas robotus, bet arī daudzus citus lietojumus, piemēram, jautājumu atbildēšanu, kopsavilkumu veidošanu, pārfrāzēšanu, klasifikāciju, būtību ieguvi, produktu aprakstu ģenerēšanu un daudz ko citu. Tātad pirmā lieta, kas jums ir jādara, ir jāpasaka modelim, kāds "režīms" viņam ir jāpieņem.

Šeit ir pieprasījuma piemērs, ko varētu nosūtīt:

This is a discussion between a [human] and an [ai]. 
The [ai] is very nice and empathetic.

[human]: I broke up with my girlfriend...
[robot]:

Šajā piemērā var atzīmēt 2 lietas.

Vispirms mēs pievienojām vienkāršu formatējumu, lai modelis saprastu, ka tas atrodas sarunu režīmā: ([human], [ai], ...).

Otrkārt, mēs pievienojām nedaudz konteksta augšpusē, lai palīdzētu modelim saprast, ko tas dara un kāds tonis tam ir jālieto.:

Lai šo procesu padarītu vienkāršāku, gan OpenAI, gan NLP Cloud piedāvā īpašus tērzēšanas robotu API galapunktus, kas parūpēsies par šo formatēšanu jūsu vietā.

Dažreiz ar kontekstu nepietiek. Piemēram, iedomājieties, ka vēlaties izveidot tērzēšanas robotu ar ļoti specifisku toni un raksturu. Tādā gadījumā jūs vēlaties precīzi pielāgot savu ģeneratīvo modeli. Savu tērzēšanas robotu, kura pamatā ir ģeneratīvais mākslīgais intelekts, varat precizēt OpenAI un NLP Cloud.

Cits scenārijs ir, ja vēlaties izveidot tērzēšanas robotu, kas atbild uz jautājumiem par specifiskām zināšanām konkrētajā jomā. Šādā gadījumā smalka pielāgošana nav risinājums. Tā vietā jūs vēlaties izveidot savu izguves paplašināto ģenerēšanas (RAG) sistēmu, kas balstīta uz semantisko meklēšanu. Skatiet mūsu speciālo rakstu par RAG un semantisko meklēšanu šeit.

Tavam čatbotam paredzētās sarunu vēstures uzturēšana

Ģeneratīvie mākslīgā intelekta modeļi ir "bezstāvokļa" modeļi, kas nozīmē, ka katrs jūsu pieprasījums ir jauns un mākslīgais intelekts neatceras neko par iepriekšējiem pieprasījumiem.

Daudzos lietošanas gadījumos tā nav problēma (kopsavilkums, klasifikācija, pārfrāzēšana...), bet attiecībā uz tērzēšanas robotiem tā noteikti ir problēma, jo mēs vēlamies, lai mūsu tērzēšanas robots iegaumētu diskusijas vēsturi, lai sniegtu atbilstošākas atbildes.

Piemēram, ja mākslīgajam intelektam sakāt, ka esat programmētājs, vēlaties, lai tas to saglabā atmiņā, jo tas ietekmēs turpmākās atbildes, ko tas sniegs.

Vislabākais veids, kā to panākt, ir saglabāt katru AI atbildi vietējā datubāzē. Piemēram, PostgreSQL datubāze atbalsta garu tekstu glabāšanu ar ļoti labu efektivitāti.

Tad katru reizi, kad tērzēšanas robotam tiek veikts jauns pieprasījums, ir jāveic šādas darbības:

1. Sarunu vēstures atgūšana no vietējās datubāzes
2. Pievienojiet savu faktisko pieprasījumu sarunu vēsturei
3. Nosūtīt visu pieprasījumu
4. Vietējā datubāzē nomainiet veco vēsturi ar AI atbildi.

Šī ir gan daudzpusīga, gan izturīga sistēma, kas neprasa lielas pūles un lieliski izmanto tādu ģeneratīvo modeļu kā GPT-4, ChatGPT, LLaMA 3 un Mixtral iespējas.

Ir svarīgi atzīmēt, ka katram modelim ir savs konteksta lielums, kas nosaka, cik daudz teksta var nodot vēsturei. Piemēram, pašreizējais GPT-4 konteksta lielums ir 8 k žetonu (t. i., vairāk vai mazāk nekā 7 k vārdu), bet pašreizējais konteksta lielums modelī Mixtral 8x7b ir 16 k žetonu NLP Cloud (t. i., vairāk vai mazāk nekā 14 k vārdu). Tāpēc, ja jūsu sarunu vēsture pārsniedz šo apjomu, iespējams, vēlēsieties vai nu saīsināt vecāko vēstures daļu, vai saglabāt tikai svarīgākās diskusiju daļas.

Satura ierobežojumi čatbotam

OpenAI ir ieviesusi satura ierobežojumus ChatGPT un GPT-4, lai nodrošinātu, ka mākslīgā intelekta ģenerētais teksts atbilst tās vadlīnijām. Uzraugot un regulējot tērzēšanas robotu ģenerēto saturu, OpenAI mērķis ir radīt pozitīvāku un uzticamāku lietotāju pieredzi. Tas ietver informācijas pieprasījumu par noteiktām tēmām bloķēšanu vai tikai iepriekš pārbaudītas, uzticamas informācijas sniegšanu.

Tomēr daži dod priekšroku ģeneratīvajiem modeļiem, kuriem nav šādu ierobežojumu, un uzskata, ka atbilžu kvalitāte ir daudzveidīgāka un precīzāka. LLaMA 3 un Mixtral 8x7b nav šādu ierobežojumu. Izmantojot šādus mākslīgā intelekta modeļus, izstrādātāja atbildība ir atbildīgi izmantot mākslīgo intelektu. Ja nepieciešams, ierobežojumus joprojām var ieviest, izveidojot čatbotam piemērotu uzvedni, precīzi pielāgojot savu čatbotu vai filtrējot lietotāja pieprasījumus, pirms tie sasniedz AI modeli.

Secinājums

Tādi ģeneratīvā mākslīgā intelekta modeļi kā GPT-4, ChatGPT, LLaMA 3 un Mixtral 8x7b patiešām pacēla tērzēšanas robotus un sarunu mākslīgo intelektu nākamajā līmenī. Šie uzlabotie modeļi ļoti labi izprot kontekstu un pielāgojas tam. Vairumā gadījumu pietiek ar pareiza konteksta iestatīšanu, bet progresīviem lietošanas gadījumiem labākais risinājums ir apmācīt/precizēt savu AI modeli (kas ir diezgan vienkārši, jo šiem modeļiem ir nepieciešamas ļoti mazas datu kopas).

Izmantojot NLP Cloud, varat izmēģināt LLaMA 3 un Mixtral 8x7b, kā arī citus modeļus. Varat arī tos precizēt un ar vienu klikšķi izvietot savus privātos ģeneratīvos mākslīgā intelekta modeļus. Ja tas vēl nav izdarīts, izmēģiniet NLP mākoni bez maksas.

Ja jums ir jautājumi par to, kā ieviest savu tērzēšanas robotu, lūdzu, sazinieties ar mums!

François
NLP Cloud pilnas paketes inženieris