Accelerare hardware pentru sarcinile de lucru AI

Transcript

Bună ziua tuturor, sunt Julien Salinas de la NLP Cloud.

În acest curs, vom vedea ce fel de acceleratoare hardware putem folosi în prezent pentru a accelera sarcinile de lucru de inferență.

Pentru a înțelege accelerarea hardware, este important să ne amintim că, în prezent, aplicațiile de inteligență artificială se bazează în principal pe rețele neuronale, cunoscute și sub numele de învățare profundă.

Înmulțirea matricelor este o operație esențială în rețelele neuronale, deoarece le permite să învețe date complexe și reprezentări complexe ale datelor.

Într-o rețea neuronală, datele de intrare sunt reprezentate de o matrice, iar ponderile conexiunilor dintre neuroni sunt, de asemenea, reprezentate de o matrice.

Când aceste două matrici sunt înmulțite, rezultatul este o nouă matrice care reprezintă ieșirea neuronilor.

Acest proces se repetă prin mai multe straturi de neuroni, permițând rețelei să învețe caracteristici din ce în ce mai abstracte și mai complexe ale datelor de intrare.

Matricele sunt componente de bază ale modelelor de inteligență artificială, așa că este important să se utilizeze un hardware care să se priceapă foarte bine la efectuarea de operații pe matrici.

Un alt aspect important este reprezentat de numerele cu virgulă mobilă.

Punctele flotante sunt importante în rețelele neuronale deoarece permit reprezentarea valorilor fracționare.

După cum tocmai am spus, rețelele neuronale implică matrici mari cu multe intrări.

Utilizarea doar a valorilor întregi ar duce rapid la erori de depășire a limitei.

Prin utilizarea valorilor în virgulă mobilă, rețelele neuronale pot reprezenta valori cu multe zecimale, permițând calcule mai precise și o mai mare acuratețe a rezultatelor.

Deci, pe scurt, pentru a procesa eficient sarcinile de lucru, sarcini de lucru de inteligență artificială, avem nevoie de hardware care să se descurce bine cu înmulțirile matriciale și calculele în virgulă mobilă.

Cele două opțiuni principale pe care le puteți lua în considerare în prezent pentru sarcinile de învățare automată sunt procesoarele și GPU-urile.

Un CPU, sau unitatea centrală de procesare, este un procesor de uz general care gestionează o gamă largă de sarcini într-un sistem informatic, inclusiv rularea aplicațiilor, gestionarea sistemului de operare și efectuarea calculelor matematice.

Unitățile centrale de procesare sunt concepute pentru a fi versatile și pot gestiona multe tipuri de sarcini, dar nu sunt optimizate pentru un anumit tip de sarcină de lucru.

Un GPU, sau unitate de procesare grafică, este un procesor specializat care este conceput pentru a gestiona sarcini de lucru complexe și paralele, cum ar fi redarea grafică și învățarea automată.

GPU-urile au mii de nuclee mai mici care lucrează împreună pentru a gestiona cantități mari de date în același timp, ceea ce le face mult mai rapide decât procesoarele pentru anumite tipuri de sarcini de lucru.

Operațiile matriciale pot fi ușor de paralelizat pe mai multe nuclee mici, motiv pentru care GPU-urile excelează în acest domeniu.

De asemenea, GPU-urile au, de obicei, mult mai multe unități de virgulă mobilă decât procesoarele, ceea ce le permite să efectueze operații cu virgulă mobilă mult mai rapid.

Acum știți de ce un procesor nu este suficient pentru sarcinile de lucru actuale ale inteligenței artificiale și de ce un hardware specific este adesea foarte important.

Acum, să trecem la alegerile pe care le aveți atunci când vine vorba de acceleratoare hardware specifice.

GPU-urile NVIDIA sunt un instrument puternic pentru procesarea grafică și oferă o gamă de caracteristici care le fac ideale pentru jocuri, învățare automată, editare video și aplicații de proiectare și inginerie.

În calitate de inginer de software de inteligență artificială, nu există nicio îndoială că va trebui să vă jucați cu GPU-urile NVIDIA, deoarece acestea ocupă o poziție centrală pe piața GPU din prezent.

Cele mai puternice carduri pentru inteligența artificială din 2023 sunt A100 și H100.

AMD oferă, de asemenea, o gamă largă de GPU-uri, inclusiv pentru învățare automată.

Gama lor de produse RockM este interesantă și vă invit să o consultați.

De asemenea, Google își construiește propriile cipuri de inteligență artificială, numite TPU (TensorFlow Processing Unit).

Ei folosesc aceste cipuri la nivel intern, dar le propun și în oferta Google Cloud.

Cu toate acestea, nu puteți achiziționa un TPU pentru dumneavoastră.

TPU-urile funcționează puțin diferit față de GPU-uri, dar acesta va fi un subiect pentru un alt videoclip dedicat.

Graphcore este o companie cu sediul în Marea Britanie care produce un hardware specific de inteligență artificială numit IPU, echivalent cu TPU-urile Google.

Puteți achiziționa IPU sau le puteți utiliza în cloud prin intermediul unuia dintre partenerii lor.

AWS își construiește propriile cipuri de inteligență artificială.

Ei au un cip dedicat inferenței, numit Inferentia, și un altul dedicat antrenamentului, numit Tranium.

Aceste cipuri sunt relativ ieftine.

Nu puteți achiziționa astfel de cipuri pentru dvs., dar le puteți utiliza pe AWS EC2 sau Sage Maker.

De asemenea, Intel și-a construit propriul cip de inteligență artificială, numit Habana Gaudi, care este o alternativă foarte puternică, dar foarte scumpă.

Acceleratoarele hardware sunt puternice, dar și foarte scumpe și greu de achiziționat din cauza lipsei de semiconductori la nivel mondial.

Prin urmare, acesta este motivul pentru care este înțelept să lucrați la optimizarea cât mai mult posibil a volumului de lucru AI pentru ca acesta să ruleze pe un hardware mai mic.

În multe situații, procesoarele pot fi chiar o opțiune decentă pentru multe sarcini de lucru de învățare automată.

După cum puteți vedea în acest moment, în 2023, NVIDIA este soluția de facto când vine vorba de accelerarea hardware în AI și învățare automată.

Dar, în mod interesant, apar unele alternative.

Așa că, poate că peste câțiva ani, pentru următoarele proiecte de inteligență artificială, veți folosi alte tipuri de acceleratoare.

Sper că acest curs v-a fost util și vă doresc o zi plăcută.

Accelerare hardware pentru sarcinile de lucru AI

Summary

Transcript