AI darba slodžu paātrināšana ar aparatūru

Transcript

Sveiki, šeit ir Julien Salinas no NLP Cloud.

Šajā kursā mēs apskatīsim, kādus aparatūras paātrinātājus šodien varam izmantot, lai paātrinātu secinājumu darba slodzi.

Lai izprastu aparatūras paātrinājumu, ir svarīgi atcerēties, ka mākslīgā intelekta lietojumprogrammas mūsdienās lielākoties ir balstītas uz neironu tīkliem, ko dēvē arī par dziļo mācīšanos.

Matricu reizināšana ir būtiska operācija neironu tīklos, jo tā ļauj tiem apgūt sarežģītus datus un sarežģītas datu reprezentācijas.

Neironu tīklā ieejas dati tiek attēloti ar matricu, un savienojumu starp neironiem svaru arī attēlo ar matricu.

Kad šīs divas matricas tiek reizinātas, rezultāts ir jauna matrica, kas atspoguļo neironu izejas signālu.

Šis process atkārtojas vairākos neironu slāņos, ļaujot tīklam apgūt arvien abstraktākas un sarežģītākas ieejas datu iezīmes.

Matricas ir mākslīgā intelekta modeļu pamatelementi, tāpēc ir svarīgi izmantot aparatūru, kas ļoti labi veic operācijas ar matricām.

Vēl viens svarīgs aspekts ir skaitļi ar peldošo komata punktu.

Peldošā komata vērtība ir svarīga neironu tīklos, jo tā ļauj attēlot daļskaitļa vērtības.

Kā jau tikko minējām, neironu tīkli ietver lielas matricas ar daudziem ierakstiem.

Izmantojot tikai veselu skaitļu vērtības, ātri tiktu pieļautas pārplūdes kļūdas.

Izmantojot vērtības ar peldošo komatu, neironu tīkli var attēlot vērtības ar daudziem cipariem aiz komata, kas ļauj veikt precīzākus aprēķinus un nodrošināt lielāku rezultātu precizitāti.

Tātad, lai efektīvi apstrādātu darba slodzi, mākslīgā intelekta darba slodzi, mums ir nepieciešama aparatūra, kas labi tiek galā ar matricu reizinājumiem un peldošā komata aprēķiniem.

Mašīnmācīšanās darba slodzēm šodien varat izmantot divus galvenos variantus - CPU un GPU.

Procesors jeb centrālais procesors ir vispārējas nozīmes procesors, kas datorsistēmā veic dažādus uzdevumus, tostarp lietojumprogrammu darbību, operētājsistēmas pārvaldību un matemātiskus aprēķinus.

Procesori ir izstrādāti tā, lai būtu universāli un spētu veikt dažāda veida uzdevumus, taču tie nav optimizēti kādam konkrētam darba slodzes veidam.

GPU jeb grafiskās apstrādes bloks ir specializēts procesors, kas paredzēts sarežģītām paralēlām slodzēm, piemēram, grafikas renderēšanai un mašīnmācīšanai.

GPU ir tūkstošiem mazāku kodolu, kas strādā kopā, lai apstrādātu lielu datu apjomu vienlaicīgi, tādējādi tie ir daudz ātrāki par CPU noteiktiem darba slodžu veidiem.

Matricas operācijas var viegli paralelizēt ar vairākiem maziem kodoliem, tāpēc GPU šajā jomā ir izcils.

Turklāt GPU parasti ir daudz vairāk mainīgā komata vienību nekā CPU, kas ļauj tiem daudz ātrāk veikt operācijas ar peldošo komatu.

Tagad jūs zināt, kāpēc ar procesoru bieži vien nepietiek mūsdienu mākslīgā intelekta slodzēm un kāpēc bieži vien ir ļoti svarīga īpaša aparatūra.

Tagad aplūkosim, kādas ir jūsu izvēles iespējas attiecībā uz konkrētiem aparatūras paātrinātājiem.

NVIDIA GPU ir jaudīgs rīks grafikas apstrādei, un tie piedāvā virkni funkciju, kas padara tos ideāli piemērotus spēļu, mašīnmācīšanās, video montāžas, kā arī dizaina un inženiertehniskajām lietojumprogrammām.

Kā mākslīgā intelekta programmatūras inženierim jums, bez šaubām, būs jāspēlē ar NVIDIA GPU, jo šobrīd tiem ir galvenā vieta GPU tirgū.

2023. gadā jaudīgākās mākslīgā intelekta kartes ir A100 un H100.

AMD piedāvā arī plašu GPU klāstu, tostarp mašīnmācīšanās procesoru.

Viņu RockM produktu klāsts ir interesants, un es aicinu jūs to apskatīt.

Google arī veido savus mākslīgā intelekta mikroshēmas, ko sauc par TPU (TensorFlow Processing Unit).

Uzņēmums izmanto šīs mikroshēmas iekšēji, bet piedāvā tās arī savā Google mākoņa piedāvājumā.

Tomēr TPU nevar iegādāties sev.

TPU darbojas nedaudz savādāk nekā GPU, taču par to tiks veltīts cits video.

Graphcore ir Apvienotajā Karalistē bāzēts uzņēmums, kas ražo īpašu mākslīgā intelekta aparatūru, ko sauc par IPU un kas ir ekvivalents Google TPU.

Varat gan iegādāties IPU, gan izmantot tos mākonī, izmantojot kādu no partneriem.

AWS veido savas mākslīgā intelekta mikroshēmas.

Viņiem ir mikroshēma, kas veltīta secinājumiem un ko sauc par Inferentia, un vēl viena, kas veltīta apmācībai un ko sauc par Tranium.

Šīs mikroshēmas ir salīdzinoši lētas.

Šādas mikroshēmas nevar iegādāties sev, taču tās var izmantot AWS EC2 vai Sage Maker.

Uzņēmums Intel ir izveidojis arī savu mākslīgā intelekta mikroshēmu ar nosaukumu Habana Gaudi, kas ir ļoti jaudīga, bet ļoti dārga alternatīva.

Aparatūras paātrinātāji ir jaudīgi, bet arī ļoti dārgi un nav viegli iegādājami, jo pasaulē trūkst pusvadītāju.

Tāpēc ir saprātīgi strādāt pie AI slodzes optimizācijas, lai to varētu palaist uz mazākas aparatūras.

Daudzās situācijās procesori var būt pat piemērots risinājums daudzām mašīnmācīšanās darba slodzēm.

Kā redzams, 2023. gadā NVIDIA ir de facto risinājums, kad runa ir par aparatūras paātrinājumu mākslīgā intelekta un mašīnmācīšanās jomā.

Taču interesanti, ka parādās dažas alternatīvas.

Tāpēc, iespējams, pēc pāris gadiem nākamajos mākslīgā intelekta projektos jūs, iespējams, izmantosiet cita veida paātrinātājus.

Es ceru, ka šis kurss bija noderīgs, un novēlu jums patīkamu dienu.

AI darba slodžu paātrināšana ar aparatūru

Summary

Transcript