AMD představuje kartu MI350 PCIe pro urychlení podnikových AI pracovních zátěží

AMD představuje kartu MI350 PCIe pro urychlení podnikových AI pracovních zátěží

Návrhář čipů AMD představil nejnovější řadu PCIe karet, které mají provozovatelům AI infrastruktury pomoci zvýšit výpočetní výkon.

Karty Instinct MI350P jsou dvouslotové karty typu drop-in určené pro standardní servery chlazené vzduchem, přičemž uživatelé je mohou jednoduše zařadit do svého stávajícího hardwarového vybavení.

Dostupné v vzduchově chlazených systémech s až osmi akcelerátory, čipový gigant tvrdí, že jeho karty dokáží zvládnout jedny z nejvyšších výkonnostních zátěží pro podnikové PCIe karty — konkrétně až 4 600 vrcholových teraflopů při čtyřbitové plovoucí desetinné čárce s mikroškálováním (MXFP4).

AMD prezentuje zařízení jako další rozšíření svého již bohatého produktového portfolia zaměřeného na AI a tvrdí, že výkonnostní nárůsty MI350P z něj dělají zařízení „ideální pro malé, střední i velké AI modely určené pro inferenci a pipeline systémů pro generování s rozšířeným vyhledáváním (RAG).“

„Karty MI350P PCIe pokrývají celé spektrum úrovní přesnosti, na které podnikové AI modely spoléhají nejvíce,“ napsal Suresh Andani, viceprezident AMD pro oblasti výpočetní techniky a podnikové AI, v příspěvku na blogu. „Nasazení AI neznamená stavět infrastrukturu od základů znovu. S kartami MI350P mohou podniky provozovat více modelů a obsluhovat více uživatelů v rámci svých stávajících datových center.“

Karty PCIe jsou vysokorychlostní rozhraní, která přímo propojují výpočetní komponenty — například grafické procesory (GPU) nebo akcelerátory — se základní deskou serveru nebo centrálním procesorem (CPU). Fungují jako rychlý přímý kanál zabudovaný přímo do serveru, díky čemuž lze přídavné karty vložit do stávajících zařízení bez nutnosti budovat vlastní infrastrukturu. V případě komplexních agenturních AI pracovních zátěží je toto přímé propojení s CPU skutečnou výhodou.

Rozsáhlá akvizice společnosti Xilinx přinesla AMD kontrolu nad zavedenou produktovou řadou PCIe akcelerátorů, kterou se od té doby snaží prosadit nejprve na trhu vysokovýkonného výpočetnictví (HPC) a následně i na trhu podnikové AI.

Softwarový stack společnosti pak uživatelům umožňuje migrovat pracovní zátěže s minimálními změnami v kódu a zároveň rozšiřuje podporu pro nástroje správy životního cyklu, jako je Kubernetes GPU Operator.

„V kombinaci s kartami Instinct MI350P a řešeními dodávanými partnery umožňuje tento stack organizacím rychlý provoz on-premises bez průběžných poplatků za token,“ doplnil Andani.

Karty PCIe od AMD doplňují stávající portfolium infrastrukturních periferií, které bylo posíleno akvizicí výrobce jednotek pro zpracování dat (DPU) Pensando v roce 2022 za 1,9 miliardy dolarů. AMD od té doby nabízí hardwarová řešení zaměřená na odstraňování rostoucích úzkých míst v hyperškálovatelných prostředích, kde pracovní zátěže nabývají na složitosti i rozsahu.

Mezi zákazníky, kteří se již hlásí k nejnovějšímu přírůstku AMD, patří Lenovo, Cisco, Dell Technologies a Hewlett Packard Enterprise (HPE).

Zdroj: datacenterdynamics.com

Související články

Leave a Comment