Návrhář čipů AMD představil nejnovější řadu PCIe karet, které mají provozovatelům AI infrastruktury pomoci zvýšit výpočetní výkon.
Karty Instinct MI350P jsou dvouslotové karty typu drop-in určené pro standardní servery chlazené vzduchem, přičemž uživatelé je mohou jednoduše zařadit do svého stávajícího hardwarového vybavení.
Dostupné v vzduchově chlazených systémech s až osmi akcelerátory, čipový gigant tvrdí, že jeho karty dokáží zvládnout jedny z nejvyšších výkonnostních zátěží pro podnikové PCIe karty — konkrétně až 4 600 vrcholových teraflopů při čtyřbitové plovoucí desetinné čárce s mikroškálováním (MXFP4).
AMD prezentuje zařízení jako další rozšíření svého již bohatého produktového portfolia zaměřeného na AI a tvrdí, že výkonnostní nárůsty MI350P z něj dělají zařízení „ideální pro malé, střední i velké AI modely určené pro inferenci a pipeline systémů pro generování s rozšířeným vyhledáváním (RAG).“
„Karty MI350P PCIe pokrývají celé spektrum úrovní přesnosti, na které podnikové AI modely spoléhají nejvíce,“ napsal Suresh Andani, viceprezident AMD pro oblasti výpočetní techniky a podnikové AI, v příspěvku na blogu. „Nasazení AI neznamená stavět infrastrukturu od základů znovu. S kartami MI350P mohou podniky provozovat více modelů a obsluhovat více uživatelů v rámci svých stávajících datových center.“
Karty PCIe jsou vysokorychlostní rozhraní, která přímo propojují výpočetní komponenty — například grafické procesory (GPU) nebo akcelerátory — se základní deskou serveru nebo centrálním procesorem (CPU). Fungují jako rychlý přímý kanál zabudovaný přímo do serveru, díky čemuž lze přídavné karty vložit do stávajících zařízení bez nutnosti budovat vlastní infrastrukturu. V případě komplexních agenturních AI pracovních zátěží je toto přímé propojení s CPU skutečnou výhodou.
Rozsáhlá akvizice společnosti Xilinx přinesla AMD kontrolu nad zavedenou produktovou řadou PCIe akcelerátorů, kterou se od té doby snaží prosadit nejprve na trhu vysokovýkonného výpočetnictví (HPC) a následně i na trhu podnikové AI.
Softwarový stack společnosti pak uživatelům umožňuje migrovat pracovní zátěže s minimálními změnami v kódu a zároveň rozšiřuje podporu pro nástroje správy životního cyklu, jako je Kubernetes GPU Operator.
„V kombinaci s kartami Instinct MI350P a řešeními dodávanými partnery umožňuje tento stack organizacím rychlý provoz on-premises bez průběžných poplatků za token,“ doplnil Andani.
Karty PCIe od AMD doplňují stávající portfolium infrastrukturních periferií, které bylo posíleno akvizicí výrobce jednotek pro zpracování dat (DPU) Pensando v roce 2022 za 1,9 miliardy dolarů. AMD od té doby nabízí hardwarová řešení zaměřená na odstraňování rostoucích úzkých míst v hyperškálovatelných prostředích, kde pracovní zátěže nabývají na složitosti i rozsahu.
Mezi zákazníky, kteří se již hlásí k nejnovějšímu přírůstku AMD, patří Lenovo, Cisco, Dell Technologies a Hewlett Packard Enterprise (HPE).
Zdroj: datacenterdynamics.com
