Cu provocările tot mai mari în ceea ce privește puterea, cerințele de decarbonizare și cele de inteligență artificială (AI), suntem acum într-un moment crucial pentru un efort colectiv în găsirea de soluții care să ne modeleze viitorul, iar Vertiv este în fruntea soluționării acestor probleme. Odată cu creșterea inteligenței artificiale, centrele de date se confruntă cu nevoia de a echilibra cerințele lor de energie cu cele pentru sustenabilitatea mediului.
Inteligența artificială (AI) este aici și este aici pentru a rămâne. „Fiecare industrie va deveni o industrie tehnologică”, potrivit fondatorului și CEO-ului NVIDIA, Jensen Huang. Cazurile de utilizare pentru AI sunt practic nelimitate, de la descoperiri în medicină până la prevenirea de înaltă precizie a fraudei. AI ne transformă deja viața, așa cum transformă fiecare industrie. De asemenea, începe să transforme fundamental infrastructura centrului de date.
Volumul de lucru AI generează schimbări semnificative în modul în care alimentam și răcim datele procesate ca parte a calculului de înaltă performanță (HPC). Un rack IT tipic este folosit pentru a rula sarcini de lucru de la 5-10 kilowați (kW), iar rack-urile care rulează sarcini mai mari de 20 kW au fost considerate de înaltă densitate – fiind rar întâlnite în afara aplicațiilor foarte specifice cu o acoperire limitată. IT-ul este accelerat cu GPU-uri pentru a susține nevoile de procesare ale modelelor AI, iar aceste cipuri AI pot necesita de aproximativ cinci ori mai multă putere și de cinci ori mai multă capacitate de răcire pentru același spațiu cu un server tradițional. Mark Zuckerberg a anunțat că până la sfârșitul anului 2024, Meta va cheltui miliarde pentru a implementa 350.000 de GPU-uri H100 de la NVIDIA. Densitățile rack-urilor de 40 kW per rack sunt acum o cerință minimă în ceea ce privește necesarul pentru facilitarea implementărilor AI, densitățile rack-urilor care depășesc 100 kW per rack devenind obișnuite și pe scară largă în viitorul apropiat.
Acest lucru va necesita creșteri extinse de capacitate pe întregul lanț de putere, de la rețea la cipurile din fiecare rack. Introducerea tehnologiilor de răcire cu lichid în spațiul camerelor de servere al centrului de date va fi o cerință pentru majoritatea implementărilor, deoarece metodele tradiționale de răcire nu vor mai putea gestiona căldura generată de GPU-urile care procesează calcule AI. Investițiile pentru modernizarea infrastructurii necesare pentru alimentarea și răcirea hardware-ului AI sunt substanțiale, iar abordarea acestor noi provocări de proiectare este esențială.
Tranziția la densitate mare
Tranziția către procesarea accelerată nu se va întâmpla peste noapte. Proiectanții și consultanții centrelor de date și ai sălilor de servere trebuie să caute modalități de a face infrastructura de alimentare și de răcire pregătită pentru viitor, ținând cont de creșterea viitoare a sarcinilor lor de lucru. Obținerea energiei suficiente pentru fiecare rack necesită upgrade-uri de la rețea și pînă la rack. În special în spațiul ce găzduiește echipamentele ITC, acest lucru înseamnă probabil busway-uri cu amperaj ridicat și PDU-uri rack de înaltă densitate. Pentru a evacua cantitatea masivă de căldură generată de hardware-ul care rulează sarcini de lucru AI, două tehnologii de răcire cu lichid apar ca opțiuni principale:
– Răcire cu lichid direct pe cip: Plăci metalice prin care circulă lichidul sunt așezate deasupra componentelor generatoare de căldură (de obicei cipuri, cum ar fi procesoarele și GPU-urile) pentru a extrage căldura. Fluidul preia căldura din placa metalică pentru a o trimite în afara centrului de date, schimbând căldura, dar nu fluidele, cu cipul. Acest lucru poate elimina aproximativ 70-75% din căldura generată de echipamentele din rack, lăsând încă 25-30% ce trebuie eliminată de către sistemele de răcire clasice.
– Schimbătoare de căldură prin ușa din spate: Schimbătoarele de căldură pasive sau active înlocuiesc ușa din spate a rack-ului IT cu serpentine de schimb de căldură prin care fluidul absoarbe căldura produsă în rack. Aceste sisteme sunt adesea combinate cu alte sisteme de răcire, fie ca strategie de păstrare a neutralității încăperii, fie ca un design de tranziție premergător răcirii cu lichid.
În timp ce răcirea cu lichid direct pe chip oferă o capacitate de răcire cu densitate semnificativ mai mare decât aerul, este important de reținut că încă există căldură în exces pe care plăcile metalice montate pe cipuri nu o pot capta. Această căldură va fi eliminată în camera de date, cu excepția cazului în care este captată și îndepărtată prin alte mijloace, cum ar fi schimbătoarele de căldură din ușa din spate sau răcirea clasică cu aer.
Kituri de pornire AI pentru modernizare și construcții noi
Puterea și răcirea devin părți integrante din design-ul soluțiilor IT pentru camerele de date, estompând granițele dintre echipele IT și echipele facilităților. Acest lucru adaugă un grad ridicat de complexitate atunci când vine vorba de proiectare, implementare și operare. Parteneriatele și expertiza cu soluții complete se clasează drept cerințe de top pentru tranziția fără probleme la densități mai mari.
Pentru a simplifica trecerea la densitate mare, Vertiv a introdus o gamă de modele optimizate, inclusiv tehnologia de putere și răcire capabilă să suporte sarcini de lucru de până la 100 kW per rack într-un set divers de configurații de implementare.
Aceste modele oferă mai multe căi integratorilor de sisteme, furnizorilor de colocare, furnizorilor de servicii cloud sau utilizatorilor companiilor pentru a crea un centru de date al viitorului, chiar acum. Fiecare unitate specifică poate avea variații ale numărului de rack-uri și ale densității acestora dictate de selecția echipamentului IT. Ca atare, acest set de design-uri oferă o modalitate intuitivă de a restrânge totul la un design de bază și de a-l adapta exact nevoilor de implementare.
În cazul modernizării sau reutilizării mediilor existente pentru AI, designurile noastre optimizate ajută la minimizarea întreruperii sarcinilor de lucru existente prin valorificarea infrastructurii de răcire disponibile și a evacuării căldurii acolo unde este posibil. De exemplu, putem integra răcirea cu lichid direct pe chip cu un schimbător de căldură din ușa din spate pentru a menține o soluție de răcire neutră pentru încăpere. În acest caz, schimbătorul de căldură din ușa din spate împiedică excesul de căldură să ajungă în cameră. Pentru o instalație răcită cu aer care caută să adauge echipamente de răcire cu lichid fără nicio modificare a adusă locației în sine, avem disponibile opțiuni de proiectare lichid-aer. Aceeași strategie poate fi implementată într-un singur rack, pe un rând sau la scară mare într-o implementare HPC de mari dimensiuni. Pentru modelele cu mai multe rack-uri, am inclus, de asemenea, busway-uri cu amperaj ridicat și PDU-uri rack de înaltă densitate pentru a distribui puterea fiecărui rack.
Aceste opțiuni sunt compatibile cu o gamă de opțiuni diferite de evacuare a căldurii care pot fi asociate cu răcirea cu lichid. Acest lucru stabilește o cale de tranziție curată și rentabilă către răcirea cu lichid de înaltă densitate, fără a perturba alte sarcini de lucru din camera de date. Consultați Soluțiile noastre AI pentru camerele de date pentru a afla mai multe.
Deși multe clădiri nu sunt proiectate pentru sisteme de înaltă densitate, Vertiv are o experiență vastă în a ajuta clienții să dezvolte planuri de implementare pentru a trece fără probleme la densitate mare pentru AI și HPC.
Numai Vertiv poate îndeplini nevoile de putere și răcire ale sarcinii de lucru AI
Vertiv are expertiza tehnologică, portofoliu vast, capacitățile de service, amprenta operațională și parteneriate din industrie pentru a vă alimenta și răci implementările HPC.
• Cel mai avansat și complet portofoliu de alimentare pentru IT și infrastructură de răcire din industrie.
• Parteneriate tehnice cu producătorii de cipuri care conduc revoluția AI.
• Soluții end-to-end care preiau energie de la rețea la cip șievacuează căldura de la cip în exteriorul centrului de date.
• Acoperire de service la un nivel global de neegalat și capacitate pregătită pentru AI.
• Amprenta de producție rezilientă, capabilă să extindă noile tehnologii la nivel global.
• Ofertă unică modulară prefabricată, de la un singur rack până la întregul centru de date.