NVIDIA Vera Rubin розриває шаблони графічних процесорів завдяки 600-кіловатним стійкам і пам'яті на мільйони токенів

Генеральний директор NVIDIA Дженсен Хуанг (Jensen Huang) на GTC 2025 зробив приголомшливу заяву, змусивши команди інфраструктури побігти за своїми калькуляторами: платформа Vera Rubin підвищить потужність стійок центрів обробки даних до 600 кіловат до 2027 року.¹ Це оголошення знаменує собою фундаментальну зміну в роботі центрів обробки даних, змушуючи повністю переосмислити подачу живлення, системи охолодження та фізичну інфраструктуру, яка залишалася по суті незмінною протягом десятиліть.

Платформа Vera Rubin є найамбітнішим досягненням NVIDIA. Ця багатокомпонентна система поєднує спеціальний процесор Vera CPU, графічний процесор наступного покоління Rubin GPU та спеціалізований прискорювач Rubin CPX (Context Processing eXtension), розроблений спеціально для робочих навантажень зі штучним інтелектом, що складаються з мільйонів тегів.² На відміну від інкрементних покращень, характерних для поколінь графічних процесорів, варіант Vera Rubin NVL144 CPX забезпечує 7,5-кратну продуктивність штучного інтелекту в порівнянні з поточними системами Blackwell GB300, при цьому кардинально змінюючи способи упаковки, охолодження та розгортання GPU.³

"Ми перша технологічна компанія в історії, яка анонсувала чотири покоління чогось", - пояснив Хуанг виданню Data Center Dynamics, викладаючи дорожню карту NVIDIA до 2028 року.⁴ Прозорість слугує важливій меті: дає постачальникам інфраструктури, операторам центрів обробки даних і таким компаніям, як Introl, час, необхідний для підготовки до повного переосмислення інфраструктури штучного інтелекту.

Специфікації платформи NVIDIA Vera Rubin NVL144 показують 3,6 екзафлопс продуктивності виведення FP4 і 3,3-кратне поліпшення в порівнянні з GB300 NVL72, що надійде в другій половині 2026 року.

Революція в архітектурі починається з кастомного кремнію.

Повна дорожня карта NVIDIA від Blackwell до Feynman, що демонструє еволюцію від стійкової архітектури Oberon до Kyber, яка підтримує енергоспоживання до 600 кВт.

Процесор Vera знаменує відхід NVIDIA від готових конструкцій ARM і містить 88 кастомних ядер ARM з одночасною багатопотоковістю, що забезпечує роботу 176 логічних процесорів.NVIDIA називає кастомні ядра "Olympus", і ця конструкція забезпечує вдвічі більшу продуктивність, ніж CPU Grace, що використовується в сучасних системах Blackwell.⁶ Кожен CPU Vera підключається до графічних процесорів Rubin через інтерфейс NVLink C2C з пропускною здатністю 1,8 ТБ/с, що забезпечує безпрецедентну пропускну здатність між обчислювальними елементами.⁷

Стандартний графічний процесор Rubin розширює межі з 288 ГБ пам'яті HBM4 в упаковці, зберігаючи ту ж ємність, що і Blackwell Ultra B300, але збільшуючи пропускну здатність пам'яті з 8 ТБ/с до 13 ТБ/с.⁸ Кожен пакет Rubin містить два графічних процесори з обмеженими можливостями, хоча NVIDIA змінила методологію підрахунку - те, що в Blackwell називалося одним графічним процесором (два процесори), в Rubin називається двома графічними процесорами.⁹ Ця зміна відображає зростаючу складність багатоядерних архітектур і допомагає споживачам краще розуміти реальні обчислювальні ресурси в кожній системі.

Найбільш інноваційним елементом є Rubin CPX, спеціально створений прискорювач для масивно-контекстної обробки даних. Монолітна конструкція забезпечує 30 петафлопсів обчислень NVFP4 з 128 ГБ економічно ефективної пам'яті GDDR7, спеціально оптимізованої для механізмів уваги в моделях-трансформерах.¹⁰ CPX досягає в 3 рази швидшої здатності до уваги порівняно з системами GB300 NVL72, що дозволяє моделям ШІ обробляти контексти з мільйонами тактів - що еквівалентно годині відео або цілим кодовим базам - без погіршення продуктивності.¹¹

Розгортання вимагає повної перебудови інфраструктури.

Стандартна система Vera Rubin NVL144, постачання якої заплановано на другу половину 2026 року, підтримує сумісність з існуючою інфраструктурою GB200/GB300, використовуючи знайому архітектуру стійок Oberon.¹² Система містить 144 графічні матриці (72 пакети), 36 процесорів Vera і забезпечує 3,6 ексафлопс продуктивності виведення FP4 - в 3,3 рази більше, ніж у Blackwell Ultra.¹³ Енергоспоживання залишається керованим на рівні приблизно 120-130 кВт на стійку, як і в поточних розгортаннях.

Варіант Vera Rubin NVL144 CPX ще більше підвищує продуктивність, інтегруючи 144 графічні процесори Rubin CPX разом зі 144 стандартними графічними процесорами Rubin і 36 процесорами Vera для забезпечення восьми ексафлопних обчислень NVFP4 - це в 7,5 разів більше, ніж у GB300 NVL72 - зі 100 ТБ високошвидкісної пам'яті та пропускною здатністю пам'яті 1,7 ПБ/с в одній стійці.¹⁴

Усе змінюється з Rubin Ultra та стійковою архітектурою Kyber у 2027 році. Система NVL576 вміщує 576 графічних процесорних матриць в одну стійку, споживаючи 600 кВт енергії - в п'ять разів більше, ніж сучасні системи.↪⁵ Конструкція Kyber повертає обчислювальні блоки на 90 градусів у вертикальну орієнтацію, упаковуючи чотири блоки по 18 блоків у стійку.⁶ Кожен блок містить вісім графічних процесорів Rubin Ultra разом з процесорами Vera, досягаючи щільності, яка здавалася неможливою всього кілька років тому.

Поточна система NVIDIA Blackwell з 72 графічними процесорами забезпечує 1,1 екзафлопс

Майбутня система NVIDIA Rubin масштабується до 576 графічних процесорів і 15 екзафлопс в одній 600-кіловатній стійці

Охолодження цих систем вимагає повного занурення в рідину без вентиляторів - відхід від сучасних систем, які все ще використовують деяке повітряне охолодження для допоміжних компонентів.¹↪↪2077↩ CoolIT Systems і Accelsius вже продемонстрували рішення для охолодження, здатні працювати зі стійками потужністю 250 кВт з температурою води на вході 40°C, підтверджуючи технологічний шлях до розгортання систем потужністю 600 кВт.¹↪↪2078↩ Стійка Kyber включає в себе спеціальну бокову стійку для інфраструктури живлення та охолодження, що фактично вимагає двох стійок для кожної системи потужністю 600 кВт.¹↪2079↩

Еволюція архітектури живлення уможливлює обчислення мегаватного масштабу.

Перехід NVIDIA на розподіл живлення 800 В постійного струму усуває фундаментальні фізичні обмеження поточної інфраструктури. Традиційний розподіл живлення 54 В у стійці вимагав би 64U силових полиць для систем масштабу Kyber, не залишаючи місця для реальних обчислень.²⁰ Архітектура 800 В усуває перетворення AC/DC на рівні стійки, підвищує наскрізну ефективність до 5% і знижує витрати на обслуговування до 70%.²¹

Нова енергетична інфраструктура підтримує стійки потужністю від 100 кВт до понад 1 МВт, використовуючи ту саму магістраль, і забезпечує масштабованість, необхідну для майбутніх поколінь.²² Компанії, які розгортають Vera Rubin, повинні планувати масштабну електричну модернізацію - одна стійка NVL576 споживає стільки ж енергії, скільки 400 типових будинків. Центри обробки даних, які планують розгортання у 2027 році, повинні розпочати модернізацію інфраструктури вже зараз, включаючи підключення до електромереж та потенційну генерацію електроенергії на місці.

Для таких фахівців з інфраструктури, як Introl, цей перехід створює безпрецедентні можливості. Досвід компанії в розгортанні GPU-інфраструктури в гіпермасштабі, управлінні понад 100 000 GPU по всьому світу, а також її широка присутність в АТР ²³ Організації потребують партнерів, які розуміються не лише на розгортанні графічних процесорів, але й на складних питаннях живлення, охолодження та мережевих технологій, необхідних для систем потужністю 600 кВт.

Зростання продуктивності виправдовує інвестиції в інфраструктуру.

Варіант Vera Rubin NVL144 CPX демонструє потенціал платформи з вісьмома exaFLOPS обчислень NVFP4, 100 ТБ високошвидкісної пам'яті та пропускною здатністю 1,7 ПБ/с - і все це в одній стійці.²⁴ NVIDIA стверджує, що організації можуть досягти 30-50-кратної рентабельності інвестицій, що означає 5 мільярдів доларів доходу з капітальних інвестицій у 100 мільйонів доларів.²⁵

Серед перших, хто перейняв цей досвід, - німецький суперкомп'ютерний центр Лейбніца, який розгортає суперкомп'ютер Blue Lion з Vera Rubin, щоб досягти в 30 разів більшої обчислювальної потужності, ніж їхня поточна система.²⁶ Система Doudna Національної лабораторії Лоуренса Берклі також працюватиме на Vera Rubin, об'єднуючи моделювання, дані та штучний інтелект в єдину платформу для наукових обчислень.²⁷

Спеціалізація Rubin CPX на обробці контексту усуває критичне вузьке місце в сучасних системах штучного інтелекту. Такі компанії, як Cursor, Runway і Magic, вже досліджують, як CPX може прискорити роботу асистентів кодування і додатків для генерації відео, які вимагають одночасної обробки мільйонів токенів.²⁸ Можливість зберігати в активній пам'яті цілі бази коду або години відео докорінно змінює можливості додатків ШІ.

Інфраструктурні виклики створюють ринкові можливості.

Перехід до стійок потужністю 600 кВт розкриває суворі реалії щодо можливостей сучасних центрів обробки даних. Більшість об'єктів не можуть впоратися зі стійками потужністю 40 кВт; навіть найсучасніші центри обробки даних зі штучним інтелектом рідко перевищують 120 кВт. Перехід вимагає не лише нових систем охолодження, але й повного перепроектування об'єкта - від бетонних підлог, здатних витримати величезні вагові навантаження, до електричних підстанцій, розрахованих на промислову експлуатацію.

"Залишається питання, скільки існуючих дата-центрів зможуть підтримувати таку щільну конфігурацію", - зазначає The Register, підкреслюючи, що індивідуальний характер стійок Kyber означає, що об'єкти потребують спеціальної інфраструктури.²⁹ Будівництво з нуля в регіонах з надлишком відновлюваної або ядерної енергії - Скандинавії, Квебеку та ОАЕ - ймовірно, призведе до впровадження.²⁰.

Цей графік дає галузі простір для маневру, але вимагає негайних дій. Організації, які планують інфраструктуру штучного інтелекту на 2027 рік і далі, повинні вже зараз приймати рішення щодо розташування об'єктів, закупівлі електроенергії та архітектури охолодження. Трирічний термін відображає складність розгортання інфраструктури, яка працює на межі фізично можливого.

Дорога за межами Віри Рубін

Дорожня карта NVIDIA простягається від Віри Рубін до архітектури Фейнмана у 2028 році, ймовірно, просуваючись до 1-мегаватних стійок.³¹ Генеральний директор Vertiv Джордано Альбертацці (Giordano Albertazzi) припускає, що досягнення мегаватної щільності потребуватиме "подальшої революції в рідинному охолодженні та зміни парадигми живлення".³² Траєкторія здається неминучою - робочі навантаження ШІ вимагають експоненціального збільшення щільності обчислень, а економіка віддає перевагу концентрації, а не розподілу.

Перехід від поступових удосконалень до революційних змін в інфраструктурі графічних процесорів відображає більш широку трансформацію ШІ. Подібно до того, як великі мовні моделі стрибнули з мільярдів до трильйонів параметрів, інфраструктура, що їх підтримує, повинна зробити аналогічний стрибок. Vera Rubin представляє не просто швидші графічні процесори, а фундаментальне переосмислення того, як працює обчислювальна інфраструктура.

Для таких компаній, як Introl, що спеціалізуються на розгортанні GPU-інфраструктури, Vera Rubin створює можливість для нового покоління. Організаціям потрібні партнери, які можуть орієнтуватися в складнощах розгортання 600-кіловатних систем, від початкового планування до впровадження та постійної оптимізації. Компанії, які успішно розгорнуть Vera Rubin, отримають значні конкурентні переваги в можливостях штучного інтелекту, тоді як ті, хто вагається, ризикують програти, оскільки галузь рухається до ексафлопсного штучного інтелекту.

Висновок

Платформа NVIDIA Vera Rubin змушує індустрію центрів обробки даних зіткнутися з неприємною правдою про обмеження інфраструктури, пропонуючи безпрецедентні обчислювальні можливості. Стійки потужністю 600 кВт у 2027 році - це не просто більше енергоспоживання, вони знаменують собою повну трансформацію в тому, як будується, охолоджується та експлуатується інфраструктура штучного інтелекту. Організації, які почнуть планувати вже зараз, співпрацюючи з досвідченими фахівцями з інфраструктури, які розуміють складнощі розгортання наступного покоління, матимуть найкращі можливості для використання революційних можливостей, які надає Vera Rubin.

Поява платформи у 2026-2027 роках дає галузі час на підготовку, але час не стоїть на місці. Центри обробки даних, спроектовані сьогодні, повинні передбачати вимоги завтрашнього дня, і Віра Рубін чітко дає зрозуміти, що завтрашній день вимагає радикального відходу від традиційного мислення. Компанії, які приймуть цю трансформацію, стануть основою наступного покоління проривів у сфері ШІ - від мовних моделей на мільйони тегів до систем генерації відео в реальному часі, які сьогодні здаються науковою фантастикою.

Посилання

Реєстр. "Процесор Nvidia Vera Rubin, графічні процесори прокладають курс на 600-кіловатні стійки". 19 березня 2025 року. https://www.theregister.com/2025/03/19/nvidia_charts_course_for_600kw.

² NVIDIA Newsroom. "NVIDIA представляє Rubin CPX: новий клас графічних процесорів, призначений для масивного контекстного виводу". 2025. https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference.

Там же.

⁴ Динаміка центрів обробки даних. "GTC: Дженсен Хуанг, Ян Бак та Чарлі Бойл з Nvidia про майбутнє щільності стійок у центрах обробки даних". 21 березня 2025 року. https://www.datacenterdynamics.com/en/analysis/nvidia-gtc-jensen-huang-data-center-rack-density/.

⁵ TechPowerUp. "NVIDIA представила процесор Vera і графічний процесор Rubin Ultra AI, а також анонсувала архітектуру Feynman". 2025. https://www.techpowerup.com/334334/nvidia-unveils-vera-cpu-and-rubin-ultra-ai-gpu-announces-feynman-architecture.

⁶ CNBC. "Nvidia анонсує чіпи штучного інтелекту Blackwell Ultra і Vera Rubin". 18 березня 2025 року. https://www.cnbc.com/2025/03/18/nvidia-announces-blackwell-ultra-and-vera-rubin-ai-chips-.html.

⁷ Yahoo Finance. "Nvidia дебютує суперчіп наступного покоління Vera Rubin на GTC 2025". 18 березня 2025 року. https://finance.yahoo.com/news/nvidia-debuts-next-generation-vera-rubin-superchip-at-gtc-2025-184305222.html.

⁸ Наступна платформа. "Nvidia намалювала дорожню карту системи графічних процесорів до 2028 року". 5 червня 2025 року. https://www.nextplatform.com/2025/03/19/nvidia-draws-gpu-system-roadmap-out-to-2028/.

⁹ Напіваналіз. "NVIDIA GTC 2025 - створена для міркувань, Віра Рубін, Kyber, CPO, Dynamo Inference, Jensen Math, Feynman". 4 серпня 2025 року. https://semianalysis.com/2025/03/19/nvidia-gtc-2025-built-for-reasoning-vera-rubin-kyber-cpo-dynamo-inference-jensen-math-feynman/.

¹⁰ NVIDIA Newsroom. "NVIDIA представляє Rubin CPX: новий клас графічних процесорів, створений для масивного контекстного виводу".

¹¹ Там само.

¹² Hardware від Tom's. "Nvidia анонсує графічні процесори Rubin у 2026 році, Rubin Ultra у 2027 році, Feynman також доданий до дорожньої карти". 18 березня 2025 року. https://www.tomshardware.com/pc-components/gpus/nvidia-announces-rubin-gpus-in-2026-rubin-ultra-in-2027-feynam-after.

¹³ Новий стек. "NVIDIA представляє архітектури Rubin і Feynman наступного покоління, які розширюють межі потужності ШІ". 14 квітня 2025 року. https://thenewstack.io/nvidia-unveils-next-gen-rubin-and-feynman-architectures-pushing-ai-power-limits/.

¹⁴ NVIDIA Newsroom. "NVIDIA представляє Rubin CPX: новий клас графічних процесорів, створений для масивного контекстного виводу".

¹⁵ Динаміка центрів обробки даних. "Очікується, що потужність стійки Nvidia Rubin Ultra NVL576 становитиме 600 кВт у другій половині 2027 року". 18 березня 2025 року. https://www.datacenterdynamics.com/en/news/nvidias-rubin-ultra-nvl576-rack-expected-to-be-600kw-coming-second-half-of-2027/.

¹⁶ Tom's Hardware. "Nvidia демонструє Rubin Ultra з 600 000-ватними стійками та інфраструктурою Kyber, що вийде у 2027 році". 19 березня 2025 року. https://www.tomshardware.com/pc-components/gpus/nvidia-shows-off-rubin-ultra-with-600-000-watt-kyber-racks-and-infrastructure-coming-in-2027.

¹⁷ Динаміка центрів обробки даних. "GTC: Дженсен Хуанг, Ян Бак та Чарлі Бойл з Nvidia про майбутнє щільності стійок у центрах обробки даних".

¹⁸ Межа ЦОД. "CoolIT та Accelsius розширюють межі рідинного охолодження ЦОД на тлі зростаючої щільності стійок". 2025. https://www.datacenterfrontier.com/cooling/article/55281394/coolit-and-accelsius-push-data-center-liquid-cooling-limits-amid-soaring-rack-densities.

¹⁹ Динаміка центрів обробки даних. "GTC: Дженсен Хуанг, Ян Бак та Чарлі Бойл з Nvidia про майбутнє щільності стійок в центрах обробки даних".

²⁰ Технічний блог NVIDIA. "Архітектура NVIDIA 800 VDC стане основою наступного покоління фабрик штучного інтелекту". 20 травня 2025 року. https://developer.nvidia.com/blog/nvidia-800-v-hvdc-architecture-will-power-the-next-generation-of-ai-factories/.

²¹ Там само.

²² Там само.

Інтроль. "Зона покриття". Режим доступу: . https://introl.com/coverage-area.

²⁴ NVIDIA Newsroom. "NVIDIA представляє Rubin CPX: новий клас графічних процесорів, створений для масивного контекстного виводу".

²⁵ Там само.

²⁶ Блог NVIDIA. "Суперкомп'ютер Blue Lion працюватиме на NVIDIA Vera Rubin". 10 червня 2025 року. https://blogs.nvidia.com/blog/blue-lion-vera-rubin/.

²⁷ Там само.

²⁸ NVIDIA Newsroom. "NVIDIA представляє Rubin CPX: новий клас графічних процесорів, створений для масивного контекстного виводу".

²⁹ Реєстр. "Процесор Nvidia Vera Rubin, графічні процесори прокладають курс на 600-кіловатні стійки".

³⁰ Глобальний центр обробки даних. "Стійки Nvidia потужністю 600 кВт вже тут (чи готова ваша інфраструктура?)" 23 березня 2025 року. https://www.globaldatacenterhub.com/p/issue-8-nvidias-600kw-racks-are-hereis.

³¹ TechPowerUp. "NVIDIA представила процесор Vera та графічний процесор Rubin Ultra AI, а також анонсувала архітектуру Feynman".

³² Динаміка центрів обробки даних. "GTC: Дженсен Хуанг, Ян Бак та Чарлі Бойл з Nvidia про майбутнє щільності стійок в центрах обробки даних".

Попередній
Попередній

VVater і Introl оголосили про партнерство, щоб переосмислити майбутнє центрів обробки даних зі штучним інтелектом

Далі
Далі

CoreWeave: Революція в інфраструктурі штучного інтелекту - як стартап з майнінгу криптовалют став основою штучного інтелекту вартістю 23 мільярди доларів