Революція NVIDIA на Computex 2025: Перетворення центрів обробки даних на фабрики АІ

Генеральний директор NVIDIA Дженсен Хуанг (Jensen Huang) вийшов на сцену виставки Computex 2025 у своїй фірмовій шкіряній куртці і представив нове обладнання та повністю переосмислену обчислювальну парадигму. Напівпровідниковий гігант рішуче перетворився на компанію, що займається інфраструктурою штучного інтелекту, закладаючи основи того, що Хуанг називає "інфраструктурою інтелекту" - третьої великої інфраструктурної революції після електрики та інтернету.

Цей виступ був не просто черговим анонсом продукту - Дженсен виклав план NVIDIA по зміні обчислювального ландшафту. Технічні стрибки, стратегічні повороти та ринкові ігри, про які він розповів, швидше за все, зроблять цю виставку Computex такою, на яку ми будемо згадувати ще багато років. Дивіться повну версію Основна доповідь Nvidia на Computex 2025.

Стратегічна еволюція NVIDIA: Від відеокарт до постачальника інфраструктури

Історія трансформації NVIDIA вражає уяву. У 1993 році Дженсен побачив "можливість для чіпа вартістю 300 мільйонів доларів" - значний ринок. Сьогодні він керує інфраструктурним джаггернаутом штучного інтелекту вартістю трильйон доларів. Таке вибухове зростання не відбувається просто так - на цьому шляху NVIDIA неодноразово фундаментально переосмислювала себе.

Під час свого виступу Дженсен висвітлив поворотні моменти, які зробили сьогоднішню NVIDIA можливою:

  1. 2006: CUDA приземлилася і перевернула паралельні обчислення з ніг на голову. Раптом розробники, які ніколи не думали про використання GPU для загальних обчислень, почали створювати додатки, які були б неможливі на традиційних CPU.

  2. 2016: DGX1 став першою безкомпромісною системою NVIDIA, орієнтованою на ШІ. Що зараз виглядає майже моторошним передчуттям, Дженсен пожертвував перший блок OpenAI, фактично надавши їм обчислювальну базу, яка в кінцевому підсумку призвела до нашої нинішньої революції в ШІ.

  3. 2019: Придбання Mellanox, що дозволило NVIDIA переосмислити концепцію центрів обробки даних як єдиних обчислювальних блоків

Кульмінацією цієї трансформації стала позиція NVIDIA як "важливої інфраструктурної компанії" - статус, який Хуанг підкреслив, розповівши про безпрецедентні п'ятирічні публічні дорожні карти, які дозволяють планувати глобальну інфраструктуру для розгортання ШІ.

Переосмислення показників ефективності: Економіка токенів

NVIDIA представила фундаментальну зміну в тому, як ми вимірюємо обчислювальну продуктивність. Замість традиційних показників, таких як FLOPs або операцій в секунду, Хуанг позиціонує центри обробки даних ШІ як фабрики, що виробляють "токени" - одиниці обчислювального інтелекту:

"Компанії починають говорити про те, скільки токенів вони виробили в минулому кварталі і скільки токенів вони виробили в минулому місяці. Дуже скоро ми будемо обговорювати, скільки токенів ми виробляємо щогодини, так само, як це робить кожна фабрика".

Таке переосмислення безпосередньо пов'язує інвестиції в обчислювальні ресурси та результати бізнесу, узгоджуючи інфраструктуру ШІ з традиційними промисловими структурами. Ця модель позиціонує NVIDIA в епіцентрі нової економічної парадигми, де обчислювальна ефективність безпосередньо перетворюється на бізнес-потенціал.

Оновлення архітектури Blackwell: Технічні характеристики та показники продуктивності GB300

Система GB200

Оновлення GB300 до архітектури Blackwell є прикладом невпинного циклу покращення продуктивності NVIDIA. Випуск GB300 заплановано на 3 квартал 2025 року:

  • 1,5-кратний приріст продуктивності виводу порівняно з GB200

  • Збільшення ємності пам'яті HBM в 1,5 рази

  • Збільшення пропускної здатності мережі в 2 рази

  • Повністю рідинне охолодження

  • Зворотна сумісність з існуючими шасі та системами

Кожен вузол GB300 забезпечує приблизно 40 петафлопс - фактично замінюючи весь суперкомп'ютер Sierra (приблизно 2018 року), який потребував 18 000 графічних процесорів Volta. Цей 4000-кратний приріст продуктивності за шість років значно випереджає традиційне масштабування за законом Мура, демонструючи багатогранний підхід NVIDIA до прискорення продуктивності за допомогою інновацій в архітектурі, програмному забезпеченні та взаємозв'язку.

MVLink: Переосмислення технології міжмережевих з'єднань

MVLink являє собою найбільш значний прогрес у технології об'єднання графічних процесорів з моменту появи NVLink. Система дозволяє повністю розподілити обчислювальні ресурси по всій стійці, перетворюючи 72 графічні процесори (144 GPU-плашки) в єдиний масивний обчислювальний блок.

Технічні характеристики вражають:

  • Індивідуальні комутатори MVLink: Пропускна здатність 7,2 ТБ/с

  • Хребет MVLink: пропускна здатність 130 ТБ/с "все на всі

  • Фізична реалізація: 5 000 точно підібраних по довжині коаксіальних кабелів (загалом близько 2 миль)

  • Щільність потужності: 120 кіловат на стійку (необхідне рідинне охолодження)

Для контексту Хуанг зазначив, що піковий трафік всього Інтернету становить приблизно 900 терабіт на секунду (112,5 ТБ/с), що робить одну магістраль MVLink здатною обробляти більше трафіку, ніж глобальний Інтернет на піку своєї пропускної здатності.

MVLink Fusion: Створення відкритої екосистеми інфраструктури АІ

MVLink Fusion може бути найбільш інноваційною грою в екосистемі, яку NVIDIA зробила за останні роки. Замість того, щоб змушувати партнерів йти ва-банк на апаратному забезпеченні NVIDIA, вони відкривають архітектуру, щоб дозволити компаніям створювати напівкастомні системи ШІ, які все ще прив'язані до всесвіту NVIDIA.

Підхід напрочуд гнучкий:

  1. Інтеграція ASIC на замовлення: Не маєте свого спеціалізованого прискорювача? Немає проблем. Партнери можуть використовувати мікросхеми MVLink, щоб підключити свій власний кремній до екосистеми NVIDIA. NVIDIA ніби каже: "Створюйте будь-яке спеціалізоване обладнання, яке хочете - просто переконайтеся, що воно може спілкуватися з нашими продуктами".

  2. Інтеграція процесорів на замовлення: Виробники процесорів також не залишаються осторонь. Вони можуть безпосередньо впроваджувати інтерфейси MVLink, створюючи пряму магістраль між своїми процесорами та графічними процесорами Blackwell (або майбутньою архітектурою Ruben). MVLink має величезне значення для компаній, що інвестують в конкретні архітектури процесорів.

Партнерські оголошення охоплюють напівпровідникову промисловість:

  • Партнери по впровадженню кремнію: LCHIP, Astera Labs, Marll, MediaTek

  • Виробники процесорів: Fujitsu, Qualcomm

  • Постачальники EDA: Cadence, Synopsis

Такий підхід стратегічно позиціонує NVIDIA для отримання прибутку незалежно від конкретного набору обладнання, яке розгортають клієнти, що відображає відверту заяву Хуана: "Ніщо не приносить мені більшої радості, ніж коли ви купуєте все від NVIDIA. Я хочу, щоб ви це знали. Але я отримую величезну радість, коли ви купуєте щось у NVIDIA".

Розгортання штучного інтелекту на підприємстві: Сервер RTX Pro Enterprise та Omniverse

Сервер RTX Pro Enterprise і Omniverse представляють найбільш значущу пропозицію NVIDIA для корпоративних обчислень, розроблену спеціально для інтеграції можливостей ШІ в традиційні ІТ-середовища:

  • Повністю x86-сумісна архітектура

  • Підтримка традиційних гіпервізорів (VMware, Red Hat, Nanix)

  • Інтеграція з Kubernetes для звичної оркестровки робочих навантажень

  • Графічні процесори Blackwell RTX Pro 6000s (8 на сервер)

  • Мережевий чіп CX8 з пропускною здатністю 800 Гбіт/с

  • 1,7-кратне підвищення продуктивності порівняно з Hopper H100

  • 4-кратна продуктивність на оптимізованих моделях, таких як Deepseek R1

Система встановлює нові рамки продуктивності для висновків ШІ, що вимірюються в двовісній системі пропускної здатності (токенів в секунду) і швидкості реагування (токенів в секунду на користувача) - критично важливих показників для того, що Хуан називає епохою "масштабування часу висновку" або "мислячого ШІ".

AI Data Platform: Переосмислення сховища для неструктурованих даних

Платформа AI Data Platform від NVIDIA представляє принципово новий підхід до корпоративного зберігання даних:

"Люди запитують структуровані бази даних, такі як SQL... Але ШІ хоче запитувати неструктуровані дані. Вони хочуть семантики. Їм потрібен сенс. Тому ми повинні створити новий тип платформи для зберігання даних".

Ключові компоненти включають:

  • NVIDIA AIQ (або IQ): Рівень семантичних запитів

  • Вузли зберігання даних з GPU-прискоренням замінюють традиційні архітектури, орієнтовані на центральний процесор

  • Навчені АІ-моделі з прозорим походженням навчальних даних

  • 15-кратне прискорення запитів та покращення результатів на 50% у порівнянні з існуючими рішеннями

Серед партнерів індустрії зберігання даних, які впроваджують цю архітектуру, - Dell, Hitachi, IBM, NetApp і Vast, створюючи комплексну екосистему управління даними зі штучним інтелектом на рівні підприємства.

Операції зі штучним інтелектом та робототехніка: Програмні фреймворки для інтелектуального підприємства

Доповідач представив дві найважливіші програмні платформи:

  1. Операції зі штучним інтелектом (AIOps): Комплексний стек для управління агентами штучного інтелекту в корпоративному контексті, включаючи курацію даних, точне налаштування моделей, оцінку, захист і безпеку. Серед партнерів - Crowdstrike, Data IQ, Data Robots, Elastic, Newonix, Red Hat і Trend Micro.

  2. Isaac Groot Platform N1.5: екосистема розробки робототехніки з відкритим вихідним кодом:

    • Фізичний рушій Newton (розроблений спільно з Google DeepMind та Disney Research)

    • Робототехнічний процесор Jetson Thor

    • Операційна система NVIDIA Isaac

    • Схема Groot Dreams для генерації даних синтетичних траєкторій

Ініціатива з робототехніки вирішує критичну проблему: "Щоб робототехніка відбулася, потрібен ШІ. Але щоб навчити ШІ, потрібен ШІ". Цей шаблон рекурсивної оптимізації використовує генеративний ШІ, щоб перетворити обмежені демонстраційні дані людини на комплексні навчальні набори з робототехніки.

Стратегічна позиція Тайваню в революції у виробництві штучного інтелекту

Значна частина доповіді була присвячена ключовій ролі Тайваню у виробництві та впровадженні технологій штучного інтелекту:

  • Тайванські виробничі компанії (TSMC, Foxconn, Wistron, Pegatron, Delta Electronics, Quanta, Wiiwin, Gigabyte) розгортають NVIDIA Omniverse для реалізації цифрових двійників.

  • TSMC використовує інструменти зі штучним інтелектом на CUDA для оптимізації макетів фабрик і систем трубопроводів

  • Виробничі партнери використовують цифрових двійників для віртуального планування та прогнозування технічного обслуговування, а також як "спортзали для роботів" для тренування роботизованих систем.

  • Foxconn, TSMC, уряд Тайваню та NVIDIA будують перший масштабний суперкомп'ютер зі штучним інтелектом.

Хуанг ще більше зміцнив прихильність NVIDIA до регіону, оголосивши про плани щодо "NVIDIA Constellation", нової штаб-квартири в Тайбеї.

Технічний аналіз: Що це означає для стратегії штучного інтелекту на підприємстві

Ці оголошення в сукупності представляють комплексне переосмислення корпоративних обчислень з кількома стратегічними наслідками:

  1. Вимоги до обчислювального масштабу: Вимоги до продуктивності "міркувального ШІ" та агентних систем під час виведення висновків будуть значно вищими, ніж у початкових розгортаннях великих мовних моделей, що вимагає архітектурного планування для масового масштабування та масштабування можливостей.

  2. Дезагрегація корпоративного ШІ: екосистема MVLink Fusion забезпечує безпрецедентну гнучкість у створенні гетерогенних систем ШІ, потенційно прискорюючи впровадження спеціалізованих прискорювачів ШІ, зберігаючи при цьому позиції NVIDIA в екосистемі завдяки технології інтерконекту.

  3. Перехід від центрів обробки даних до фабрик штучного інтелекту: Нам потрібно повністю переосмислити, як ми оцінюємо вартість наших інвестицій в інфраструктуру. Пройшли ті часи, коли про все говорили лише обчислювальні потужності або ємності для зберігання даних. Тепер мова йде про виробництво токенів - скільки одиниць продукції ШІ можуть генерувати ваші системи в секунду, на ват і долар? Дженсен не жартував, коли сказав, що компанії незабаром будуть звітувати про виробництво токенів, наприклад, про виробничі показники. Перехід до фабрик штучного інтелекту докорінно перепише економіку того, як ми розгортаємо та виправдовуємо витрати на інфраструктуру штучного інтелекту.

  4. Інтеграція цифрових двійників: Той факт, що кожен великий тайванський виробник створює цифрових двійників Omniverse, говорить нам все, що нам потрібно знати - це вже не просто крута технологічна демонстрація. Цифрові двійники стали важливою інфраструктурою для компаній, які серйозно ставляться до оптимізації. Що особливо захоплює, так це те, як це створює цикл зворотного зв'язку: компанії створюють цифрових двійників для оптимізації фізичних процесів, а потім використовують ті ж самі середовища для навчання штучного інтелекту і робототехніки, ще більше вдосконалюючи фізичний світ. Це безперервний цикл вдосконалення, який постійно прискорюється.

  5. Планування роботизованої робочої сили: Конвергенція агентного ШІ та фізичної робототехніки спонукає організації розробляти інтегровані стратегії цифрової та фізичної автоматизації, що має значні наслідки для планування робочої сили та проектування об'єктів.

  6. Програмно-визначена інфраструктура: Незважаючи на анонси апаратного забезпечення, постійний акцент NVIDIA на бібліотеках і програмних фреймворках підтверджує, що конкурентна перевага в ШІ буде досягнута за рахунок оптимізації програмного забезпечення, а не сирих апаратних можливостей.

Навігація переходом до фабрики штучного інтелекту

Перетворення традиційних центрів обробки даних на фабрики штучного інтелекту вимагає спеціалізованої експертизи, яка поєднує в собі розгортання обладнання, оптимізацію програмного забезпечення та архітектурний дизайн. В Introl ми впроваджуємо ці передові інфраструктурні рішення на базі графічних процесорів для підприємств, які переходять на обчислення з використанням ШІ. Глибокий досвід нашої команди з екосистемою NVIDIA - від складних розгортань MVLink до цифрових двійників Omniverse - допомагає організаціям орієнтуватися в цій зміні парадигми без крутої кривої навчання, яка зазвичай асоціюється з передовою інфраструктурою. Незалежно від того, чи розширюєте ви можливості штучного інтелекту, чи створюєте свій перший заводський цех зі штучним інтелектом, партнерство зі спеціалістами може значно прискорити окупність інвестицій у цьому швидкозмінному середовищі. Готові розпочати роботу? Замовте дзвінок вже сьогодні.

Висновок: Настала третя ера комп'ютерних технологій

На Computex не лише NVIDIA демонструвала швидші чіпи. Те, що виклав Дженсен, виходило за рамки звичайних анонсів "на 20% краще, ніж минулого року", до яких ми вже звикли. Він фундаментально переосмислив те, для чого потрібні комп'ютери. Ми витратили десятиліття на створення машин, які обробляють цифри та переміщують дані. Тепер NVIDIA створює системи, які виробляють інтелект як основний продукт. Це все одно, що порівнювати картотеку з мозком. Звичайно, обидві зберігають інформацію, але одна сидить там, а інша створює нові ідеї. Цей зсув може здатися семантикою, поки ви не зрозумієте, що він змінює все в тому, як ми будуємо, розгортаємо та вимірюємо обчислювальні системи.

"Вперше за весь час нашої спільної роботи ми не лише створюємо наступне покоління ІТ, але й робимо це кілька разів - від ПК до Інтернету, від хмари до хмари, від хмари до мобільної хмари. Ми робили це кілька разів. Але цього разу ми не лише створюємо наступне покоління ІТ, ми створюємо цілу нову індустрію".

Цей перехід є третьою великою зміною обчислювальної парадигми після революції персональних комп'ютерів та ери Інтернету/хмарних технологій. Організації, які інтегрують ці можливості інфраструктури штучного інтелекту, ймовірно, отримають непереборні конкурентні переваги в різних галузях.

Фабрики обчислювального інтелекту будуються вже сьогодні. Питання вже не в тому, чи змінить штучний інтелект бізнес, а в тому, чи будує ваша організація інфраструктуру, щоб залишатися конкурентоспроможною у світі, де обчислювальний інтелект стає таким же фундаментальним для бізнес-операцій, як електроенергія.

Посилання та додаткові ресурси

  1. Офіційний огляд архітектури NVIDIA Blackwell: https://www.nvidia.com/en-us/data-center/technologies/blackwell-architecture/

  2. Технічна документація NVIDIA MVLink: https://developer.nvidia.com/mvlink

  3. Платформа NVIDIA Omniverse: https://www.nvidia.com/en-us/omniverse/

  4. Isaac Robotics Platform: https://developer.nvidia.com/isaac-ros

  5. NVIDIA AI Enterprise: https://www.nvidia.com/en-us/data-center/products/ai-enterprise/

  6. Офіційні прес-матеріали NVIDIA Computex 2025: https://nvidianews.nvidia.com/news/computex-2025

  7. Огляд бібліотек NVIDIA CUDA-X: https://developer.nvidia.com/gpu-accelerated-libraries

  8. Системи NVIDIA DGX: https://www.nvidia.com/en-us/data-center/dgx-systems/

Попередній
Попередній

Зменшення вартості простоїв в епоху штучного інтелекту

Далі
Далі

Мистецтво цифрового руйнування: Виведення з експлуатації високопродуктивних обчислювальних центрів з точністю та цілеспрямованістю