Зменшення вартості простоїв в епоху штучного інтелекту

Здатність прогнозувати апаратні збої з певним ступенем точності відкриває потенціал для величезної економії для постачальників послуг з великими капіталовкладеннями в інформаційні технології (ІТ). Для корпоративних клієнтів, які використовують дорогі високопродуктивні обчислювальні платформи (HPC) і платформи штучного інтелекту (AI), доступність їхніх послуг - це все: система, що вийшла з ладу, блокує клієнтів і затримує ресурси, роблячи їх марними і призводячи до великих витрат. Такі збої можуть призвести до втрати доходів, вплинути на загальну продуктивність працівників і завдати шкоди бренду компанії. Залежно від галузі, дослідження показали, що середня вартість години незапланованого простою може становити від $100 000 на годину до понад $500 000 на годину[1] [2].

Увійдіть в Predictive failure analysis (PFA) (Прогнозований аналіз відмов)

Оцінюючи великі обсяги історичних даних, предиктивний аналіз відмов (PFA) може запропонувати цінну інформацію про ймовірність виходу з ладу. Набори мікросхем, друковані плати, жорсткі диски та паяні з'єднання мають обмежений термін експлуатації. Тенденції в історичних даних про відмови можуть вказувати на часовий горизонт майбутніх відмов.

Для великих виробників обладнання або автомобілів (та їхніх клієнтів) PFA може потенційно запропонувати збільшення тривалості життя активів, що призведе до скорочення майбутніх витрат до 5%. PFA також можна використовувати для планування технічного обслуговування, коли оператори і технічні фахівці є більш доступними і дешевшими, що дозволяє підвищити ефективність і заощадити до 20%[3].

На продуктивність PFA можуть впливати численні фактори. Залежно від середньої завантаженості системи, обсягу історичних даних, що використовуються, а також алгоритмів машинного навчання (ML) або глибокого навчання (DL), точність PFA може бути поставлена під сумнів.

Лінійні та поліноміальні регресії часто використовуються для визначення залишкового терміну експлуатації (RUI), в той час як алгоритми довготривалої короткочасної пам'яті (LSTM) та випадкового лісу можуть бути використані для уточнення прогнозів відмов з різним ступенем успіху. [4] [5] [6] 

Хоча очевидно, що PFA має відчутні переваги, він не є безвідмовним. Щоб забезпечити той самий рівень доступності послуг і захистити вартість капітальних інвестицій, доцільно розглянути можливість доповнити будь-яку програму підтримки з використанням PFA контрактом з віддаленими працівниками.

Дистанційні руки як страховий поліс

Використання дистанційних рук у поєднанні з PFA дає переваги як для запланованих, так і для незапланованих відключень.  

Заплановане відключення може бути заплановане заздалегідь, що дозволяє призначити ресурси тоді, коли вони є вільними і найбільш доступними за ціною. Провайдери, що надають послуги віддалених працівників, також отримують економію від масштабу: Маючи достатньо ресурсів для розгортання, можна значно заощадити на наймі, навчанні та управлінні власними технічними спеціалістами. (Один повністю завантажений інженер може легко коштувати шестизначну суму або більше на рік, залежно від необхідних навичок).

При будь-якому незапланованому відключенні першочерговим завданням є відновлення обслуговування. Незаплановане відключення без контракту на віддалене обслуговування займе більше часу. Ресурси, залучені для усунення несправностей і вирішення проблеми на місці, спочатку потрібно буде перевірити, застрахувати та підключити до роботи перед їх розгортанням. Постачальник послуг віддалених працівників, маючи масштабні ресурси, вже перевірить і призначить ресурси, що забезпечить швидший час реагування.

Стратегічні технологічні інвестиції

Залежно від характеру послуги, тривалий збій у великому середовищі може легко коштувати мільйони доларів. Контракт на віддалене обслуговування, укладений самостійно або в рамках ширшого плану аварійного відновлення, що включає PFA, можна розглядати як статтю витрат або навіть капіталізувати як частину більшої підписки на програмне забезпечення чи послугу.

Незначне збільшення операційних витрат цілком може захистити вас від мільйонних збитків, пов'язаних з тривалим відключенням послуг.

Який підхід слід використовувати, щоб обґрунтувати інвестиції у віддалену підтримку? Корпоративні фінансові показники відрізняються від компанії до компанії, але можна навести кілька ілюстрацій.

Тематичне дослідження

Ви оцінюєте контракт з віддаленими працівниками на суму $250 000 для обслуговування трьох середовищ у центрах обробки даних у Північній Америці протягом одного року. За вашими оцінками, вартість простою складає $100 000 на годину (включаючи простої ресурсів, втрачений дохід, вплив на бренд тощо). Востаннє, коли у вас стався збій через несправність обладнання, ваш додаток не працював шість годин. Чистий збиток для компанії склав $600 000.

Корпоративні фінанси не схвалюють витрати на ІТ, якщо інвестиції не перевищують порогову ставку (іноді відому як мінімально прийнятна норма прибутку або MAAR) у 10%.

Очікуваною перевагою контракту з віддаленими працівниками є скорочення середнього часу відновлення (MTTR) у разі незапланованого виходу з ладу. Оцінки показують, що MTTR можна значно скоротити. Зменшення MTTR на 50% під час попереднього збою дозволило б заощадити 300 000 доларів США за рахунок відновлення послуг на три години швидше.

Чи повинні корпоративні фінанси санкціонувати купівлю цього контракту з віддаленими руками як страховий поліс, щоб допомогти зменшити майбутні незаплановані простої?

Ми використаємо просту формулу для розрахунку рентабельності інвестицій:

ROI = (Чистий прибуток / Вартість інвестицій) * 100

У цьому випадку чистий прибуток становитиме $300 000 економії мінус вартість контракту на $250 000, або $50 000.

ROI = ($300,000-$250,000)/$250,000 * 100

$50,000 поділити на $250,000 - це 20%, або вдвічі більше, ніж MARR, необхідний для фінансування.

(Майте на увазі, що ця економія вимірюється лише за умови одного відключення. У випадку декількох незапланованих відключень протягом одного року економія буде значно вищою).

Корпоративні фінанси повинні схвалити інвестиції в контракт з віддаленими руками.

Підсумок

Штучний інтелект досяг значних успіхів у сфері прогнозованого аналізу відмов, і ефективність PFA буде тільки зростати в найближчі місяці і роки.

Тим часом, потреба в захисті інвестицій залишається. Стратегічна інвестиція в контракт на віддалене обслуговування може допомогти пом'якшити фінансові наслідки незапланованих відключень, одночасно допомагаючи вам отримати вигоду від гнучкості запланованих періодів простою.

Примітки

[1 ] https://medium.com/@brijesh_soni/why-random-forests-outperform-decision-trees-a-powerful-tool-for-complex-data-analysis-47f96d9062e7

[2] Yadav, D. K., Kaushik, A., & Yadav, N. (n.d.). Прогнозування відмов машин за допомогою алгоритмів машинного навчання та глибокого навчання. ScienceDirect. https://www.elsevier.com/locate/smse

[3] https://www.bakerhughes.com/bently-nevada/blog/unplanned-downtime-key-disruptor-industry

[4] https://medium.com/@jatin2707/machine-failure-prediction-a-comprehensive-guide-524726c3b1fd

[5] https://www.atlassian.com/incident-management/kpis/cost-of-downtime

[6] З "Прогнозоване обслуговування: Підхід Deloitte " https://www2.deloitte.com/content/dam/Deloitte/us/Documents/process-and-operations/us-predictive-maintenance.pdf

 

Теми: Дистанційні руки, машинне навчання (ML), штучний інтелект (AI), глибоке навчання (DL), продуктивність, дата-центри, хмара, предиктивний аналіз відмов (PFA), рекурентна нейронна мережа (RNN), високопродуктивні обчислення (HPC), корпоративні фінанси, стратегічні інвестиції, лінійна регресія, довготривала короткочасна пам'ять (LSTM), випадкові ліси, теорія портфелів.

Попередній
Попередній

H100 проти H200 проти B200: Вибір правильних графічних процесорів NVIDIA для роботи зі штучним інтелектом

Далі
Далі

Революція NVIDIA на Computex 2025: Перетворення центрів обробки даних на фабрики АІ