जैसे-जैसे कंपनियां बड़े पैमाने पर एआई वर्कलोड को क्लाउड पर ले जाती हैं, हाइपरस्केलर्स-एडब्ल्यूएस, गूगल क्लाउड और माइक्रोसॉफ्ट एज़्योर नामक कुछ बड़े क्लाउड प्रदाताओं पर निर्भरता क्लाउड को महत्वपूर्ण एआई बुनियादी ढांचे के लिए विफलता का एक बिंदु बना सकती है। पुदीना यह बताता है कि यह जोखिम एक सेवा के रूप में सॉफ़्टवेयर (SaaS) क्यों है और AI-देशी कंपनियां इसे नज़रअंदाज नहीं कर सकतीं।
AWS आउटेज क्या है?
सोमवार को, अमेज़ॅन की क्लाउड कंप्यूटिंग शाखा, AWS को एक बड़े वैश्विक आउटेज का सामना करना पड़ा, जिसने न केवल उत्तरी अमेरिका में, बल्कि यूके, ऑस्ट्रेलिया और भारत में भी सोशल मीडिया और गेमिंग से लेकर स्ट्रीमिंग और वित्तीय ऐप्स तक हजारों ऑनलाइन प्लेटफ़ॉर्म को प्रभावित किया।
AWS ने डाउनटाइम के लिए एक डोमेन नाम सर्वर (DNS समस्या) को जिम्मेदार ठहराया, जो कंप्यूटर और स्मार्टफोन जैसे उपकरणों को वेबसाइटों का पता लगाने से रोकता है, भले ही वे अभी भी चल रहे हों क्योंकि DNS सिस्टम वेबसाइट नामों का अनुवाद करता है (जैसे) Livemint.com) इंटरनेट प्रोटोकॉल (आईपी) पतों में जिन्हें कंप्यूटर समझ सकते हैं।
ई-कॉमर्स डिलीवरी विशेषज्ञ पार्सलहीरो का अनुमान है कि वैश्विक आउटेज के कारण यूके, यूरोप और अमेरिका में खुदरा विक्रेताओं को लगभग 1 बिलियन डॉलर का नुकसान हुआ होगा। जबकि AWS का कहना है इसने समस्या को सफलतापूर्वक हल कर लिया है, इस तरह की रुकावटें एक बड़ी चिंता पैदा करती हैं क्योंकि एआई कंपनियां तेजी से अधिक प्रशिक्षण (जब एआई सीखती है) और अनुमान (उस सीखने का उपयोग, कहते हैं, एक नई छवि में एक बिल्ली की पहचान करने के लिए) वर्कलोड को क्लाउड पर स्थानांतरित कर रही हैं।
क्या पहले भी ऐसे ही बड़े व्यवधान हुए थे?
प्रमुख क्लाउड आउटेज ने बार-बार इंटरनेट से समझौता किया है। फरवरी 2017 में, आंतरिक मानवीय त्रुटि के कारण AWS आउटेज ने स्लैक और क्वोरा को बाधित कर दिया, जबकि Google क्लाउड ने जून 2019 और नवंबर 2021 में बड़े आउटेज का अनुभव किया, जिससे जीमेल और यूट्यूब भी प्रभावित हुए।
Azure ने 2021 में इसी तरह के आउटेज का अनुभव किया था, लेकिन सबसे बड़ा आउटेज जुलाई 2024 में हुआ था जब एक दोषपूर्ण क्राउडस्ट्राइक फाल्कन सेंसर अपडेट ने दुनिया भर में 8.5 मिलियन विंडोज डिवाइसों को बाधित कर दिया था, जिससे विमानन, बैंकिंग और सरकारी सिस्टम प्रभावित हुए थे।
आज कंपनियां और सरकारें क्लाउड पर कितनी निर्भर हैं?
केवल तीन क्लाउड सेवा प्रदाता–एडब्ल्यूएस, माइक्रोसॉफ्ट और गूगल–कुल मिलाकर दुनिया की 60% से अधिक क्लाउड बुनियादी ढांचे की जरूरतों को पूरा करते हैं। अप्रैल-जून 2025 में क्लाउड इंफ्रास्ट्रक्चर सेवाओं पर उद्यम खर्च दुनिया भर में लगभग 99 बिलियन डॉलर तक बढ़ गया, जो 2024 की दूसरी तिमाही से 20 बिलियन डॉलर से अधिक है। सिनर्जी रिसर्च ग्रुप से डेटा. राजस्व में एक सेवा के रूप में बुनियादी ढांचा (IaaS), एक सेवा के रूप में प्लेटफ़ॉर्म (PaaS) और होस्ट की गई निजी क्लाउड सेवाएँ शामिल हैं।
जेनरेटिव एआई (जेनएआई) इस वृद्धि का प्रमुख चालक होने के साथ, क्लाउड प्रदाताओं ने 2023 की शुरुआत से अपने तिमाही राजस्व में 36 बिलियन डॉलर की बढ़ोतरी देखी है। सिनर्जी रिसर्च के अनुसार, अमेज़ॅन अप्रैल-जून तिमाही में 30% बाजार हिस्सेदारी के साथ बाजार में प्रमुख रहा, इसके बाद माइक्रोसॉफ्ट (20%) और Google क्लाउड (13%) का स्थान रहा। छोटे क्लाउड प्रदाताओं में CoreWeave, Oracle, Databricks और Huawei शामिल हैं।
लेकिन अकेले AWS आधे इंटरनेट को कैसे क्रैश कर सकता है?
AWS का क्लाउड इंफ्रास्ट्रक्चर बाजार में सिर्फ 30% हिस्सा हो सकता है, लेकिन सोशल मीडिया प्लेटफॉर्म, गेमिंग सेवाएं, स्ट्रीमिंग साइट और वित्तीय ऐप (जैसे एलेक्सा, स्नैपचैट, वेनमो, रेडिट, कॉइनबेस, व्हाट्सएप, सिग्नल, ज़ूम और पर्प्लेक्सिटी) सहित कई विश्व स्तर पर लोकप्रिय ऐप इसकी सेवाओं पर भरोसा करते हैं।
इसलिए, जब कोई प्रमुख क्षेत्र या सेवा विफल हो जाती है, तो लाखों उपयोगकर्ता प्रभावित होते हैं (डाउन डिटेक्टर के अनुसार, डेल्टा एयरलाइंस और यूनाइटेड एयरलाइंस जैसी कुछ एयरलाइंस को भी व्यवधान का सामना करना पड़ा), भले ही इसकी समग्र बाजार हिस्सेदारी कुछ भी हो। प्रभाव को मेटकाफ के नियम द्वारा बढ़ाया जाता है जो नेटवर्क प्रभाव को रेखांकित करता है: सेवाएं अक्सर एडब्ल्यूएस एप्लिकेशन प्रोग्रामिंग इंटरफेस (एपीआई), डेटाबेस, प्रमाणीकरण, या डीएनएस पर निर्भर करती हैं, जिसका अर्थ है कि यदि वे एडब्ल्यूएस घटकों को कॉल करते हैं तो अन्यत्र होस्ट किए गए ऐप्स भी टूट सकते हैं।
इसके अतिरिक्त, कंपनियां दक्षता और लागत बचत के लिए कुछ क्षेत्रों या प्रदाताओं में कार्यभार को समेकित करती हैं, जिससे विफलता के एकल बिंदु बनते हैं और ऐसा प्रतीत होता है कि “आधा इंटरनेट” ऑफ़लाइन है।
AI क्लाउड पर कितना निर्भर है?
क्लाउड AI, AI को एकीकृत करता है क्लाउड कम्प्यूटिंगसंगठनों को एआई टूल्स, एल्गोरिदम और क्लाउड सेवाओं के साथ अपनी दैनिक परिचालन गतिविधियों को सहजता से संरेखित करने की अनुमति देता है। फॉर्च्यून बिजनेस इनसाइट्स (www.fortunebusinessinsights.com/cloud-ai-market-108878) के अनुसार, वैश्विक क्लाउड AI बाजार का आकार, जिसका मूल्य 2024 में 78.36 बिलियन डॉलर था, 2025 में 102.09 बिलियन डॉलर से बढ़कर 2032 तक 589.22 बिलियन डॉलर होने का अनुमान है।
इसका कारण यह है कि एआई की हर बड़ी सफलता स्केलिंग क्लाउड कंप्यूटिंग पर निर्भर करती है। एआई फाउंडेशन मॉडल सहित ओपनएआईके GPT-5, मेटा के LlaMa, Google के जेमिनी और एंथ्रोपिक के क्लाउड को अपनी विशाल कम्प्यूटेशनल, स्टोरेज और नेटवर्किंग आवश्यकताओं के लिए क्लाउड इंफ्रास्ट्रक्चर की आवश्यकता होती है। एआई वर्कलोड बुनियादी ढांचे की मांग में वृद्धि का प्राथमिक चालक है, जो क्लाउड प्रदाताओं को विशेष एआई चिप्स, कंटेनर और सेवाओं की ओर धकेलता है।
यह अगले प्लेटफ़ॉर्म बदलाव को सक्षम कर रहा है, जिसमें पूरी तरह से नई सॉफ़्टवेयर श्रेणियां और व्यवसाय मॉडल बनाने के लिए सर्वव्यापी क्लाउड एक्सेस और एम्बेडेड एआई क्षमताओं का संयोजन शामिल है।
अतिरेक को कैसे संबोधित करें?
क्लाउड प्रदाताओं के पास एक व्यापक आपदा-वसूली ढांचा होता है, लेकिन कई व्यवसाय संबंधित लागत और जटिलता के कारण पूर्ण बहु-क्षेत्र या बहु-क्लाउड आर्किटेक्चर के बजाय “क्षेत्र के भीतर उपलब्धता” चुनते हैं। एआई युग में डाउनटाइम जोखिमों को कम करने के लिए कंपनियों को बहुस्तरीय रणनीति अपनानी होगी।
एक ही क्लाउड प्रदाता या क्षेत्र पर भरोसा करने से विफलता के एकल बिंदु बनते हैं, इसलिए यदि एक सेवा बंद हो जाती है तो कई क्षेत्रों या यहां तक कि कई क्लाउड विक्रेताओं पर कार्यभार फैलाने से निरंतरता सुनिश्चित हो सकती है।
महत्वपूर्ण सिस्टम-डेटाबेस, एपीआई और प्रमाणीकरण सेवाओं में सक्रिय विफलता और अतिरेक होना चाहिए, यह पुष्टि करने के लिए नियमित परीक्षण के साथ कि बैकअप वास्तविक दुनिया की परिस्थितियों में काम करता है। कैस्केडिंग विफलताओं को रोकने के लिए एप्लिकेशन को किसी एक सेवा से अलग किया जाना चाहिए, और आउटेज के दौरान पूर्ण शटडाउन के बजाय आंशिक कार्यक्षमता प्रदान करने के लिए डिज़ाइन किया जाना चाहिए। निरंतर निगरानी और अराजकता परीक्षण कमजोरियों को गंभीर होने से पहले पहचानने में मदद करते हैं।
हालाँकि, विक्रेताओं या क्षेत्रों में कार्यभार स्थानांतरित करने में महत्वपूर्ण लागत आती है, जिसमें उच्च क्लाउड बिल, एकीकरण जटिलता और संभावित डेटा ट्रांसफर शुल्क शामिल हैं। कंपनियों को इन खर्चों को डाउनटाइम के जोखिम के हिसाब से तौलना चाहिए, खासकर जेन जेड उपयोगकर्ताओं और उद्यमों को तेज, निर्बाध एआई सेवाओं की मांग करनी चाहिए।