چرا هزاران وبسایت و برنامه معروف بهطور ناگهانی از دسترس خارج شدند؟
چرا هزاران وبسایت و برنامه معروف بهطور ناگهانی از دسترس خارج شدند؟
آمازون اعلام کرد علت قطعی چندساعتهی اخیر سرویسهای ابری AWS که از پیامرسان سیگنال تا تختهای هوشمند را از کار انداخت، یک باگ در نرمافزار خودکار این سیستم بود که پیامدهای گستردهای بههمراه داشت.
در گزارشی تفصیلی که پنجشنبه منتشر شد، AWS توضیح داد زنجیرهای از خطاها باعث شد هزاران وبسایت و اپلیکیشن که از خدمات این شرکت استفاده میکنند از دسترس خارج شوند.
به گفتهی AWS، کاربران قادر به اتصال به سرویس دیتابیس این شرکت، DynamoDB، نبودند چون «نقص پنهانی در سامانهی خودکار مدیریت DNS» وجود داشت. این سیستم صدها هزار رکورد DNS را برای حفظ عملکرد پایدار و توزیع بهینهی ترافیک بهطور خودکار بهروزرسانی میکند.
علت اصلی حادثه، وجود یک رکورد خالی در بخش DNS دیتاسنتر منطقهی US-East-1 در ویرجینیا بود. این باگ بهطور خودکار اصلاح نشد و نیاز به مداخلهی دستی اپراتورها داشت. AWS اعلام کرد که بخشهای خودکار مربوط به DNS را در سراسر جهان موقتاً غیرفعال کرد تا مشکل را برطرف و از تکرارش جلوگیری کند.
اختلال زیرساختهای آمازون، بیش از ۲۰۰۰ شرکت ازجمله دالینگو، اسنپچت و برخی سرویسهای بانکی و شرکت رینگ را تحتتأثیر قرار داد و بیش از ۸٫۱ میلیون گزارش از مشکلات کاربران در سراسر جهان ثبت شد.
خدمات ظرف چند ساعت به حالت عادی برگشت؛ اما پیامدهای آن گسترده بود. برای نمونه، کاربران شرکت Eight Sleep قادر به کنترل دما یا زاویهی تختهای هوشمند خود نبودند چون اتصال از طریق اپلیکیشن گوشی قطع شده بود.
منبع : زومیت