أدى خطأ في التكوين في Cloudflare في 18 نوفمبر إلى انقطاع متسلسل أثر مؤقتًا على خدمات كبرى مثل X وChatGPT وSpotify وUber في جميع أنحاء العالم.
تخيل هذا: تستيقظ، تأخذ هاتفك، وتضغط على الأيقونات المعتادة. X لن يتم تحميله. ChatGPT لا يجيب على سؤالك. YouTube لا يظهر فيديوك. حتى Downdetector، الموقع الذي تستخدمه عادة للتحقق مما إذا كانت الأمور معطلة، هو… معطل.
لساعات قليلة في 18 نوفمبر، كانت هذه هي الحقيقة لملايين الأشخاص حول العالم. أدى انقطاع كبير في Cloudflare، إحدى الشركات البنية التحتية الرئيسية وراء الإنترنت الحديث، إلى تعطيل أو تدهور مجموعة واسعة من الخدمات، بما في ذلك X، ChatGPT، سبوتيفاي، أوبر، كانفا، League of Legends والمزيد.
كان الأمر وكأن “الإنترنت بأكمله” قد اختفى. في الواقع، كان شيئًا أصغر وأكثر رعبًا: فشل واحد في أنظمة شركة معينة يتسبب في تتابع التأثير عبر حصة كبيرة من الويب.
ماذا حدث بالضبط في Cloudflare
بدأت المشكلة صباح الثلاثاء مبكرًا (Nov. 18) بتوقيت الولايات المتحدة. حوالي الساعة 6:20 صباحًا بتوقيت شرق الولايات المتحدة، رصدت Cloudflare زيادة في حركة المرور غير العادية التي تمر عبر أحد أنظمتها. بعد دقائق قليلة، بدأت المواقع التي تعتمد على Cloudflare في عرض صفحات “خطأ في الخادم الداخلي” وانتهت المهلة للمستخدمين في جميع أنحاء العالم.
بينما تزايدت تقارير الانقطاع على داوندتكتور ووسائل التواصل الاجتماعي، نشرت كلاودفلير أنها “على علم، وتحقق” في مشكلة تؤثر على عدة عملاء. في النهاية، حدد المهندسون الجاني وقاموا بدفع إصلاح، حيث بدأت حركة المرور تعود تدريجياً إلى وضعها الطبيعي بعد حوالي ثلاث ساعات من بدء الاضطراب.
أكدت الشركة على نقطة رئيسية واحدة: لم يكن هناك أي علامة على هجوم إلكتروني. لم يكن هذا هجومًا موزعًا على الشبكة، أو حادثة فدية، أو جهة فاعلة دولية. كان فشلًا تقنيًا داخليًا. بالنسبة للمستخدمين، على الرغم من ذلك، لم يكن السبب مهمًا. كانت تجربتهم بسيطة: توقفت الإنترنت عن العمل.
ما الذي تفعله Cloudflare ( ولماذا لم تسمع عنها من قبل )
معظم الناس لا يزورون cloudflare.com عن قصد، لكنهم يتواصلون مع شبكتها كل يوم. تقع Cloudflare في منتصف “المسار” على الإنترنت بينك وبين المواقع التي تستخدمها. ببساطة، Cloudflare:
يعزز سرعة المواقع من خلال تخزين المحتوى وتوجيه الحركة بشكل فعال ( شبكة توصيل المحتوى، أو CDN)؛
يحميهم من هجمات DDoS والروبوتات الخبيثة؛
يقوم بتمرير حركة المرور لتحديد ما يبدو آمناً وما لا يبدو كذلك.
تقول الشركة إنها تتعامل مع حركة المرور لما يقرب من خمس جميع المواقع على مستوى العالم. كما أنها تعالج حصة ضخمة من طلبات HTTP كل ثانية، حيث تعمل بهدوء كحارس وشرطي حركة المرور لجزء كبير من الويب.
تلك المقياس رائعة عندما يعمل كل شيء. عندما لا يعمل، يمكن أن يشعر الإنترنت بالكامل فجأة بالهشاشة.
الملف الصغير الذي تسبب في الانهيار
تخبرنا نتائج التحقيق في Cloudflare قصة عادية بشكل مدهش. كان يتم إنشاء ملف تكوين (basically a set of rules) يستخدمه نظام إدارة التهديدات والروبوتات الخاص به تلقائيًا. مع مرور الوقت، أصبح ذلك الملف أكبر مما توقعه المهندسون.
في مرحلة ما، تجاوز حدًا صارمًا في البرنامج المسؤول عن معالجة حركة المرور لعدة خدمات من Cloudflare. بسبب عيب كامن في ذلك الرمز، لم يفشل النظام بشكل سلس. بدلاً من ذلك، تسبب الملف الكبير في تعطل أحد المكونات الأساسية لمعالجة حركة المرور.
من هناك، تصاعدت الأمور:
حاولت ميزة إدارة الروبوتات تطبيق الإعداد الجديد الكبير جداً؛
العملية تعطلت مرارًا بدلاً من رفض الملف؛
أدت تلك المشكلة إلى تأثيرات متتالية على العديد من الخدمات التي اعتمدت على نفس البرمجيات؛
مع فشل المزيد من العقد، بدأ جزء كبير من شبكة كلود فلير في إعادة الأخطاء بدلاً من صفحات الويب.
وصف كبير موظفي التكنولوجيا في Cloudflare، دين كنيشت، الانقطاع بأنه “غير مقبول” وقال إن الشركة “فشلت” في خدمة عملائها والإنترنت بشكل عام، وواعدًا بإجراء تغييرات حتى لا يمكن أن يتسبب خطأ تكوين واحد في نفس النوع من رد الفعل المتسلسل مرة أخرى.
هل أصبحت الانقطاعات أسوأ، أم أنها فقط أصبحت أكثر ضجيجاً؟
إذا شعرت أن هذه الحوادث تحدث بشكل متكرر أكثر، فأنت لست وحدك. حدث انقطاع Cloudflare هذا بعد أسابيع فقط من حادث كبير في خدمات أمازون ويب الذي أسقط الآلاف من المواقع والتطبيقات، من Snapchat و Reddit إلى الأدوات الداخلية التي تعتمد عليها الشركات كل يوم.
تقوم شركات مراقبة الشبكات بتتبع الانقطاعات واسعة النطاق عبر الإنترنت منذ سنوات. تشير بياناتهم إلى شيء دقيق:
عدد الانقطاعات الكبيرة كل عام لا يتزايد بشكل كبير؛
لكن تأثير كل انقطاع يتزايد، لأن المزيد من الخدمات تعتمد على نفس المزودين المركزيين.
قبل عشرين عامًا، إذا تعطّل خادم البريد الإلكتروني لصاحب العمل لديك، كان ذلك يفسد يومك، لكن فقط لشركتك. اليوم، عندما يتعرض Cloudflare أو AWS لمشكلة في الصباح، يشعر بها ملايين الأشخاص والشركات في نفس الوقت.
علاوة على ذلك، يقوم الناس الآن ببث كل خلل على X وReddit وTikTok. الحوادث التي قد تمر سابقًا بهدوء ك"مشكلات صيانة" تبدو الآن وكأنها أزمات عالمية.
عدد أقل من المزودين، مخاطر أكبر
تتناسب انقطاع Cloudflare مع نمط متكرر شهدناه مع AWS و Azure وغيرها من اللاعبين الرئيسيين في البنية التحتية:
تغيير داخلي صغير ( تعديل في التكوين، تحديث للبرمجيات، برنامج نصي يتصرف بشكل غير صحيح) يتفاعل مع بعض الافتراضات الخفية في النظام؛
معالجة الأخطاء لا تكتشفها مبكرًا بما فيه الكفاية؛
الأنظمة الآلية تضخم المشكلة بدلاً من احتوائها؛
الحادث يمتد عبر عدد كبير من العملاء الذين يعتمدون جميعًا على نفس المنصة.
لقد قمنا بتحسين الإنترنت من حيث السرعة والتكلفة والنطاق العالمي. أسهل طريقة للحصول على ذلك هي استخدام عدد قليل من الشركات الكبرى التي لديها مراكز بيانات في كل مكان وفرق هندسية عالمية المستوى.
التجارة تعني التركيز. عندما تواجه مزود خدمة الإنترنت المحلي مشكلة، تتوقف المدينة عن العمل. عندما تتعثر كلاود فلير، يبدو أن الإنترنت كله قد اختفى.
ماذا يقول قادة التكنولوجيا عن الانهيار
بينما لم يعلق إيلون ماسك بشكل مباشر على خطأ Cloudflare، إلا أنه حذر مرارًا من البنية التحتية الرقمية المفرطة المركزية، خاصة فيما يتعلق بمرونة X نفسها وتحولها نحو أنظمة مستضافة ذاتيًا. في 2023-2025، غالبًا ما أشار إلى أن الاعتماد على مزود واحد لتشغيل أجزاء كبيرة من الإنترنت هو “مشكلة نقطة فشل واحدة”، وهي انتقادات وجهها إلى AWS، وآبل، وجوجل، وطبقات على طراز Cloudflare، وحتى شركات الهاتف المحمول.
قدم كبير موظفي التكنولوجيا في Cloudflare أقوى وأوضح رد على الانقطاع. اعتذر كنيشت علنًا وقال إن الحادث “غير مقبول” بسبب عدد المنظمات والمستخدمين الذين يعتمدون على بنية Cloudflare التحتية. كما أكد أن السبب لم يكن هجومًا، بل كان خطأ في التكوين أدى إلى فشل متسلسل، وهو شيء وصفه بأنه أولوية قصوى لمنع حدوثه في المستقبل.
لم يتطرق جيف بار، كبير المبشرين في خدمات أمازون ويب، إلى انقطاع خدمة كلاودفلير، لكنه يتحدث كثيرًا عن انقطاعات AWS والنمط العام وراء الفشل على نطاق عالمي. رسالته الطويلة الأمد: كلما كان النظام أكثر ترابطًا، وكلما كانت العمليات أكثر أتمتة، زاد خطر الأخطاء المتتابعة.
وأخيرًا، أدلى ماتيو برينس، الرئيس التنفيذي لشركة كلاودفلير، بتصريح. لقد تحدث لسنوات عن البنية الدقيقة للإنترنت، وخاصة الأجزاء التي لا يلاحظها أحد حتى تتعطل. وغالبًا ما يجادل بأن الصحة الأساسية للويب تعتمد على القدرة على التحمل، وليس الكمال.
لقد تكررت مواضيع مثل:
أكبر التهديدات هي misconfigurations الداخلية، وليس المهاجمين؛
يجب أن تكون الزيادة مضمنة في كل طبقة؛
يتم تثبيت الإنترنت معًا بواسطة “كمية مذهلة من شريط لاصق”.
لم يُصدر بيانًا عامًا طويلاً خلال الفترة الأولى بعد هذه الانقطاع، لكن الموضوعات في مقابلاته السابقة تنطبق مباشرة.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
كيف اختفى الإنترنت بالكامل بين عشية وضحاها
باختصار
أدى خطأ في التكوين في Cloudflare في 18 نوفمبر إلى انقطاع متسلسل أثر مؤقتًا على خدمات كبرى مثل X وChatGPT وSpotify وUber في جميع أنحاء العالم.
تخيل هذا: تستيقظ، تأخذ هاتفك، وتضغط على الأيقونات المعتادة. X لن يتم تحميله. ChatGPT لا يجيب على سؤالك. YouTube لا يظهر فيديوك. حتى Downdetector، الموقع الذي تستخدمه عادة للتحقق مما إذا كانت الأمور معطلة، هو… معطل.
لساعات قليلة في 18 نوفمبر، كانت هذه هي الحقيقة لملايين الأشخاص حول العالم. أدى انقطاع كبير في Cloudflare، إحدى الشركات البنية التحتية الرئيسية وراء الإنترنت الحديث، إلى تعطيل أو تدهور مجموعة واسعة من الخدمات، بما في ذلك X، ChatGPT، سبوتيفاي، أوبر، كانفا، League of Legends والمزيد.
كان الأمر وكأن “الإنترنت بأكمله” قد اختفى. في الواقع، كان شيئًا أصغر وأكثر رعبًا: فشل واحد في أنظمة شركة معينة يتسبب في تتابع التأثير عبر حصة كبيرة من الويب.
ماذا حدث بالضبط في Cloudflare
بدأت المشكلة صباح الثلاثاء مبكرًا (Nov. 18) بتوقيت الولايات المتحدة. حوالي الساعة 6:20 صباحًا بتوقيت شرق الولايات المتحدة، رصدت Cloudflare زيادة في حركة المرور غير العادية التي تمر عبر أحد أنظمتها. بعد دقائق قليلة، بدأت المواقع التي تعتمد على Cloudflare في عرض صفحات “خطأ في الخادم الداخلي” وانتهت المهلة للمستخدمين في جميع أنحاء العالم.
بينما تزايدت تقارير الانقطاع على داوندتكتور ووسائل التواصل الاجتماعي، نشرت كلاودفلير أنها “على علم، وتحقق” في مشكلة تؤثر على عدة عملاء. في النهاية، حدد المهندسون الجاني وقاموا بدفع إصلاح، حيث بدأت حركة المرور تعود تدريجياً إلى وضعها الطبيعي بعد حوالي ثلاث ساعات من بدء الاضطراب.
أكدت الشركة على نقطة رئيسية واحدة: لم يكن هناك أي علامة على هجوم إلكتروني. لم يكن هذا هجومًا موزعًا على الشبكة، أو حادثة فدية، أو جهة فاعلة دولية. كان فشلًا تقنيًا داخليًا. بالنسبة للمستخدمين، على الرغم من ذلك، لم يكن السبب مهمًا. كانت تجربتهم بسيطة: توقفت الإنترنت عن العمل.
ما الذي تفعله Cloudflare ( ولماذا لم تسمع عنها من قبل )
معظم الناس لا يزورون cloudflare.com عن قصد، لكنهم يتواصلون مع شبكتها كل يوم. تقع Cloudflare في منتصف “المسار” على الإنترنت بينك وبين المواقع التي تستخدمها. ببساطة، Cloudflare:
تقول الشركة إنها تتعامل مع حركة المرور لما يقرب من خمس جميع المواقع على مستوى العالم. كما أنها تعالج حصة ضخمة من طلبات HTTP كل ثانية، حيث تعمل بهدوء كحارس وشرطي حركة المرور لجزء كبير من الويب.
تلك المقياس رائعة عندما يعمل كل شيء. عندما لا يعمل، يمكن أن يشعر الإنترنت بالكامل فجأة بالهشاشة.
الملف الصغير الذي تسبب في الانهيار
تخبرنا نتائج التحقيق في Cloudflare قصة عادية بشكل مدهش. كان يتم إنشاء ملف تكوين (basically a set of rules) يستخدمه نظام إدارة التهديدات والروبوتات الخاص به تلقائيًا. مع مرور الوقت، أصبح ذلك الملف أكبر مما توقعه المهندسون.
في مرحلة ما، تجاوز حدًا صارمًا في البرنامج المسؤول عن معالجة حركة المرور لعدة خدمات من Cloudflare. بسبب عيب كامن في ذلك الرمز، لم يفشل النظام بشكل سلس. بدلاً من ذلك، تسبب الملف الكبير في تعطل أحد المكونات الأساسية لمعالجة حركة المرور.
من هناك، تصاعدت الأمور:
وصف كبير موظفي التكنولوجيا في Cloudflare، دين كنيشت، الانقطاع بأنه “غير مقبول” وقال إن الشركة “فشلت” في خدمة عملائها والإنترنت بشكل عام، وواعدًا بإجراء تغييرات حتى لا يمكن أن يتسبب خطأ تكوين واحد في نفس النوع من رد الفعل المتسلسل مرة أخرى.
هل أصبحت الانقطاعات أسوأ، أم أنها فقط أصبحت أكثر ضجيجاً؟
إذا شعرت أن هذه الحوادث تحدث بشكل متكرر أكثر، فأنت لست وحدك. حدث انقطاع Cloudflare هذا بعد أسابيع فقط من حادث كبير في خدمات أمازون ويب الذي أسقط الآلاف من المواقع والتطبيقات، من Snapchat و Reddit إلى الأدوات الداخلية التي تعتمد عليها الشركات كل يوم.
تقوم شركات مراقبة الشبكات بتتبع الانقطاعات واسعة النطاق عبر الإنترنت منذ سنوات. تشير بياناتهم إلى شيء دقيق:
قبل عشرين عامًا، إذا تعطّل خادم البريد الإلكتروني لصاحب العمل لديك، كان ذلك يفسد يومك، لكن فقط لشركتك. اليوم، عندما يتعرض Cloudflare أو AWS لمشكلة في الصباح، يشعر بها ملايين الأشخاص والشركات في نفس الوقت.
علاوة على ذلك، يقوم الناس الآن ببث كل خلل على X وReddit وTikTok. الحوادث التي قد تمر سابقًا بهدوء ك"مشكلات صيانة" تبدو الآن وكأنها أزمات عالمية.
عدد أقل من المزودين، مخاطر أكبر
تتناسب انقطاع Cloudflare مع نمط متكرر شهدناه مع AWS و Azure وغيرها من اللاعبين الرئيسيين في البنية التحتية:
لقد قمنا بتحسين الإنترنت من حيث السرعة والتكلفة والنطاق العالمي. أسهل طريقة للحصول على ذلك هي استخدام عدد قليل من الشركات الكبرى التي لديها مراكز بيانات في كل مكان وفرق هندسية عالمية المستوى.
التجارة تعني التركيز. عندما تواجه مزود خدمة الإنترنت المحلي مشكلة، تتوقف المدينة عن العمل. عندما تتعثر كلاود فلير، يبدو أن الإنترنت كله قد اختفى.
ماذا يقول قادة التكنولوجيا عن الانهيار
بينما لم يعلق إيلون ماسك بشكل مباشر على خطأ Cloudflare، إلا أنه حذر مرارًا من البنية التحتية الرقمية المفرطة المركزية، خاصة فيما يتعلق بمرونة X نفسها وتحولها نحو أنظمة مستضافة ذاتيًا. في 2023-2025، غالبًا ما أشار إلى أن الاعتماد على مزود واحد لتشغيل أجزاء كبيرة من الإنترنت هو “مشكلة نقطة فشل واحدة”، وهي انتقادات وجهها إلى AWS، وآبل، وجوجل، وطبقات على طراز Cloudflare، وحتى شركات الهاتف المحمول.
قدم كبير موظفي التكنولوجيا في Cloudflare أقوى وأوضح رد على الانقطاع. اعتذر كنيشت علنًا وقال إن الحادث “غير مقبول” بسبب عدد المنظمات والمستخدمين الذين يعتمدون على بنية Cloudflare التحتية. كما أكد أن السبب لم يكن هجومًا، بل كان خطأ في التكوين أدى إلى فشل متسلسل، وهو شيء وصفه بأنه أولوية قصوى لمنع حدوثه في المستقبل.
لم يتطرق جيف بار، كبير المبشرين في خدمات أمازون ويب، إلى انقطاع خدمة كلاودفلير، لكنه يتحدث كثيرًا عن انقطاعات AWS والنمط العام وراء الفشل على نطاق عالمي. رسالته الطويلة الأمد: كلما كان النظام أكثر ترابطًا، وكلما كانت العمليات أكثر أتمتة، زاد خطر الأخطاء المتتابعة.
وأخيرًا، أدلى ماتيو برينس، الرئيس التنفيذي لشركة كلاودفلير، بتصريح. لقد تحدث لسنوات عن البنية الدقيقة للإنترنت، وخاصة الأجزاء التي لا يلاحظها أحد حتى تتعطل. وغالبًا ما يجادل بأن الصحة الأساسية للويب تعتمد على القدرة على التحمل، وليس الكمال.
لقد تكررت مواضيع مثل:
لم يُصدر بيانًا عامًا طويلاً خلال الفترة الأولى بعد هذه الانقطاع، لكن الموضوعات في مقابلاته السابقة تنطبق مباشرة.