تغطي هذه الصفحة توصيات التعافي من الكوارث في ClickHouse Cloud، وإرشادات للعملاء حول كيفية التعافي من انقطاع الخدمة.
لا يدعم ClickHouse Cloud حاليًا التبديل التلقائي عند التعطل، ولا المزامنة التلقائية عبر مناطق جغرافية متعددة.
ينبغي للعملاء إجراء اختبارات دورية لعملية استعادة النسخ الاحتياطية لفهم قيمة RTO الخاصة بحجم خدمتهم وإعداداتها.
من المفيد توضيح بعض التعريفات أولًا.
RPO (Recovery Point Objective): الحد الأقصى المقبول لفقدان البيانات، ويُقاس بالزمن، بعد وقوع حدث مُعطِّل. مثال: يعني RPO البالغ 30 دقيقة أنه في حال حدوث عطل، يجب أن يكون بالإمكان استعادة DB إلى حالة بيانات لا يتجاوز عمرها 30 دقيقة. ويعتمد ذلك، بالطبع، على مدى تكرار أخذ النسخ الاحتياطية.
RTO (Recovery Time Objective): الحد الأقصى المسموح به من فترة التوقف قبل استئناف التشغيل الطبيعي بعد انقطاع الخدمة. مثال: يعني RTO البالغ 30 دقيقة أنه في حال حدوث عطل، يكون الفريق قادرًا على استعادة البيانات والتطبيقات وإعادة التشغيل الطبيعي خلال 30 دقيقة.
النسخ الاحتياطية ولقطات قاعدة البيانات: توفّر النسخ الاحتياطية تخزينًا طويل الأمد وموثوقًا مع نسخة منفصلة من البيانات. أمّا اللقطات فلا تُنشئ نسخة إضافية من البيانات، وعادةً ما تكون أسرع، وتوفّر قيم RPO أفضل.
النسخ الاحتياطية لقاعدة البيانات
يُعدّ الاحتفاظ بنسخة احتياطية من الخدمة الأساسية وسيلة فعّالة تتيح استخدام النسخة الاحتياطية والاستعادة منها عند توقّف الخدمة الأساسية.
يدعم ClickHouse Cloud الإمكانات التالية للنسخ الاحتياطية.
- النسخ الاحتياطية الافتراضية
بشكل افتراضي، ينشئ ClickHouse Cloud نسخة احتياطية لخدمتك كل 24 ساعة.
تكون هذه النسخ الاحتياطية في المنطقة نفسها التي توجد فيها الخدمة، وتُحفَظ في حاوية التخزين الخاصة بـ ClickHouse CSP (cloud service provider).
وفي حال تلف البيانات في الخدمة الأساسية، يمكن استخدام النسخة الاحتياطية للاستعادة إلى خدمة جديدة.
- النسخ الاحتياطية الخارجية (في حاوية التخزين الخاصة بالعميل)
يمكنك تصدير النسخ الاحتياطية إلى تخزين الكائنات الخاص بك ضمن حسابك، سواء في المنطقة نفسها أو في منطقة أخرى.
سيتوفر قريبًا دعم تصدير النسخ الاحتياطية عبر سُحُب مختلفة.
ستنطبق رسوم نقل البيانات المناسبة على النسخ الاحتياطية عبر المناطق المختلفة وعبر السُحُب المختلفة.
هذه الميزة غير متاحة حاليًا في خدمات PCI/ HIPAA
- النسخ الاحتياطية القابلة للتهيئة
يمكن للعملاء تهيئة النسخ الاحتياطية لتتم بوتيرة أعلى، حتى مرة كل 6 ساعات، لتحسين RPO.
ويمكن للعملاء أيضًا تهيئة فترة احتفاظ أطول.
تُعرَض النسخ الاحتياطية المتاحة حاليًا للخدمة في صفحة “backups” ضمن وحدة تحكم ClickHouse Cloud.
كما يوفّر هذا القسم حالة النجاح/الفشل لكل نسخة احتياطية.
الاستعادة من نسخة احتياطية
- يمكن استعادة النسخ الاحتياطية الافتراضية الموجودة في حاوية التخزين الخاصة بـ ClickHouse Cloud إلى خدمة جديدة في نفس المنطقة.
- يمكن استعادة النسخ الاحتياطية الخارجية (في التخزين الكائني الخاص بالعميل) إلى خدمة جديدة في نفس المنطقة أو في منطقة مختلفة.
إرشادات مدة النسخ الاحتياطي والاستعادة
تعتمد مدة النسخ الاحتياطي والاستعادة على عدة عوامل، مثل حجم قاعدة البيانات، بالإضافة إلى المخطط وعدد الجداول فيها.
في اختباراتنا، لاحظنا أن النسخ الاحتياطية الأصغر، بحجم ~1 TB، قد تستغرق من 10 إلى 15 دقيقة أو أكثر.
وعادةً ما تكتمل النسخ الاحتياطية التي يقل حجمها عن 20 TB خلال ساعة، بينما يُفترض أن يستغرق النسخ الاحتياطي لبيانات بحجم ~50 TB نحو 2-3 ساعات.
وتستفيد النسخ الاحتياطية الأكبر حجمًا من وفورات الحجم، وقد لاحظنا أن بعض النسخ الاحتياطية التي تصل إلى 1 PB لبعض الخدمات الداخلية تكتمل في أقل من 10 ساعات.
نوصي بإجراء اختبارات باستخدام قاعدة بياناتك أو بيانات عيّنة خاصة بك للحصول على تقديرات أدق، إذ تعتمد المدة الفعلية على عدة عوامل كما هو موضح أعلاه.
وتكون مدة الاستعادة مماثلة تقريبًا لمدة النسخ الاحتياطي عند الأحجام المتقاربة.
وكما ذُكر أعلاه، نوصي بإجراء اختبارات باستخدام قاعدة بياناتك حتى تكون لديك فكرة عن المدة التي ستستغرقها استعادة النسخة الاحتياطية.
لا يوجد حاليًا أي دعم للتبديل التلقائي عند التعطل بين مثيلين من ClickHouse Cloud، سواء كانا في المنطقة نفسها أو في منطقتين مختلفتين.
ولا توجد حاليًا أي مزامنة تلقائية للبيانات بين خدمات ClickHouse Cloud المختلفة في المنطقة نفسها أو في مناطق مختلفة، أي Active-Active replication.
يشرح هذا القسم خيارات الاستعادة المختلفة والإجراءات التي يمكن اتباعها في كل حالة.
تلف بيانات الخدمة الأساسية
في هذه الحالة، يمكن استعادة البيانات من النسخة الاحتياطية إلى خدمة أخرى في المنطقة نفسها.
قد يصل عمر النسخة الاحتياطية إلى 24 ساعة عند استخدام سياسة النسخ الاحتياطي الافتراضية، أو إلى 6 ساعات (عند استخدام النسخ الاحتياطية القابلة للتهيئة بتكرار كل 6 ساعات).
للاستعادة من نسخة احتياطية موجودة
- انتقل إلى قسم “Backups” في وحدة تحكم ClickHouse Cloud.
- انقر على النقاط الثلاث ضمن “Actions” للنسخة الاحتياطية التي تريد الاستعادة منها.
- امنح الخدمة الجديدة اسمًا محددًا، ثم ابدأ الاستعادة من هذه النسخة الاحتياطية
يمكنك تصدير النسخ الاحتياطية إلى حاوية التخزين لدى موفر الخدمة السحابية الخاص بك.
إذا كنت قلقًا بشأن الأعطال الإقليمية، فنوصي بتصدير النسخ الاحتياطية إلى منطقة مختلفة.
ضع في اعتبارك أن رسوم نقل البيانات عبر المناطق ستُطبَّق.
إذا تعطلت المنطقة الأساسية، فيمكن استعادة النسخة الاحتياطية الموجودة في منطقة أخرى إلى خدمة جديدة في منطقة مختلفة.
بعد استعادة النسخة الاحتياطية إلى خدمة أخرى، ستحتاج إلى التأكد من تحديث أي إعدادات خاصة بـ DNS أو موازن التحميل أو سلسلة الاتصال بحيث تشير إلى الخدمة الجديدة.
قد يشمل ذلك:
- تحديث متغيرات البيئة أو الأسرار
- إعادة تشغيل خدمات التطبيق لإنشاء اتصالات جديدة
هناك بعض الخيارات الإضافية التي يجدر أخذها في الاعتبار.
- الكتابة المزدوجة إلى مجموعتين عنقوديتين منفصلتين
في هذا الخيار، يمكنك إعداد مجموعتين عنقوديتين منفصلتين في منطقتين مختلفتين والكتابة إلى كلتيهما بالتوازي.
ويترتب على هذا الخيار بطبيعته تكلفة أعلى، لأنه يتضمن تشغيل خدمات متعددة، لكنه يوفّر إتاحة أعلى إذا أصبحت إحدى المنطقتين غير متاحة.
- الاستفادة من النسخ المتماثل لدى CSP
باستخدام هذا الخيار، يمكنك الاستفادة من النسخ المتماثل الأصلي لتخزين الكائنات لدى مزود الخدمة السحابية لنسخ البيانات.
على سبيل المثال، مع BYOB يمكنك تصدير النسخة الاحتياطية إلى حاوية التخزين تملكها في المنطقة الأساسية، ثم تكرارها إلى منطقة أخرى باستخدام AWS cross region replication.