التحديثات الخفيفة لا تزال حاليًا في المرحلة التجريبية.
إذا واجهت أي مشكلات، يُرجى فتح issue في مستودع ClickHouse.
UPDATE خفيفة الوزن على تحديث الصفوف في الجدول [db.]table التي تطابق التعبير filter_expr.
وسُمّيت “lightweight update” لتمييزها عن استعلام ALTER TABLE ... UPDATE، وهي عملية ثقيلة تعيد كتابة أعمدة كاملة في أجزاء البيانات.
وهي متاحة فقط لعائلة محركات الجداول MergeTree.
filter_expr من النوع UInt8. يحدّث هذا الاستعلام قيم الأعمدة المحددة إلى قيم التعبيرات المقابلة في الصفوف التي تكون فيها قيمة filter_expr غير صفرية.
تُحوَّل القيم إلى نوع العمود باستخدام العامل CAST. لا يُدعم تحديث الأعمدة المستخدمة في حساب المفتاح الأساسي أو مفتاح التقسيم.
أمثلة
التحديثات خفيفة الوزن لا تُحدِّث البيانات على الفور
UPDATE خفيف الوزن باستخدام أجزاء التصحيح - وهي نوع خاص من أجزاء البيانات لا يحتوي إلا على الأعمدة والصفوف المحدَّثة.
ينشئ UPDATE خفيف الوزن أجزاء تصحيح، لكنه لا يُعدِّل البيانات الأصلية فعليًا في التخزين على الفور.
تشبه عملية التحديث استعلام INSERT ... SELECT ...، لكن استعلام UPDATE ينتظر حتى يكتمل إنشاء جزء التصحيح قبل أن يُرجِع النتيجة.
تكون القيم المحدَّثة:
- مرئية فورًا في استعلامات
SELECTمن خلال تطبيق التصحيحات - تُطبَّق فعليًا على التخزين فقط أثناء عمليات الدمج وعمليات mutation اللاحقة
- تُنظَّف تلقائيًا بمجرد أن تُطبَّق التصحيحات فعليًا على جميع الأجزاء النشطة
متطلبات التحديثات الخفيفة
MergeTree وReplacingMergeTree وCollapsingMergeTree وVersionedCollapsingMergeTree، بالإضافة إلى إصداراتها Replicated وShared.
لاستخدام التحديثات الخفيفة، يجب تمكين إضفاء الطابع المادي على العمودين _block_number و_block_offset باستخدام إعدادات الجدول enable_block_number_column وenable_block_offset_column.
عمليات DELETE الخفيفة
DELETE على شكل UPDATE خفيف الوزن بدلًا من mutation ALTER UPDATE. ويُتحكَّم في تنفيذ lightweight DELETE من خلال الإعداد lightweight_delete_mode.
اعتبارات الأداء
- زمن استجابة التحديث مماثل لزمن استجابة استعلام
INSERT ... SELECT ... - لا تُكتب سوى الأعمدة والقيم المُحدَّثة، وليس الأعمدة كاملةً في أجزاء البيانات
- لا حاجة إلى انتظار اكتمال عمليات الدمج/التعديلات الجارية حاليًا، لذلك يكون زمن استجابة التحديث متوقعًا
- يمكن تنفيذ التحديثات خفيفة الوزن بالتوازي
- تضيف عبئًا إضافيًا على استعلامات
SELECTالتي تحتاج إلى تطبيق التصحيحات - لن تُستخدم فهارس التخطي للأعمدة في أجزاء البيانات التي توجد عليها تصحيحات يجب تطبيقها. ولن تُستخدم الإسقاطات إذا كانت هناك أجزاء التصحيح في الجدول، بما في ذلك أجزاء البيانات التي لا توجد عليها تصحيحات يجب تطبيقها.
- قد تؤدي التحديثات الصغيرة المتكررة جدًا إلى ظهور الخطأ “too many parts”. ويُنصح بتجميع عدة تحديثات في استعلام واحد، على سبيل المثال بوضع معرّفات التحديثات في عبارة
INواحدة داخل عبارةWHERE - صُممت التحديثات خفيفة الوزن لتحديث عدد صغير من الصفوف (حتى نحو 10% من الجدول). وإذا كنت بحاجة إلى تحديث كمية أكبر، فيُنصح باستخدام
ALTER TABLE ... UPDATEmutation
العمليات المتزامنة
update_sequential_consistency وupdate_parallel_mode.
أذونات UPDATE
UPDATE امتياز ALTER UPDATE. لتمكين عبارات UPDATE على جدول محدد لمستخدم معيّن، شغّل:
تفاصيل التنفيذ
_part- اسم الجزء الأصلي_part_offset- رقم الصف في الجزء الأصلي_block_number- رقم block الخاص بالصف في الجزء الأصلي_block_offset- إزاحة block الخاصة بالصف في الجزء الأصلي_data_version- إصدار بيانات البيانات المحدَّثة (رقم block المخصَّص لاستعلامUPDATE)
_part و _part_offset.
تنتمي أجزاء التصحيح إلى تقسيمات مختلفة عن الجزء الأصلي.
ويكون معرّف التقسيم لجزء التصحيح هو patch-<hash of column names in patch part>-<original_partition_id>.
لذلك تُخزَّن أجزاء التصحيح ذات الأعمدة المختلفة في تقسيمات مختلفة.
فعلى سبيل المثال، ستنشئ ثلاثة تحديثات SET x = 1 WHERE <cond> و SET y = 1 WHERE <cond> و SET x = 1, y = 1 WHERE <cond> ثلاثة أجزاء تصحيح في ثلاثة تقسيمات مختلفة.
يمكن دمج أجزاء التصحيح فيما بينها لتقليل عدد التصحيحات المطبَّقة على استعلامات SELECT وتقليل العبء الإضافي. ويستخدم دمج أجزاء التصحيح خوارزمية الدمج الاستبدالية مع _data_version بوصفه version column.
لذلك تحتفظ أجزاء التصحيح دائمًا بأحدث إصدار لكل صف محدَّث في الجزء.
لا تنتظر تحديثات خفيفة الوزن انتهاء عمليات الدمج وعمليات التعديل الجارية حاليًا، بل تستخدم دائمًا snapshot الحالية من data parts لتنفيذ تحديث وإنتاج جزء تصحيح.
وبسبب ذلك، يمكن أن توجد حالتان عند تطبيق أجزاء التصحيح.
فعلى سبيل المثال، إذا قرأنا الجزء A، فسنحتاج إلى تطبيق جزء التصحيح X:
- إذا كان
Xيحتوي على الجزءAنفسه. ويحدث هذا إذا لم يكنAمشاركًا في عملية دمج عند تنفيذUPDATE. - إذا كان
Xيحتوي على الجزأينBوC، اللذين يغطيهما الجزءA. ويحدث هذا إذا كانت هناك عملية دمج (B,C) ->Aقيد التشغيل عند تنفيذUPDATE.
- استخدام merge على الأعمدة المرتَّبة
_partو_part_offset. - استخدام join على العمودين
_block_numberو_block_offset.
ALTER UPDATE- عملياتUPDATEالثقيلة- Lightweight
DELETE- عملياتDELETEخفيفة الوزن APPLY PATCHES- فرض التخزين المادي للتصحيحات في أجزاء البيانات (عملية mutation)