الانتقال إلى المحتوى الرئيسي
الاستعلام في ClickHouse Cloudتُخزَّن بيانات جدول النظام هذا محليًا على كل عقدة في ClickHouse Cloud. لذلك، يتطلب الحصول على رؤية كاملة لجميع البيانات استخدام الدالة clusterAllReplicas. راجع هنا لمزيد من التفاصيل.

الوصف

يحتوي على إحصاءات الانتقائية المستندة إلى عيّنات التي جُمعت أثناء القراءة من جداول MergeTree. ولا تتم تعبئة هذا الجدول إلا عندما تكون قيمة predicate_statistics_sample_rate أكبر من 0. استخدم هذا الجدول لفحص مدى انتقائية المسندات التي يحدّدها المستخدم في أعباء العمل الفعلية، ومعرفة عدد الحبيبات المتبقية بعد التصفية بالمفتاح الأساسي أو بفهرس التخطي. وهذه البيانات مخصّصة لتكون مدخلات لتوصيات الفهارس والإسقاطات المستندة إلى أعباء العمل.

أنماط الصفوف

يمكن أن ينتج الاستعلام الواحد نوعين من الصفوف في system.predicate_statistics_log:
  • صفوف التصفية، وتُصدَر لكل خطوة prewhere/تصفية في MergeTreeSelectProcessor. وتملأ الأعمدة predicate_expression وinput_rows وpassed_rows وfilter_selectivity، بالإضافة إلى أعمدة المسند الكامل total_input_rows وtotal_passed_rows وtotal_selectivity. أما الأعمدة المرتبطة بالفهارس فتكون فارغة.
  • صفوف الفهارس، وتُصدَر لكل خطوة قراءة في ReadFromMergeTree. وتملأ المصفوفات index_names وindex_types وtotal_granules وgranules_after وindex_selectivities، بمدخل واحد لكل مرحلة فهرسة (المفتاح الأساسي، والتقسيم، وفهارس التخطي). أما الأعمدة المرتبطة بالمسند فتكون فارغة.
تشترك صفوف التصفية وصفوف الفهارس الخاصة بالاستعلام نفسه في القيمتين query_id وtable، لذلك يمكن ضمّها عند الحاجة إلى كليهما.

أخذ العينات والعبء الإضافي

يُتحكَّم في أخذ العينات بواسطة predicate_statistics_sample_rate:
  • 0 يعطّل الجمع.
  • 1 يأخذ عيّنة من كل query.
  • N > 1 يأخذ عيّنة من حوالي 1 / N من queries، استنادًا إلى قيمة hash لـ query_id.
تنتج القيم الأقل مزيدًا من البيانات، لكنها تضيف حملًا على CPU في مسار القراءة ومزيدًا من عمليات الكتابة إلى سجل النظام. بعد تمكين هذا الإعداد، استخدم SYSTEM FLUSH LOGS إذا كنت بحاجة إلى ظهور الصفوف فورًا.

الأعمدة

  • hostname (LowCardinality(String)) — اسم المضيف للخادم الذي ينفّذ الاستعلام.
  • event_date (Date) — تاريخ الحدث.
  • event_time (DateTime) — الطابع الزمني عند كتابة مُدخل السجل هذا.
  • database (LowCardinality(String)) — اسم قاعدة بيانات الجدول الهدف.
  • table (LowCardinality(String)) — اسم الجدول الهدف.
  • query_id (String) — معرّف الاستعلام للرجوع إلى query_log.
  • predicate_expression (String) — تعبير المسند الكامل الذي تتعامل معه خطوة prewhere/filter هذه (تفريغ ActionsDAG).
  • input_rows (UInt64) — الصفوف التي تدخل إلى خطوة prewhere/filter هذه.
  • passed_rows (UInt64) — الصفوف التي اجتازت خطوة prewhere/filter هذه.
  • filter_selectivity (Float64) — انتقائية هذه الخطوة: passed_rows / input_rows.
  • total_input_rows (UInt64) — الصفوف التي تدخل إلى أول خطوة prewhere (إجمالي الصفوف المقروءة من الحبيبات).
  • total_passed_rows (UInt64) — الصفوف التي اجتازت جميع خطوات prewhere (الصفوف التي تم تمريرها إلى الاستعلام).
  • total_selectivity (Float64) — انتقائية المسند بالكامل: total_passed_rows / total_input_rows.
  • index_names (Array(LowCardinality(String))) — أسماء الفهارس المطبّقة، مثل [‘PrimaryKey’, ‘idx_bf_status’] (في صفوف الفهرس فقط).
  • index_types (Array(LowCardinality(String))) — أنواع الفهارس المطبّقة: PrimaryKey وSkip وMinMax وPartition (في صفوف الفهرس فقط).
  • total_granules (Array(UInt64)) — الحبيبات الداخلة إلى كل مرحلة فهرسة (في صفوف الفهرس فقط).
  • granules_after (Array(UInt64)) — الحبيبات المتبقية بعد كل مرحلة فهرسة (في صفوف الفهرس فقط).
  • index_selectivities (Array(Float64)) — الانتقائية لكل فهرس: granules_after / total_granules (في صفوف الفهرس فقط).

مثال

SET predicate_statistics_sample_rate = 1;

SELECT *
FROM hits
WHERE URL LIKE '%/product/%' AND EventDate >= today() - 7
FORMAT Null;

SYSTEM FLUSH LOGS predicate_statistics_log;

SELECT
    query_id,
    predicate_expression,
    round(filter_selectivity, 3) AS step_selectivity,
    round(total_selectivity, 3) AS query_selectivity,
    index_names,
    index_selectivities
FROM system.predicate_statistics_log
WHERE table = 'hits'
ORDER BY event_time DESC
LIMIT 10;

انظر أيضًا

آخر تعديل في ٢٥ يونيو ٢٠٢٦