تم تقديمه في: v1.1.0
يعيد مصفوفة بالقيم الأكثر تكرارًا على نحو تقريبي في العمود المحدد.
تُرتَّب المصفوفة الناتجة ترتيبًا تنازليًا بحسب التكرار التقريبي للقيم (وليس بحسب القيم نفسها).
بالإضافة إلى ذلك، يُؤخَذ وزن القيمة في الاعتبار.
انظر أيضًا
البنية
topKWeighted(N)(column, weight)
topKWeighted(N, load_factor)(column, weight)
topKWeighted(N, load_factor, 'counts')(column, weight)
المعاملات
N — عدد العناصر المطلوب إرجاعها. القيمة الافتراضية: 10. UInt64
load_factor — اختياري. يحدد عدد الخلايا المخصّصة للقيم. إذا كانت uniq(column) > N * load_factor، فستكون نتيجة الدالة topK تقريبية. القيمة الافتراضية: 3. UInt64
counts — اختياري. يحدد ما إذا كان ينبغي أن تحتوي النتيجة على عدد تقريبي وقيمة خطأ. Bool
الوسيطات
column — اسم العمود المطلوب العثور على القيم الأكثر تكرارًا فيه. - weight — الوزن. تُحتسب كل قيمة بعدد weight مرات عند حساب التكرار. UInt64
القيمة المُعادة
يعيد مصفوفة من القيم ذات أكبر مجموع تقريبي للأوزان. Array
أمثلة
مثال على الاستخدام
SELECT topKWeighted(2)(k, w) FROM
VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
┌─topKWeighted(2)(k, w)──┐
│ ['z','x'] │
└────────────────────────┘
باستخدام المعلَمة counts
SELECT topKWeighted(2, 10, 'counts')(k, w)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
┌─topKWeighted(2, 10, 'counts')(k, w)─┐
│ [('z',10,0),('x',5,0)] │
└─────────────────────────────────────┘
راجع أيضًا
آخر تعديل في ٢٥ يونيو ٢٠٢٦