الانتقال إلى المحتوى الرئيسي

topKWeighted

تم تقديمه في: v1.1.0 يعيد مصفوفة بالقيم الأكثر تكرارًا على نحو تقريبي في العمود المحدد. تُرتَّب المصفوفة الناتجة ترتيبًا تنازليًا بحسب التكرار التقريبي للقيم (وليس بحسب القيم نفسها). بالإضافة إلى ذلك، يُؤخَذ وزن القيمة في الاعتبار. انظر أيضًا البنية
topKWeighted(N)(column, weight)
topKWeighted(N, load_factor)(column, weight)
topKWeighted(N, load_factor, 'counts')(column, weight)
المعاملات
  • N — عدد العناصر المطلوب إرجاعها. القيمة الافتراضية: 10. UInt64
  • load_factor — اختياري. يحدد عدد الخلايا المخصّصة للقيم. إذا كانت uniq(column) > N * load_factor، فستكون نتيجة الدالة topK تقريبية. القيمة الافتراضية: 3. UInt64
  • counts — اختياري. يحدد ما إذا كان ينبغي أن تحتوي النتيجة على عدد تقريبي وقيمة خطأ. Bool
الوسيطات
  • column — اسم العمود المطلوب العثور على القيم الأكثر تكرارًا فيه. - weight — الوزن. تُحتسب كل قيمة بعدد weight مرات عند حساب التكرار. UInt64
القيمة المُعادة يعيد مصفوفة من القيم ذات أكبر مجموع تقريبي للأوزان. Array أمثلة مثال على الاستخدام
Query
SELECT topKWeighted(2)(k, w) FROM
VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
Response
┌─topKWeighted(2)(k, w)──┐
│ ['z','x']              │
└────────────────────────┘
باستخدام المعلَمة counts
Query
SELECT topKWeighted(2, 10, 'counts')(k, w)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
Response
┌─topKWeighted(2, 10, 'counts')(k, w)─┐
│ [('z',10,0),('x',5,0)]              │
└─────────────────────────────────────┘
راجع أيضًا
آخر تعديل في ٢٥ يونيو ٢٠٢٦