الانتقال إلى المحتوى الرئيسي

approx_top_sum

أُضيف في: v1.1.0 يعيد مصفوفة تتضمن القيم الأكثر تكرارًا تقريبيًا وعدد مرات ظهور كل منها في العمود المحدد. تُرتَّب المصفوفة الناتجة ترتيبًا تنازليًا حسب التكرار التقريبي للقيم (وليس حسب القيم نفسها). بالإضافة إلى ذلك، يُؤخذ وزن القيمة في الحسبان. لا تضمن هذه الدالة نتيجةً مضمونة. في بعض الحالات، قد تحدث أخطاء وقد تُعيد قيمًا متكررة ليست هي الأكثر تكرارًا. راجع أيضًا الصياغة
approx_top_sum(N[, reserved])(column, weight)
المعلمات
  • N — عدد العناصر المطلوب إرجاعها. اختياري. القيمة الافتراضية: 10. UInt64
  • reserved — اختياري. يحدّد عدد الخلايا المحجوزة للقيم. إذا كان uniq(column) > reserved، فستكون نتيجة الدالة topK تقريبية. القيمة الافتراضية: N * 3. القيمة القصوى لـ N = 65536. UInt64
الوسيطات
  • column — اسم العمود المراد العثور فيه على القيم الأكثر تكرارًا. String
  • weight — الوزن. تُحتسب كل قيمة weight مرةً عند حساب التكرار. UInt64
القيمة المُعادة تُرجِع مصفوفة من القيم الأكثر تكرارًا على نحو تقريبي، مع عدد مرات تكرارها، مرتبةً ترتيبًا تنازليًا حسب التكرار التقريبي. Array أمثلة مثال على الاستخدام
Query
SELECT approx_top_sum(2)(k, w)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
Response
┌─approx_top_sum(2)(k, w)─┐
│ [('z',10,0),('x',5,0)]  │
└─────────────────────────┘
انظر أيضًا
آخر تعديل في ٢٥ يونيو ٢٠٢٦