الانتقال إلى المحتوى الرئيسي

quantilesGK

قُدِّمت في: v23.4.0 تحسب عدة كمّيات لتسلسل بيانات رقمية عند مستويات مختلفة في الوقت نفسه باستخدام خوارزمية Greenwald-Khanna. تعمل هذه الدالة بطريقة مشابهة لـ quantileGK، لكنها تتيح حساب عدة مستويات للكمّيات في تمريرة واحدة، ما يجعلها أكثر كفاءة من استدعاء دوال الكمّيات الفردية. تُستخدم خوارزمية Greenwald-Khanna لحساب الكمّيات على تدفق من البيانات بكفاءة عالية جدًا. وقد طرحها Michael Greenwald وSanjeev Khanna في عام 2001. وتتميز الخوارزمية بكفاءة عالية جدًا، إذ لا تتطلب سوى مساحة O(log n) وزمن O(log log n) لكل عنصر (حيث إن n هو حجم المُدخلات). كما أنها عالية الدقة أيضًا، إذ توفر قيم كمّيات تقريبية بدقة قابلة للتحكم. البنية
quantilesGK(accuracy, level1, level2, ...)(expr)
المعلمات
  • accuracy — دقة الكوانتايلات. عدد صحيح موجب ثابت. كلما زادت قيمة الدقة، قلّ الخطأ. على سبيل المثال، إذا ضُبطت وسيطة الدقة على 100، فسيكون خطأ الكوانتايلات المحسوبة لا يتجاوز 1% باحتمال عالٍ. هناك مفاضلة بين دقة الكوانتايلات المحسوبة والتعقيد الحسابي للخوارزمية. UInt*
  • level — مستويات الكوانتايل. عدد واحد أو أكثر من الأعداد الثابتة ذات الفاصلة العائمة من 0 إلى 1. Float*
الوسائط
  • expr — تعبير على قيم العمود ينتج عنه أنواع بيانات رقمية أو Date أو DateTime. (U)Int* أو Float* أو Decimal* أو Date أو DateTime
القيمة المعادة مصفوفة من الكوانتايلات للمستويات المحددة، وبالترتيب نفسه الذي حُددت به هذه المستويات. Array(Float64) أو Array(Date) أو Array(DateTime) أمثلة حساب عدة كوانتايلات باستخدام خوارزمية GK
Query
SELECT quantilesGK(1, 0.25, 0.5, 0.75)(number + 1) FROM numbers(1000);
Response
┌─quantilesGK(1, 0.25, 0.5, 0.75)(plus(number, 1))─┐
│ [1, 1, 1]                                        │
└──────────────────────────────────────────────────┘
كوانتايلات بدقة أعلى
Query
SELECT quantilesGK(100, 0.25, 0.5, 0.75)(number + 1) FROM numbers(1000);
Response
┌─quantilesGK(100, 0.25, 0.5, 0.75)(plus(number, 1))─┐
│ [251, 498, 741]                                    │
└────────────────────────────────────────────────────┘
آخر تعديل في ٢٥ يونيو ٢٠٢٦