الانتقال إلى المحتوى الرئيسي
يدعم ClickHouse جميع دوال SQL التجميعية القياسية (sum، avg، min، max، count)، بالإضافة إلى نطاق واسع من الدوال التجميعية الأخرى.
الصفحةالوصف
aggThrowيمكن استخدام هذه الدالة لاختبار سلامة الاستثناءات. وستُطلق استثناءً عند إنشائها بالاحتمال المحدد.
analysisOfVarianceتوفّر اختبارًا إحصائيًا لتحليل التباين أحادي الاتجاه (اختبار ANOVA). وهو اختبار يُجرى على عدة مجموعات من الملاحظات ذات التوزيع الطبيعي لمعرفة ما إذا كانت جميع المجموعات لها المتوسط نفسه أم لا.
anyتختار أول قيمة تتم مواجهتها في عمود.
anyHeavyتختار قيمة كثيرة التكرار باستخدام خوارزمية heavy hitters. إذا كانت هناك قيمة تظهر في أكثر من نصف الحالات في كل خيوط تنفيذ الاستعلام، فستُعاد هذه القيمة. وعادةً ما تكون النتيجة غير حتمية.
anyLastتختار آخر قيمة تتم مواجهتها في عمود.
approx_top_kتُرجع مصفوفة من القيم الأكثر تكرارًا على نحو تقريبي وتكراراتها في العمود المحدد.
approx_top_sumتُرجع مصفوفة من القيم الأكثر تكرارًا على نحو تقريبي وتكراراتها في العمود المحدد.
argAndMaxتحسب قيمة arg وval لأقصى قيمة val. وإذا كانت هناك عدة صفوف لها نفس val بوصفها القيمة العظمى، فإن تحديد أيٍّ من arg وval المرتبطين بها سيُعاد ليس حتميًا.
argAndMinتحسب قيمة arg وval لأدنى قيمة val. وإذا كانت هناك عدة صفوف لها نفس val بوصفها القيمة الصغرى، فإن تحديد أيٍّ من arg وval المرتبطين بها سيُعاد ليس حتميًا.
argMaxتحسب قيمة arg لأقصى قيمة val.
argMinتحسب قيمة arg لأدنى قيمة val. وإذا كانت هناك عدة صفوف لها نفس val بوصفها القيمة العظمى، فإن تحديد أيٍّ من arg المرتبط بها سيُعاد ليس حتميًا.
avgتحسب المتوسط الحسابي.
avgWeightedتحسب المتوسط الحسابي المرجّح.
boundingRatioدالة تجميع تحسب الميل بين النقطتين الواقعتين في أقصى اليسار وأقصى اليمين ضمن مجموعة من القيم.
categoricalInformationValueتحسب قيمة (P(tag = 1) - P(tag = 0))(log(P(tag = 1)) - log(P(tag = 0))) لكل فئة.
contingencyتحسب الدالة contingency معامل التوافق، وهو قيمة تقيس الارتباط بين عمودين في جدول. وهذا الحساب مشابه لدالة cramersV، لكنه يستخدم مقامًا مختلفًا في الجذر التربيعي.
corrتحسب معامل ارتباط بيرسون.
corrMatrixتحسب مصفوفة الارتباط لمتغيرات عددها N.
corrStableتحسب معامل ارتباط بيرسون، لكنها تستخدم خوارزمية مستقرة عدديًا.
countتحسب عدد الصفوف أو القيم غير NULL.
covarPopتحسب التباين المشترك للمجتمع الإحصائي
covarPopMatrixتُرجع مصفوفة التباين المشترك للمجتمع الإحصائي لمتغيرات عددها N.
covarPopStableتحسب قيمة التباين المشترك للمجتمع الإحصائي
covarSampتحسب قيمة Σ((x - x̅)(y - y̅)) / (n - 1)
covarSampMatrixتُرجع مصفوفة التباين المشترك للعينة لمتغيرات عددها N.
covarSampStableتشبه covarSamp لكنها تعمل ببطء أكبر مع تقديم خطأ حسابي أقل.
cramersVتتراوح نتيجة الدالة cramersV بين 0 (وهو ما يقابل عدم وجود ارتباط بين المتغيرات) و1، ولا يمكن أن تصل إلى 1 إلا عندما تكون كل قيمة محددة بالكامل بواسطة الأخرى. ويمكن النظر إليها على أنها الارتباط بين متغيرين كنسبة مئوية من أقصى تباين ممكن بينهما.
cramersVBiasCorrectedتحسب Cramer’s V، لكنها تستخدم تصحيح الانحياز.
deltaSumتجمع الفرق الحسابي بين الصفوف المتتالية.
deltaSumTimestampتجمع الفرق بين الصفوف المتتالية. وإذا كان الفرق سالبًا، فسيتم تجاهله.
distinctDynamicTypesيحسب قائمة أنواع البيانات المميزة المخزنة في عمود Dynamic.
distinctJSONPathsيحسب قائمة المسارات المميزة المخزنة في عمود JSON.
distinctJSONPathsAndTypesيحسب قائمة المسارات المميزة وأنواعها المخزنة في JSON.
entropyيحسب Shannon entropy لعمود من القيم.
estimateCompressionRatioيقدّر نسبة الضغط لعمود معيّن من دون ضغطه.
exponentialMovingAverageيحسب المتوسط المتحرك الأسي للقيم عند الزمن المحدد.
exponentialTimeDecayedAvgيعيد متوسطًا متحركًا مرجحًا منعمًا أسيًا لقيم سلسلة زمنية عند النقطة الزمنية t.
exponentialTimeDecayedCountيعيد الاضمحلال الأسي التراكمي عبر سلسلة زمنية عند الفهرس الزمني t.
exponentialTimeDecayedMaxيعيد القيمة العظمى للمتوسط المتحرك المنعم أسيًا المحسوب عند الفهرس الزمني t مقارنةً بقيمته عند t-1.
exponentialTimeDecayedSumيعيد مجموع قيم المتوسط المتحرك المنعم أسيًا لسلسلة زمنية عند الفهرس الزمني t.
first_valueهو اسم بديل لـ any، وقد أُضيف للتوافق مع window functions، إذ يلزم أحيانًا معالجة قيم NULL (افتراضيًا، تتجاهل جميع الدوال التجميعية في ClickHouse قيم NULL).
flameGraphدالة تجميعية تنشئ flamegraph باستخدام قائمة من stacktraces.
groupArrayينشئ مصفوفة من قيم الوسيط. ويمكن إضافة القيم إلى المصفوفة بأي ترتيب (غير محدد).
groupArrayArrayيجمّع المصفوفات في مصفوفة أكبر تضم هذه المصفوفات.
groupArrayInsertAtيُدرج قيمة في المصفوفة عند الموضع المحدد.
groupArrayIntersectيعيد تقاطع المصفوفات المعطاة (أي جميع العناصر الموجودة في كل المصفوفات المعطاة).
groupArrayLastينشئ مصفوفة من آخر قيم الوسيط.
groupArrayMovingAvgيحسب المتوسط المتحرك لقيم الإدخال.
groupArrayMovingSumيحسب المجموع المتحرك لقيم الإدخال.
groupArraySampleينشئ مصفوفة من قيم وسيط مأخوذة كعينة. يقتصر حجم المصفوفة الناتجة على max_size عنصرًا. وتُختار قيم الوسيط وتُضاف إلى المصفوفة عشوائيًا.
groupArraySortedيعيد مصفوفة تحتوي على أول N عنصرًا بترتيب تصاعدي.
groupBitAndيطبّق العملية البتّية AND على سلسلة من الأرقام.
groupBitmapيجري حسابات bitmap أو Aggregate انطلاقًا من عمود أعداد صحيحة غير موقّعة، ويعيد cardinality من النوع UInt64، وإذا أُضيفت اللاحقة -State فإنه يعيد Bitmap object.
groupBitmapAndيجري حساب AND لعمود bitmap، ويعيد cardinality من النوع UInt64، وإذا أُضيفت اللاحقة -State فإنه يعيد Bitmap object.
groupBitmapOrيجري حساب OR لعمود bitmap، ويعيد cardinality من النوع UInt64، وإذا أُضيفت اللاحقة -State فإنه يعيد Bitmap object. وهذا مكافئ لـ groupBitmapMerge.
groupBitmapXorيحسب XOR لعمود bitmap، ويعيد cardinality من النوع UInt64، وإذا استُخدم مع اللاحقة -State فإنه يعيد Bitmap object.
groupBitOrيطبّق العملية البتّية OR على سلسلة من الأرقام.
groupBitXorيطبّق العملية البتّية XOR على سلسلة من الأرقام.
groupConcatيحسب سلسلة نصية مضمومة من مجموعة من السلاسل النصية، مع إمكانية الفصل بينها بمحدد اختياري، ومع إمكانية تقييدها اختياريًا بعدد أقصى من العناصر.
groupUniqArrayينشئ مصفوفة من قيم وسيط مختلفة.
intervalLengthSumيحسب الطول الإجمالي لاتحاد جميع النطاقات (المقاطع على المحور العددي).
kolmogorovSmirnovTestيطبّق اختبار Kolmogorov-Smirnov على عينات من مجتمعين.
kurtPopيحسب التفلطح لتسلسل.
kurtSampيحسب تفلطح العينة لتسلسل.
largestTriangleThreeBucketsيطبّق خوارزمية Largest-Triangle-Three-Buckets على بيانات الإدخال.
last_valueيختار آخر قيمة تمت مصادفتها، على نحو مشابه لـ anyLast، لكنه يمكنه قبول NULL أيضًا.
mannWhitneyUTestيطبّق اختبار Mann-Whitney للرتب على عينات من مجتمعين.
maxدالة تجميع تحسب القيمة العظمى عبر مجموعة من القيم.
maxIntersectionsدالة تجميع تحسب الحد الأقصى لعدد مرات تقاطع مجموعة من الفترات مع بعضها البعض (إذا كانت جميع الفترات تتقاطع مرة واحدة على الأقل).
maxIntersectionsPositionدالة تجميع تحسب مواضع ظهور الدالة maxIntersections.
maxMapتحسب القيمة العظمى من المصفوفة value وفقًا للمفاتيح المحددة في المصفوفة key.
meanZTestيطبّق mean z-test على عينات من مجتمعين.
medianدوال median* هي أسماء مستعارة للدوال quantile* المناظرة. وتحسب الوسيط لعينة بيانات رقمية.
minدالة تجميع تحسب القيمة الصغرى عبر مجموعة من القيم.
minMapتحسب القيمة الصغرى من المصفوفة value وفقًا للمفاتيح المحددة في المصفوفة key.
quantileتحسب quantile تقريبيًا لتسلسل بيانات رقمية.
quantileBFloat16تحسب quantile تقريبيًا لعينة تتكوّن من أعداد bfloat16.
quantileDDتحسب quantile تقريبيًا لعينة مع ضمانات للخطأ النسبي.
quantileDeterministicتحسب quantile تقريبيًا لتسلسل بيانات رقمية.
quantileExact Functionsالدوال quantileExact و quantileExactLow و quantileExactHigh و quantileExactExclusive و quantileExactInclusive
quantileExactExclusiveتحسب quantile بدقة لتسلسل بيانات رقمية.
quantileExactHighعلى نحو مماثل لـ quantileExact، تحسب هذه الدالة quantile بدقة لتسلسل بيانات رقمية.
quantileExactInclusiveتحسب quantile بدقة لتسلسل بيانات رقمية.
quantileExactLowعلى نحو مماثل لـ quantileExact، تحسب هذه الدالة quantile بدقة لتسلسل بيانات رقمية.
quantileExactWeightedتحسب quantile بدقة لتسلسل بيانات رقمية، مع أخذ وزن كل عنصر في الاعتبار.
quantileExactWeightedInterpolatedتحسب quantile لتسلسل بيانات رقمية باستخدام linear interpolation، مع أخذ وزن كل عنصر في الاعتبار.
quantileGKتحسب quantile لتسلسل بيانات رقمية باستخدام خوارزمية Greenwald-Khanna.
quantileInterpolatedWeightedتحسب quantile لتسلسل بيانات رقمية باستخدام linear interpolation، مع أخذ وزن كل عنصر في الاعتبار.
quantilePrometheusHistogramتحسب quantile لمُدرَّج تكراري باستخدام linear interpolation.
quantiles Functionsالدوال quantiles و quantilesExactExclusive و quantilesExactInclusive و quantilesGK
quantilesExactExclusiveيحسب قيم quantiles لتسلسل بيانات رقمية بدقة.
quantilesExactInclusiveيحسب قيم quantiles لتسلسل بيانات رقمية بدقة.
quantilesGKتعمل quantilesGK بطريقة مشابهة لـ quantileGK، لكنها تتيح حساب quantiles عند مستويات مختلفة في الوقت نفسه وتُرجع مصفوفة.
quantilesTimingWeightedباستخدام الدقة المحددة، تحسب quantile لتسلسل بيانات رقمية وفقًا لوزن كل عنصر في التسلسل.
quantileTDigestتحسب quantile تقريبيًا لتسلسل بيانات رقمية باستخدام خوارزمية t-digest.
quantileTDigestWeightedتحسب quantile تقريبيًا لتسلسل بيانات رقمية باستخدام خوارزمية t-digest.
quantileTimingباستخدام الدقة المحددة، تحسب quantile لتسلسل بيانات رقمية.
quantileTimingWeightedباستخدام الدقة المحددة، تحسب quantile لتسلسل بيانات رقمية وفقًا لوزن كل عنصر في التسلسل.
rankCorrيحسب معامل الارتباط الرتبي.
simpleLinearRegressionيُجري انحدارًا خطيًا بسيطًا (أحادي البعد).
singleValueOrNullتُستخدم الدالة التجميعية singleValueOrNull لتنفيذ معاملات الاستعلامات الفرعية، مثل x = ALL (SELECT ...). وهي تتحقق مما إذا كانت هناك قيمة واحدة فقط فريدة وغير NULL في البيانات.
skewPopيحسب الالتواء لتسلسل.
skewSampيحسب التواء العينة لتسلسل.
sparkbarترسم الدالة مُدرَّجًا تكراريًا لتكرار القيم x ولمعدل تكرارها y عبر interval [min_x, max_x].
stddevPopالنتيجة تساوي الجذر التربيعي لـ varPop.
stddevPopStableالنتيجة تساوي الجذر التربيعي لـ varPop. وعلى عكس stddevPop، تستخدم هذه الدالة خوارزمية مستقرة عدديًا.
stddevSampالنتيجة تساوي الجذر التربيعي لـ varSamp
stddevSampStableالنتيجة تساوي الجذر التربيعي لـ varSamp. وتستخدم هذه الدالة خوارزمية مستقرة عدديًا.
stochasticLinearRegressionتنفّذ هذه الدالة انحدارًا خطيًا عشوائيًا. وهي تدعم معلمات مخصّصة لمعدل التعلّم، ومعامل التنظيم L2، وحجم الدفعة المصغّرة، كما توفّر عدة طرق لتحديث الأوزان ‏(Adam وsimple SGD وMomentum وNesterov.)
stochasticLogisticRegressionتنفّذ هذه الدالة انحدارًا لوجستيًا عشوائيًا. ويمكن استخدامها لمشكلة تصنيف ثنائي، وتدعم المعلمات المخصّصة نفسها التي يدعمها stochasticLinearRegression وتعمل بالطريقة نفسها.
studentTTestيطبّق اختبار t لستيودنت على عينات من مجتمعين.
studentTTestOneSampleيطبّق اختبار t لستيودنت لعينة واحدة على عينة ومتوسط مجتمع معلوم.
sumيحسب المجموع. يعمل فقط مع الأرقام.
sumCountيحسب مجموع الأرقام ويعدّ عدد الصفوف في الوقت نفسه. يستخدمه مُحسِّن الاستعلامات في ClickHouse: إذا كانت هناك عدة دوال sum أو count أو avg في استعلام، فيمكن استبدالها بدالة sumCount واحدة لإعادة استخدام العمليات الحسابية. ونادرًا ما تكون هناك حاجة إلى استخدام هذه الدالة صراحةً.
sumKahanيحسب مجموع الأرقام باستخدام خوارزمية الجمع التعويضي لكاهان
sumMapيجمع مصفوفة value واحدة أو أكثر وفقًا للمفاتيح المحددة في مصفوفة key. ويُرجع tuple of arrays: المفاتيح بترتيب مفروز، تليها القيم المجمّعة للمفاتيح المقابلة من دون overflow.
sumMapWithOverflowيجمع مصفوفة value وفقًا للمفاتيح المحددة في مصفوفة key. ويُرجع tuple من مصفوفتين: المفاتيح بترتيب مفروز، والقيم المجمّعة للمفاتيح المقابلة. ويختلف عن الدالة sumMap في أنه يُجري الجمع مع overflow.
sumWithOverflowيحسب مجموع الأرقام، باستخدام نوع البيانات نفسه للنتيجة كما في معلمات الإدخال. وإذا تجاوز المجموع القيمة القصوى لهذا النوع من البيانات، فسيُحسب مع overflow.
theilsUتحسب الدالة theilsU معامل عدم اليقين Theils’ U، وهو قيمة تقيس الارتباط بين عمودين في جدول.
timeSeriesChangesToGridدالة تجميعية تحسب تغيّرات على نمط PromQL لبيانات السلاسل الزمنية على الشبكة المحددة.
timeSeriesDeltaToGridدالة تجميع تحسب delta على غرار PromQL لبيانات السلاسل الزمنية على الشبكة المحددة.
timeSeriesDerivToGridدالة تجميع تحسب المشتقة على غرار PromQL لبيانات السلاسل الزمنية على الشبكة المحددة.
timeSeriesGroupArrayترتّب السلاسل الزمنية حسب الطابع الزمني بترتيب تصاعدي.
timeSeriesInstantDeltaToGridدالة تجميع تحسب idelta على غرار PromQL لبيانات السلاسل الزمنية على الشبكة المحددة.
timeSeriesInstantRateToGridدالة تجميع تحسب irate على غرار PromQL لبيانات السلاسل الزمنية على الشبكة المحددة.
timeSeriesLastTwoSamplesدالة تجميع لإعادة أخذ عينات من بيانات السلاسل الزمنية من أجل حساب irate وidelta على غرار PromQL
timeSeriesPredictLinearToGridدالة تجميع تحسب التنبؤ الخطي على غرار PromQL لبيانات السلاسل الزمنية على الشبكة المحددة.
timeSeriesRateToGridدالة تجميع تحسب rate على غرار PromQL لبيانات السلاسل الزمنية على الشبكة المحددة.
timeSeriesResampleToGridWithStalenessدالة تجميع تعيد أخذ عينات من بيانات السلاسل الزمنية إلى الشبكة المحددة.
timeSeriesResetsToGridدالة تجميع تحسب resets على غرار PromQL لبيانات السلاسل الزمنية على الشبكة المحددة.
topKتعيد مصفوفة من القيم الأكثر تكرارًا بصورة تقريبية في العمود المحدد. وتُرتَّب المصفوفة الناتجة ترتيبًا تنازليًا بحسب التكرار التقريبي للقيم، لا بحسب القيم نفسها.
topKWeightedتعيد مصفوفة من القيم الأكثر تكرارًا بصورة تقريبية في العمود المحدد. وتُرتَّب المصفوفة الناتجة ترتيبًا تنازليًا بحسب التكرار التقريبي للقيم، لا بحسب القيم نفسها. بالإضافة إلى ذلك، يُؤخذ وزن القيمة في الاعتبار.
uniqتحسب العدد التقريبي للقيم المختلفة للوسيطة.
uniqCombinedتحسب العدد التقريبي لقيم الوسائط المختلفة.
uniqCombined64تحسب العدد التقريبي لقيم الوسائط المختلفة. وهي مماثلة لـ uniqCombined، لكنها تستخدم hash بطول 64 بت لجميع أنواع البيانات بدلًا من استخدامه لنوع البيانات String فقط.
uniqExactتحسب العدد الدقيق لقيم الوسائط المختلفة.
uniqHLL12تحسب العدد التقريبي لقيم الوسائط المختلفة باستخدام خوارزمية HyperLogLog.
uniqThetaتحسب العدد التقريبي لقيم الوسائط المختلفة باستخدام Theta Sketch Framework.
varPopتحسب تباين المجتمع الإحصائي.
varPopStableتعيد تباين المجتمع الإحصائي. وعلى خلاف varPop، تستخدم هذه الدالة خوارزمية مستقرة عدديًا. وهي أبطأ، لكنها توفر خطأً حسابيًا أقل.
varSampتحسب تباين العينة لمجموعة بيانات.
varSampStableتحسب تباين العينة لمجموعة بيانات. وعلى خلاف varSamp، تستخدم هذه الدالة خوارزمية مستقرة عدديًا. وهي أبطأ، لكنها توفر خطأً حسابيًا أقل.
welchTTestتطبّق اختبار t لـ Welch على عينات من مجتمعين إحصائيين.
آخر تعديل في ٢٥ يونيو ٢٠٢٦