Introduit dans : v1.1.0
Renvoie un tableau des valeurs estimées comme étant les plus fréquentes, ainsi que de leur nombre d’occurrences, dans la colonne spécifiée.
Le tableau résultant est trié par ordre décroissant de fréquence approximative des valeurs (et non des valeurs elles-mêmes).
De plus, le poids de la valeur est pris en compte.
Cette fonction ne garantit pas le résultat.
Dans certaines situations, des erreurs peuvent se produire et elle peut renvoyer des valeurs fréquentes qui ne sont pas les plus fréquentes.
Voir aussi
Syntaxe
approx_top_sum(N[, reserved])(column, weight)
Paramètres
N — Le nombre d’éléments à renvoyer. Facultatif. Valeur par défaut : 10. UInt64
reserved — Facultatif. Définit le nombre de cellules réservées aux valeurs. Si uniq(column) > reserved, le résultat de la fonction topK sera approximatif. Valeur par défaut : N * 3. Valeur maximale : N = 65536. UInt64
Arguments
column — Le nom de la colonne pour laquelle trouver les valeurs les plus fréquentes. String
weight — Le poids. Chaque valeur est comptabilisée weight fois pour le calcul de la fréquence. UInt64
Valeur renvoyée
Renvoie un tableau des valeurs approximativement les plus fréquentes et de leur nombre d’occurrences, triés par ordre décroissant de fréquence approximative. Array
Exemples
Exemple d’utilisation
SELECT approx_top_sum(2)(k, w)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
┌─approx_top_sum(2)(k, w)─┐
│ [('z',10,0),('x',5,0)] │
└─────────────────────────┘
Voir aussi
Dernière modification le 25 juin 2026