Passer au contenu principal

approx_top_sum

Introduit dans : v1.1.0 Renvoie un tableau des valeurs estimées comme étant les plus fréquentes, ainsi que de leur nombre d’occurrences, dans la colonne spécifiée. Le tableau résultant est trié par ordre décroissant de fréquence approximative des valeurs (et non des valeurs elles-mêmes). De plus, le poids de la valeur est pris en compte. Cette fonction ne garantit pas le résultat. Dans certaines situations, des erreurs peuvent se produire et elle peut renvoyer des valeurs fréquentes qui ne sont pas les plus fréquentes. Voir aussi Syntaxe
approx_top_sum(N[, reserved])(column, weight)
Paramètres
  • N — Le nombre d’éléments à renvoyer. Facultatif. Valeur par défaut : 10. UInt64
  • reserved — Facultatif. Définit le nombre de cellules réservées aux valeurs. Si uniq(column) > reserved, le résultat de la fonction topK sera approximatif. Valeur par défaut : N * 3. Valeur maximale : N = 65536. UInt64
Arguments
  • column — Le nom de la colonne pour laquelle trouver les valeurs les plus fréquentes. String
  • weight — Le poids. Chaque valeur est comptabilisée weight fois pour le calcul de la fréquence. UInt64
Valeur renvoyée Renvoie un tableau des valeurs approximativement les plus fréquentes et de leur nombre d’occurrences, triés par ordre décroissant de fréquence approximative. Array Exemples Exemple d’utilisation
Query
SELECT approx_top_sum(2)(k, w)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
Response
┌─approx_top_sum(2)(k, w)─┐
│ [('z',10,0),('x',5,0)]  │
└─────────────────────────┘
Voir aussi
Dernière modification le 25 juin 2026