quantileBFloat16
bfloat16 est un type de données à virgule flottante avec 1 bit de signe, 8 bits d’exposant et 7 bits de fraction.
La fonction convertit les valeurs d’entrée en nombres à virgule flottante de 32 bits et conserve les 16 bits de poids fort. Elle calcule ensuite la valeur du quantile bfloat16, puis convertit le résultat en nombre à virgule flottante de 64 bits en ajoutant des bits nuls.
La fonction est un estimateur rapide de quantile, avec une erreur relative maximale de 0.78125% (et une erreur relative moyenne d’environ 0.27%), correspondant à la précision de mantisse sur 7 bits de bfloat16.
Syntaxe
medianBFloat16
Paramètres
level— Facultatif. Niveau du quantile. Les valeurs possibles vont de 0 à 1. Valeur par défaut : 0.5.Float*
Float64
Exemples
Calcul du quantile en bfloat16
Query
Response