Les fonctions de recherche dans les chaînes et de remplacement dans les chaînes sont décrites séparément.
La documentation ci-dessous est générée à partir de la table système system.functions.
Introduit dans : v20.1.0
Calcule la somme de contrôle CRC32 d’une chaîne de caractères à l’aide du polynôme CRC-32-IEEE 802.3 et de la valeur initiale 0xffffffff (implémentation zlib).
Syntaxe
Arguments
s — Chaîne String pour laquelle calculer le CRC32. String
Valeur renvoyée
Renvoie la somme de contrôle CRC32 de la chaîne. UInt32
Exemples
Exemple d’utilisation
SELECT CRC32('ClickHouse')
┌─CRC32('ClickHouse')─┐
│ 1538217360 │
└─────────────────────┘
Introduit dans : v20.1.0
Calcule la somme de contrôle CRC32 d’une chaîne de caractères à l’aide du polynôme CRC-32-IEEE 802.3.
Syntaxe
Arguments
s — Chaîne dont il faut calculer le CRC32. String
Valeur renvoyée
Renvoie la somme de contrôle CRC32 de la chaîne. UInt32
Exemples
Exemple d’utilisation
SELECT CRC32IEEE('ClickHouse');
┌─CRC32IEEE('ClickHouse')─┐
│ 3089448422 │
└─────────────────────────┘
Introduit dans : v20.1.0
Calcule la somme de contrôle CRC64 d’une chaîne de caractères à l’aide du polynôme CRC-64-ECMA.
Syntaxe
Arguments
s — Chaîne pour laquelle calculer la somme de contrôle CRC64. String
Valeur renvoyée
Renvoie la somme de contrôle CRC64 de la chaîne. UInt64
Exemples
Exemple d’utilisation
SELECT CRC64('ClickHouse');
┌──CRC64('ClickHouse')─┐
│ 12126588151325169346 │
└──────────────────────┘
appendTrailingCharIfAbsent
Introduit dans : v1.1.0
Ajoute le caractère c à la chaîne s si s n’est pas vide et ne se termine pas par le caractère c.
Syntaxe
appendTrailingCharIfAbsent(s, c)
Arguments
s — Chaîne d’entrée. String
c — Caractère à ajouter s’il est absent. String
Valeur renvoyée
Renvoie la chaîne s avec le caractère c ajouté si s ne se termine pas par c. String
Exemples
Exemple d’utilisation
SELECT appendTrailingCharIfAbsent('https://example.com', '/');
┌─appendTraili⋯.com', '/')─┐
│ https://example.com/ │
└──────────────────────────┘
Introduit dans : v22.11.0
Renvoie le code ASCII du premier caractère de la chaîne s, sous la forme d’un Int32.
Syntaxe
Arguments
s — Entrée de type String. String
Valeur renvoyée
Renvoie le code ASCII du premier caractère. Si s est vide, le résultat est 0. Si le premier caractère n’est pas un caractère ASCII ou n’appartient pas à la plage Latin-1 Supplement de l’UTF-16, le résultat n’est pas défini. Int32
Exemples
Exemple d’utilisation
┌─ascii('234')─┐
│ 50 │
└──────────────┘
Introduit dans : v25.6.0
Décode une chaîne Base32 (RFC 4648).
Si la chaîne n’est pas encodée en Base32 correctement, une exception est levée.
Syntaxe
Arguments
encoded — Colonne de type String ou constante. String
Valeur renvoyée
Renvoie une chaîne contenant la valeur décodée de l’argument. String
Exemples
Exemple d’utilisation
SELECT base32Decode('IVXGG33EMVSA====');
┌─base32Decode('IVXGG33EMVSA====')─┐
│ Encoded │
└──────────────────────────────────┘
Introduit dans : v25.6.0
Encode une chaîne à l’aide de Base32.
Syntaxe
Arguments
plaintext — Texte en clair à encoder. String
Valeur renvoyée
Renvoie une chaîne contenant la valeur encodée de l’argument. String ou FixedString
Exemples
Exemple d’utilisation
SELECT base32Encode('Encoded')
┌─base32Encode('Encoded')─┐
│ IVXGG33EMVSA==== │
└─────────────────────────┘
Introduit dans : v22.7.0
Décode une chaîne Base58.
Si la chaîne n’est pas encodée en Base58 de manière valide, une exception est levée.
Un second argument facultatif, expected_size, peut être fourni pour sélectionner un décodeur optimisé de taille fixe.
Les valeurs actuellement prises en charge sont 32 et 64. Pour toute autre valeur, le décodeur générique est utilisé.
Lorsque le décodeur optimisé est sélectionné, mais que l’entrée ne peut pas être décodée en un nombre d’octets correspondant exactement à cette taille,
la fonction lève une exception (ou renvoie une chaîne vide pour tryBase58Decode).
Syntaxe
base58Decode(encoded[, expected_size])
Arguments
encoded — Colonne ou constante de type String à décoder. String
expected_size — Facultatif. Taille décodée attendue en octets. Lorsqu’elle est de 32 ou 64, un décodeur optimisé est utilisé ; pour les autres valeurs, le décodeur générique est utilisé. UInt8, UInt16, UInt32, or UInt64
Valeur renvoyée
Renvoie une chaîne contenant la valeur décodée de l’argument. String
Exemples
Exemple d’utilisation
SELECT base58Decode('JxF12TrwUP45BMd');
┌─base58Decode⋯rwUP45BMd')─┐
│ Hello World │
└──────────────────────────┘
Introduite dans : v22.7.0
Encode une chaîne en Base58.
Syntaxe
Arguments
plaintext — Texte en clair à encoder. String
Valeur renvoyée
Renvoie une chaîne contenant la valeur encodée de l’argument. String
Exemples
Exemple d’utilisation
SELECT base58Encode('ClickHouse');
┌─base58Encode('ClickHouse')─┐
│ 4nhk8K7GHXf6zx │
└────────────────────────────┘
Introduit dans : v18.16.0
Décode une chaîne à partir d’une représentation Base64, conformément à la RFC 4648.
Lève une exception en cas d’erreur.
Syntaxe
Alias : FROM_BASE64
Arguments
encoded — colonne ou constante de type String à décoder. Si la chaîne n’est pas encodée en Base64 de manière valide, une exception est levée. String
Valeur renvoyée
Renvoie la chaîne décodée. String
Exemples
Exemple d’utilisation
SELECT base64Decode('Y2xpY2tob3VzZQ==')
┌─base64Decode('Y2xpY2tob3VzZQ==')─┐
│ clickhouse │
└──────────────────────────────────┘
Introduit dans : v18.16.0
Encode une chaîne à l’aide de la représentation Base64, conformément à la RFC 4648.
Syntaxe
alias : TO_BASE64
Arguments
plaintext — Colonne ou constante de texte en clair à décoder. String
Valeur renvoyée
Renvoie une chaîne contenant la valeur encodée de l’argument. String
Exemples
Exemple d’utilisation
SELECT base64Encode('clickhouse')
┌─base64Encode('clickhouse')─┐
│ Y2xpY2tob3VzZQ== │
└────────────────────────────┘
Introduit dans : v24.6.0
Décode une chaîne à partir d’une représentation Base64 en utilisant un alphabet sûr pour les URL, conformément à la RFC 4648.
Lève une exception en cas d’erreur.
Syntaxe
Arguments
encoded — Colonne String ou constante à encoder. Si la chaîne n’est pas une chaîne Base64 valide, une exception est levée. String
Valeur renvoyée
Renvoie une chaîne contenant la valeur décodée de l’argument. String
Exemples
Exemple d’utilisation
SELECT base64URLDecode('aHR0cHM6Ly9jbGlja2hvdXNlLmNvbQ')
┌─base64URLDecode('aHR0cHM6Ly9jbGlja2hvdXNlLmNvbQ')─┐
│ https://clickhouse.com │
└───────────────────────────────────────────────────┘
Introduit dans : v18.16.0
Encode une chaîne à l’aide de la représentation Base64 (RFC 4648) en utilisant un alphabet compatible avec les URL.
Syntaxe
base64URLEncode(plaintext)
Arguments
plaintext — Colonne ou constante de texte en clair à encoder. String
Valeur renvoyée
Renvoie une chaîne contenant la valeur encodée de l’argument. String
Exemples
Exemple d’utilisation
SELECT base64URLEncode('https://clickhouse.com')
┌─base64URLEncode('https://clickhouse.com')─┐
│ aHR0cHM6Ly9jbGlja2hvdXNlLmNvbQ │
└───────────────────────────────────────────┘
Introduit dans : v20.1.0
Extrait la partie finale d’une chaîne après sa dernière barre oblique (« / ») ou barre oblique inversée (« \ »).
Cette fonction est souvent utilisée pour extraire le nom de fichier d’un chemin.
Syntaxe
Arguments
expr — Une expression de chaîne de caractères. Les antislashs doivent être échappés. String
Valeur renvoyée
Renvoie la partie finale de la chaîne d’entrée après son dernier slash ou antislash. Si la chaîne d’entrée se termine par un slash ou un antislash, la fonction renvoie une chaîne vide. Renvoie la chaîne d’origine s’il n’y a ni slash ni antislash. String
Exemples
Extraire le nom du fichier à partir d’un chemin Unix
SELECT 'some/long/path/to/file' AS a, basename(a)
┌─a──────────────────────┬─basename('some/long/path/to/file')─┐
│ some/long/path/to/file │ file │
└────────────────────────┴────────────────────────────────────┘
Extraire le nom du fichier depuis un chemin Windows
SELECT 'some\\long\\path\\to\\file' AS a, basename(a)
┌─a──────────────────────┬─basename('some\\long\\path\\to\\file')─┐
│ some\long\path\to\file │ file │
└────────────────────────┴────────────────────────────────────────┘
Chaîne sans séparateur de chemin
SELECT 'some-file-name' AS a, basename(a)
┌─a──────────────┬─basename('some-file-name')─┐
│ some-file-name │ some-file-name │
└────────────────┴────────────────────────────┘
Introduit dans : v23.9.0
Calcule la distance de Hamming entre deux chaînes d’octets.
Syntaxe
byteHammingDistance(s1, s2)
Alias : mismatches
Arguments
s1 — Première chaîne d’entrée. String
s2 — Deuxième chaîne d’entrée. String
Valeur renvoyée
Renvoie la distance de Hamming entre les deux chaînes. UInt64
Exemples
Exemple d’utilisation
SELECT byteHammingDistance('karolin', 'kathrin')
┌─byteHammingDistance('karolin', 'kathrin')─┐
│ 3 │
└───────────────────────────────────────────┘
Introduit dans : v26.3.0
Applique le repliement de casse Unicode à une chaîne UTF-8, en la convertissant en une forme normalisée proche des minuscules, adaptée aux comparaisons insensibles à la casse.
Applique le repliement de casse Unicode standard. Préserve les caractères de compatibilité qui ne sont pas affectés par le repliement de casse
(par ex. les chiffres romains, les chiffres encerclés), mais notez que certaines ligatures comme ffi sont tout de même décomposées, car le repliement de casse Unicode lui-même les étend.
Syntaxe
Arguments
str — chaîne d’entrée encodée en UTF-8. String
Valeur renvoyée
Chaîne UTF-8 après normalisation de la casse. String
Exemples
Normalisation de la casse de base
SELECT caseFoldUTF8('Straße')
┌─caseFoldUTF8('Straße')─┐
│ strasse │
└─────────────────────────┘
Introduit dans : v25.2.0
Compare deux chaînes de caractères dans l’ordre lexicographique.
Syntaxe
compareSubstrings(s1, s2, s1_offset, s2_offset, num_bytes)
Arguments
s1 — La première chaîne à comparer. String
s2 — La deuxième chaîne à comparer. String
s1_offset — La position (à partir de zéro) dans s1 à partir de laquelle la comparaison commence. UInt*
s2_offset — La position (indice commençant à zéro) dans s2 à partir de laquelle la comparaison commence. UInt*
num_bytes — Le nombre maximal d’octets à comparer dans les deux chaînes. Si s1_offset (ou s2_offset) + num_bytes dépasse la fin d’une chaîne d’entrée, num_bytes est réduit en conséquence. UInt*
Valeur renvoyée
Renvoie :
-1 si s1[s1_offset : s1_offset + num_bytes] < s2[s2_offset : s2_offset + num_bytes].
0 si s1[s1_offset : s1_offset + num_bytes] = s2[s2_offset : s2_offset + num_bytes].
1 si s1[s1_offset : s1_offset + num_bytes] > s2[s2_offset : s2_offset + num_bytes].
Int8
Exemples
Exemple d’utilisation
SELECT compareSubstrings('Saxony', 'Anglo-Saxon', 0, 6, 5) AS result
┌─result─┐
│ 0 │
└────────┘
Introduit dans : v1.1.0
Concatène les arguments fournis.
Les arguments qui ne sont pas de type String ou FixedString sont convertis en chaînes de caractères à l’aide de leur sérialisation par défaut.
Comme cela dégrade les performances, il n’est pas recommandé d’utiliser des arguments autres que String/FixedString.
Syntaxe
Arguments
s1, s2, ... — N’importe quel nombre de valeurs de n’importe quel type. Any
Valeur renvoyée
Renvoie la String obtenue par concaténation des arguments. Si l’un des arguments est NULL, la fonction renvoie NULL. S’il n’y a aucun argument, elle renvoie une chaîne vide. Nullable(String)
Exemples
Concaténation de chaînes
SELECT concat('Hello, ', 'World!')
┌─concat('Hello, ', 'World!')─┐
│ Hello, World! │
└─────────────────────────────┘
Concaténation de nombres
┌─concat(42, 144)─┐
│ 42144 │
└─────────────────┘
Introduit dans : v1.1.0
Comme concat, mais en supposant que concat(s1, s2, ...) → sn est injective,
c’est-à-dire qu’elle renvoie des résultats différents pour des arguments différents.
Peut être utilisée pour optimiser GROUP BY.
Syntaxe
concatAssumeInjective([s1, s2, ...])
Arguments
s1, s2, ... — Un nombre quelconque de valeurs de type arbitraire. String ou FixedString
Valeur renvoyée
Renvoie la chaîne créée par concaténation des arguments. Si l’une des valeurs d’argument est NULL, la fonction renvoie NULL. Si aucun argument n’est transmis, elle renvoie une chaîne vide. String
Exemples
Optimisation du GROUP BY
SELECT concat(key1, key2), sum(value) FROM key_val GROUP BY concatAssumeInjective(key1, key2)
┌─concat(key1, key2)─┬─sum(value)─┐
│ Hello, World! │ 3 │
│ Hello, World! │ 2 │
│ Hello, World │ 3 │
└────────────────────┴────────────┘
Introduit dans : v22.12.0
Concatène les chaînes fournies en les séparant à l’aide du séparateur spécifié.
Syntaxe
concatWithSeparator(sep[, exp1, exp2, ...])
Alias : concat_ws
Arguments
sep — Le séparateur à utiliser. const String ou const FixedString
exp1, exp2, ... — Expressions à concaténer. Les arguments dont le type n’est ni String ni FixedString sont convertis en chaînes à l’aide de leur sérialisation par défaut. Comme cela réduit les performances, il n’est pas recommandé d’utiliser des arguments autres que String/FixedString. Any
Valeur renvoyée
Renvoie la chaîne obtenue en concaténant les arguments. Si l’une des valeurs d’argument est NULL, la fonction renvoie NULL. String
Exemples
Exemple d’utilisation
SELECT concatWithSeparator('a', '1', '2', '3', '4')
┌─concatWithSeparator('a', '1', '2', '3', '4')─┐
│ 1a2a3a4 │
└──────────────────────────────────────────────┘
concatWithSeparatorAssumeInjective
Introduit dans : v22.12.0
Semblable à concatWithSeparator, mais suppose que concatWithSeparator(sep[,exp1, exp2, ... ]) → result est injective.
Une fonction est dite injective si elle renvoie des résultats différents pour des arguments distincts.
Peut être utilisée pour optimiser GROUP BY.
Syntaxe
concatWithSeparatorAssumeInjective(sep[, exp1, exp2, ... ])
Arguments
sep — Le séparateur à utiliser. const String ou const FixedString
exp1, exp2, ... — Expression à concaténer. Les arguments qui ne sont pas de type String ou FixedString sont convertis en chaînes à l’aide de leur sérialisation par défaut. Cela dégradant les performances, il est déconseillé d’utiliser des arguments autres que String/FixedString. String ou FixedString
Valeur renvoyée
Renvoie la String obtenue en concaténant les arguments. Si l’une des valeurs d’argument est NULL, la fonction renvoie NULL. String
Exemples
Exemple d’utilisation
CREATE TABLE user_data (
user_id UInt32,
first_name String,
last_name String,
score UInt32
)
ENGINE = MergeTree
ORDER BY tuple();
INSERT INTO user_data VALUES
(1, 'John', 'Doe', 100),
(2, 'Jane', 'Smith', 150),
(3, 'John', 'Wilson', 120),
(4, 'Jane', 'Smith', 90);
SELECT
concatWithSeparatorAssumeInjective('-', first_name, last_name) as full_name,
sum(score) as total_score
FROM user_data
GROUP BY concatWithSeparatorAssumeInjective('-', first_name, last_name);
┌─full_name───┬─total_score─┐
│ Jane-Smith │ 240 │
│ John-Doe │ 100 │
│ John-Wilson │ 120 │
└─────────────┴─────────────┘
Introduit dans : v25.10.0
Convertit des nombres d’une base à une autre.
La fonction convertit un nombre d’une base à une autre. Elle prend en charge les bases de 2 à 36.
Pour les bases supérieures à 10, les lettres A-Z (sans distinction de casse) sont utilisées pour représenter les chiffres de 10 à 35.
Cette fonction est compatible avec la fonction CONV() de MySQL.
Syntaxe
conv(number, from_base, to_base)
Arguments
number — Le nombre à convertir. Peut être une chaîne de caractères ou un type numérique. - from_base — La base d’origine (2-36). Doit être un entier. - to_base — La base cible (2-36). Doit être un entier.
Valeur renvoyée
Représentation sous forme de chaîne de caractères du nombre dans la base cible.
Exemples
Convertir un nombre décimal en binaire
Convertir de l’hexadécimal en décimal
SELECT conv('FF', 16, 10)
Conversion avec un nombre négatif
SELECT conv('-1', 10, 16)
Convertir du binaire en octal
SELECT conv('1010', 2, 8)
Introduit dans : v1.1.0
Renvoie la chaîne s convertie de l’encodage from vers l’encodage to.
Syntaxe
convertCharset(s, from, to)
Arguments
s — Chaîne d’entrée. String
from — Encodage des caractères source. String
to — Encodage des caractères cible. String
Valeur renvoyée
Renvoie la chaîne s convertie de l’encodage from vers l’encodage to. String
Exemples
Exemple d’utilisation
SELECT convertCharset('Café', 'UTF-8', 'ISO-8859-1');
┌─convertChars⋯SO-8859-1')─┐
│ Caf� │
└──────────────────────────┘
damerauLevenshteinDistance
Introduit dans : v24.1.0
Calcule la distance de Damerau-Levenshtein entre deux chaînes d’octets.
Syntaxe
damerauLevenshteinDistance(s1, s2)
Arguments
s1 — Première chaîne d’entrée. String
s2 — Deuxième chaîne d’entrée. String
Valeur renvoyée
Renvoie la distance de Damerau-Levenshtein entre les deux chaînes. UInt64
Exemples
Exemple d’utilisation
SELECT damerauLevenshteinDistance('clickhouse', 'mouse')
┌─damerauLevenshteinDistance('clickhouse', 'mouse')─┐
│ 6 │
└───────────────────────────────────────────────────┘
Introduit dans : v23.9.0
Décode les entités HTML d’une chaîne en caractères correspondants.
Syntaxe
Arguments
s — Chaîne contenant les entités HTML à décoder. String
Valeur renvoyée
Renvoie la chaîne dont les entités HTML ont été décodées. String
Exemples
Exemple d’utilisation
SELECT decodeHTMLComponent('<div>Hello & "World"</div>')
┌─decodeHTMLComponent('<div>Hello & "World"</div>')─┐
│ <div>Hello & "World"</div> │
└─────────────────────────────────────────────────────────────────────────────┘
Introduit dans : v21.2.0
Décode les entités XML d’une chaîne en caractères correspondants.
Syntaxe
Arguments
s — Chaîne contenant les entités XML à décoder. String
Valeur renvoyée
Renvoie la chaîne fournie après décodage des entités XML. String
Exemples
Exemple d’utilisation
SELECT decodeXMLComponent('<tag>Hello & World</tag>')
┌─decodeXMLCom⋯;/tag>')─┐
│ <tag>Hello & World</tag> │
└──────────────────────────┘
Introduit dans : v23.9.0
Calcule la distance d’édition entre deux chaînes d’octets.
Syntaxe
Alias : levenshteinDistance
Arguments
s1 — Première chaîne d’entrée. String
s2 — Deuxième chaîne d’entrée. String
Valeur renvoyée
Renvoie la distance d’édition entre les deux chaînes. UInt64
Exemples
Exemple d’utilisation
SELECT editDistance('clickhouse', 'mouse')
┌─editDistance('clickhouse', 'mouse')─┐
│ 6 │
└─────────────────────────────────────┘
Disponible depuis : v24.6.0
Calcule la distance d’édition entre deux chaînes UTF8.
Syntaxe
Alias : levenshteinDistanceUTF8
Arguments
s1 — Première chaîne d’entrée. String
s2 — Deuxième chaîne d’entrée. String
Valeur renvoyée
Renvoie la distance d’édition entre les deux chaînes UTF8. UInt64
Exemples
Exemple d’utilisation
SELECT editDistanceUTF8('我是谁', '我是我')
┌─editDistanceUTF8('我是谁', '我是我')──┐
│ 1 │
└─────────────────────────────────────┘
Introduit dans : v21.1.0
Échappe les caractères afin d’insérer une chaîne dans un nœud de texte XML ou un attribut.
Syntaxe
Arguments
Valeur renvoyée
Renvoie la chaîne échappée. String
Exemples
Exemple d’utilisation
SELECT
'<tag>Hello & "World"</tag>' AS original,
encodeXMLComponent('<tag>Hello & "World"</tag>') AS xml_encoded;
┌─original───────────────────┬─xml_encoded──────────────────────────────────────────┐
│ <tag>Hello & "World"</tag> │ <tag>Hello & "World"</tag> │
└────────────────────────────┴──────────────────────────────────────────────────────┘
Introduit dans : v1.1.0
Indique si une chaîne se termine par le suffixe fourni.
Syntaxe
Arguments
s — Chaîne à vérifier. String
suffix — Suffixe à rechercher. String
Valeur renvoyée
Renvoie 1 si s se termine par suffix, sinon 0. UInt8
Exemples
Exemple d’utilisation
SELECT endsWith('ClickHouse', 'House');
┌─endsWith('Cl⋯', 'House')─┐
│ 1 │
└──────────────────────────┘
Introduit dans : v25.10.0
Vérifie si une chaîne se termine par le suffixe fourni, indépendamment de la casse.
Syntaxe
endsWithCaseInsensitive(s, suffix)
Arguments
s — Chaîne à vérifier. String
suffix — Suffixe à vérifier, sans tenir compte de la casse. String
Valeur renvoyée
Renvoie 1 si s se termine par le suffix sans tenir compte de la casse, sinon 0. UInt8
Exemples
Exemple d’utilisation
SELECT endsWithCaseInsensitive('ClickHouse', 'HOUSE');
┌─endsWithCaseInsensitive('Cl⋯', 'HOUSE')─┐
│ 1 │
└─────────────────────────────────────────┘
endsWithCaseInsensitiveUTF8
Introduit dans : v25.10.0
Renvoie si la chaîne s se termine par le suffix sans tenir compte de la casse.
Suppose que la chaîne contient du texte valide encodé en UTF-8.
Si cette hypothèse n’est pas respectée, aucune exception n’est levée et le résultat est indéfini.
Syntaxe
endsWithCaseInsensitiveUTF8(s, suffix)
Arguments
s — Chaîne à vérifier. String
suffix — Suffixe à vérifier, insensible à la casse. String
Valeur renvoyée
Renvoie 1 si s se termine par le suffix sans tenir compte de la casse, sinon 0. UInt8
Exemples
Exemple d’utilisation
SELECT endsWithCaseInsensitiveUTF8('данных', 'ых');
┌─endsWithCaseInsensitiveUTF8('данных', 'ых')─┐
│ 1 │
└─────────────────────────────────────────────┘
Introduit dans : v23.8.0
Renvoie si la chaîne s se termine par suffix.
Suppose que la chaîne contient du texte valide encodé en UTF-8.
Si cette hypothèse est violée, aucune exception n’est levée et le résultat est indéfini.
Syntaxe
Arguments
s — Chaîne à vérifier. String
suffix — Suffixe à rechercher. String
Valeur renvoyée
Renvoie 1 si s se termine par suffix, sinon 0. UInt8
Exemples
Exemple d’utilisation
SELECT endsWithUTF8('данных', 'ых');
┌─endsWithUTF8('данных', 'ых')─┐
│ 1 │
└──────────────────────────────┘
Introduit dans : v21.3.0
Extrait le contenu texte de documents HTML ou XHTML.
Cette fonction supprime les balises HTML, les commentaires ainsi que les éléments script/style, pour ne conserver que le contenu texte. Elle prend en charge :
- La suppression de toutes les balises HTML/XML
- La suppression des commentaires (
{/* */})
- La suppression des éléments script et style avec leur contenu
- Le traitement des sections CDATA (copiées telles quelles)
- La gestion correcte des espaces et leur normalisation
Remarque : les entités HTML ne sont pas décodées et doivent être traitées avec une fonction distincte si nécessaire.
Syntaxe
extractTextFromHTML(html)
Arguments
html — Chaîne contenant le code HTML à partir duquel extraire le texte. String
Valeur renvoyée
Renvoie le contenu textuel extrait avec des espaces blancs normalisés. String
Exemples
Exemple d’utilisation
SELECT extractTextFromHTML('
<html>
<head><title>Page Title</title></head>
<body>
<p>Hello <b>World</b>!</p>
<script>alert("test");</script>
<!-- comment -->
</body>
</html>
');
┌─extractTextFromHTML('<html><head>...')─┐
│ Page Title Hello World! │
└────────────────────────────────────────┘
Introduit dans : v23.7.0
Renvoie la première ligne d’une chaîne multiligne.
Syntaxe
Arguments
Valeur renvoyée
Renvoie la première ligne de la chaîne d’entrée, ou la chaîne entière si elle ne contient aucun séparateur de ligne. String
Exemples
Exemple d’utilisation
SELECT firstLine('foo\\nbar\\nbaz')
┌─firstLine('foo\nbar\nbaz')─┐
│ foo │
└────────────────────────────┘
Introduit dans : v24.1.0
Renvoyer la représentation Unicode (UTF-8) (algorithme ToUnicode) d’un nom de domaine selon le mécanisme Internationalized Domain Names in Applications (IDNA).
En cas d’erreur (par exemple si l’entrée n’est pas valide), la chaîne d’entrée est renvoyée.
Notez que l’application répétée de idnaEncode() et idnaDecode() ne renvoie pas nécessairement la chaîne d’origine en raison de la normalisation de la casse.
Syntaxe
Arguments
Valeur renvoyée
Renvoie une représentation Unicode (UTF-8) de la chaîne d’entrée, conformément au mécanisme IDNA appliqué à la valeur d’entrée. String
Exemples
Exemple d’utilisation
SELECT idnaDecode('xn--strae-oqa.xn--mnchen-3ya.de')
┌─idnaDecode('xn--strae-oqa.xn--mnchen-3ya.de')─┐
│ straße.münchen.de │
└───────────────────────────────────────────────┘
Introduit dans : v24.1.0
Renvoie la représentation ASCII (algorithme ToASCII) d’un nom de domaine conformément au mécanisme Internationalized Domain Names in Applications (IDNA).
La chaîne d’entrée doit être encodée en UTF et pouvoir être convertie en chaîne ASCII, sinon une exception est levée.
Aucun décodage des pourcentages ni aucune suppression des tabulations, espaces ou caractères de contrôle n’est effectué.
Syntaxe
Arguments
Valeur renvoyée
Renvoie une représentation ASCII de la chaîne d’entrée conformément au mécanisme IDNA. String
Exemples
Exemple d’utilisation
SELECT idnaEncode('straße.münchen.de')
┌─idnaEncode('straße.münchen.de')─────┐
│ xn--strae-oqa.xn--mnchen-3ya.de │
└─────────────────────────────────────┘
Introduit dans : v23.7.0
Convertit la première lettre de chaque mot en majuscule et les autres en minuscules.
Les mots sont des séquences de caractères alphanumériques séparées par des caractères non alphanumériques.
Comme initcap convertit uniquement la première lettre de chaque mot en majuscule, vous pouvez constater un comportement inattendu avec les mots contenant des apostrophes ou des lettres majuscules.
Il s’agit d’un comportement connu, et il n’est actuellement pas prévu de le corriger.
Syntaxe
Arguments
Valeur renvoyée
Renvoie s avec la première lettre de chaque mot mise en majuscule. String
Exemples
Exemple d’utilisation
SELECT initcap('building for fast')
┌─initcap('building for fast')─┐
│ Building For Fast │
└──────────────────────────────┘
Exemple de comportement connu pour les mots contenant des apostrophes ou des majuscules
SELECT initcap('John''s cat won''t eat.');
┌─initcap('Joh⋯n\'t eat.')─┐
│ John'S Cat Won'T Eat. │
└──────────────────────────┘
Introduit dans : v23.7.0
Comme initcap, initcapUTF8 convertit la première lettre de chaque mot en majuscule et le reste en minuscules.
Suppose que la chaîne contient un texte encodé en UTF-8 valide.
Si cette hypothèse n’est pas respectée, aucune exception n’est levée et le résultat n’est pas défini.
Cette fonction ne détecte pas la langue ; par exemple, pour le turc, le résultat peut ne pas être tout à fait correct (i/İ vs. i/I).
Si la longueur de la séquence d’octets UTF-8 diffère entre les formes en majuscules et en minuscules d’un point de code, le résultat peut être incorrect pour ce point de code.
Syntaxe
Arguments
Valeur renvoyée
Renvoie s avec la première lettre de chaque mot en majuscule. String
Exemples
Exemple d’utilisation
SELECT initcapUTF8('не тормозит')
┌─initcapUTF8('не тормозит')─┐
│ Не Тормозит │
└────────────────────────────┘
Introduit dans : v25.9.0
Renvoie 1 si la String d’entrée ou la FixedString ne contient que des octets ASCII (0x00–0x7F), sinon 0. Optimisé pour le cas positif (la valeur d’entrée est un ASCII valide).
Syntaxe
Alias : isASCII
Arguments
Valeur renvoyée
Exemples
isValidASCII
SELECT isValidASCII('hello') AS is_ascii, isValidASCII('你好') AS is_not_ascii
Introduit dans : v20.1.0
Vérifie si la séquence d’octets constitue un texte valide encodé en UTF-8.
Syntaxe
Arguments
s — La chaîne dont il faut vérifier la validité de l’encodage UTF-8. String
Valeur renvoyée
Renvoie 1 si la suite d’octets constitue un texte valide encodé en UTF-8, sinon 0. UInt8
Exemples
Exemple d’utilisation
SELECT isValidUTF8('\\xc3\\xb1') AS valid, isValidUTF8('\\xc3\\x28') AS invalid
┌─valid─┬─invalid─┐
│ 1 │ 0 │
└───────┴─────────┘
Introduit dans : v24.1.0
Calcule la similarité de Jaro entre deux chaînes d’octets.
Syntaxe
Arguments
s1 — Première chaîne d’entrée. String
s2 — Deuxième chaîne d’entrée. String
Valeur renvoyée
Renvoie le score de similarité de Jaro entre les deux chaînes. Float64
Exemples
Exemple d’utilisation
SELECT jaroSimilarity('clickhouse', 'click')
┌─jaroSimilarity('clickhouse', 'click')─┐
│ 0.8333333333333333 │
└───────────────────────────────────────┘
Introduit dans : v24.1.0
Calcule la similarité de Jaro-Winkler entre deux chaînes d’octets.
Syntaxe
jaroWinklerSimilarity(s1, s2)
Arguments
s1 — Première chaîne d’entrée. String
s2 — Deuxième chaîne d’entrée. String
Valeur renvoyée
Renvoie la similarité Jaro-Winkler entre les deux chaînes. Float64
Exemples
Exemple d’utilisation
SELECT jaroWinklerSimilarity('clickhouse', 'click')
┌─jaroWinklerSimilarity('clickhouse', 'click')─┐
│ 0.8999999999999999 │
└──────────────────────────────────────────────┘
Introduite dans : v22.1.0
Renvoie une sous-chaîne de la chaîne s avec un offset spécifié, à partir de la gauche.
Syntaxe
Arguments
Valeur renvoyée
Renvoie :
- Pour un
offset positif, une sous-chaîne de s de offset octets, à partir du début de la chaîne.
- Pour un
offset négatif, une sous-chaîne de s de length(s) - |offset| octets, à partir du début de la chaîne.
- Une chaîne vide si
length vaut 0.
String
Exemples
Décalage positif
SELECT left('Hello World', 5)
Offset négatif
SELECT left('Hello World', -6)
Introduit dans : v21.8.0
Complète une chaîne à gauche avec des espaces ou avec une chaîne spécifiée (répétée plusieurs fois si nécessaire) jusqu’à ce que la chaîne obtenue atteigne la length spécifiée.
Syntaxe
leftPad(string, length[, pad_string])
Alias : lpad
Arguments
string — Chaîne d’entrée à compléter. String
length — Longueur de la chaîne résultante. Si la valeur est inférieure à la longueur de la chaîne d’entrée, celle-ci est alors tronquée à length caractères. (U)Int*
pad_string — Facultatif. Chaîne utilisée pour compléter la chaîne d’entrée. Si elle n’est pas spécifiée, la chaîne d’entrée est complétée avec des espaces. String
Valeur renvoyée
Renvoie une chaîne complétée à gauche de la longueur indiquée. String
Exemples
Exemple d’utilisation
SELECT leftPad('abc', 7, '*'), leftPad('def', 7)
┌─leftPad('abc', 7, '*')─┬─leftPad('def', 7)─┐
│ ****abc │ def │
└────────────────────────┴───────────────────┘
Introduit dans : v21.8.0
Ajoute à gauche d’une chaîne UTF8 des espaces ou une chaîne spécifiée (répétée si nécessaire) jusqu’à ce que la chaîne obtenue atteigne la longueur indiquée.
Contrairement à leftPad, qui mesure la longueur de la chaîne en octets, ici, la longueur de la chaîne est mesurée en points de code.
Syntaxe
leftPadUTF8(string, length[, pad_string])
Arguments
string — Chaîne d’entrée à remplir. String
length — Longueur de la chaîne obtenue. Si la valeur est inférieure à la longueur de la chaîne d’entrée, celle-ci est tronquée à length caractères. (U)Int*
pad_string — Facultatif. Chaîne utilisée pour remplir la chaîne d’entrée. Si elle n’est pas spécifiée, la chaîne d’entrée est complétée avec des espaces. String
Valeur renvoyée
Renvoie une chaîne complétée à gauche à la longueur indiquée. String
Exemples
Exemple d’utilisation
SELECT leftPadUTF8('абвг', 7, '*'), leftPadUTF8('дежз', 7)
┌─leftPadUTF8('абвг', 7, '*')─┬─leftPadUTF8('дежз', 7)─┐
│ ***абвг │ дежз │
└─────────────────────────────┴────────────────────────┘
Introduit dans : v22.1.0
Renvoie une sous-chaîne de la chaîne s, encodée en UTF-8, avec un offset spécifié à partir de la gauche.
Syntaxe
Arguments
s — La chaîne encodée en UTF-8 dont extraire une sous-chaîne. String ou FixedString
offset — Le décalage, en nombre d’octets. (U)Int*
Valeur renvoyée
Renvoie :
- Pour un
offset positif, une sous-chaîne de s de offset octets, en partant de la gauche de la chaîne.\n”
- Pour un
offset négatif, une sous-chaîne de s de length(s) - |offset| octets, en partant de la gauche de la chaîne.\n”
- Une chaîne vide si
length vaut 0.
String
Exemples
Décalage positif
SELECT leftUTF8('Привет', 4)
Offset négatif
SELECT leftUTF8('Привет', -4)
Introduit dans : v1.1.0
Renvoie la longueur d’une chaîne en points de code Unicode plutôt qu’en octets ou en caractères.
Cette fonction suppose que la chaîne contient un texte valide encodé en UTF-8.
Si cette hypothèse n’est pas respectée, aucune exception n’est levée et le résultat n’est pas défini.
Syntaxe
Alias : CHARACTER_LENGTH, CHAR_LENGTH
Arguments
s — String contenant du texte valide encodé en UTF-8. String
Valeur renvoyée
Longueur de la chaîne s en points de code Unicode. UInt64
Exemples
Exemple d’utilisation
SELECT lengthUTF8('Здравствуй, мир!')
┌─lengthUTF8('Здравствуй, мир!')─┐
│ 16 │
└────────────────────────────────┘
Introduit dans : v1.1.0
Convertit une chaîne ASCII en minuscules.
Syntaxe
Alias : lcase
Arguments
s — Une chaîne à convertir en minuscules. String
Valeur renvoyée
Renvoie la chaîne s en minuscules. String
Exemples
Exemple d’utilisation
SELECT lower('CLICKHOUSE')
┌─lower('CLICKHOUSE')─┐
│ clickhouse │
└─────────────────────┘
Introduit dans : v1.1.0
Convertit une chaîne en minuscules, en supposant qu’elle contient du texte valide encodé en UTF-8. Si cette hypothèse n’est pas respectée, aucune exception n’est levée et le résultat est indéfini.
Syntaxe
Arguments
input — Chaîne d’entrée à convertir en minuscules. String
Valeur renvoyée
Renvoie une chaîne en minuscules. String
Exemples
premier
SELECT lowerUTF8('München') as Lowerutf8;
Introduit dans : v26.3.0
Cette fonction permet d’effectuer un tri naturel.
Syntaxe
Alias : NATURAL_SORT_KEY
Arguments
s — Une chaîne à convertir en clé de tri naturel. String
Valeur renvoyée
Renvoie la chaîne de clé de tri naturel obtenue à partir de s. String
Exemples
Exemple d’utilisation
SELECT s FROM t ORDER BY naturalSortKey(s)
┌─s───┐
│ a1 │
| a02 │
└─────┘
Introduit dans : v21.11.0
Normalise une chaîne UTF-8 selon la forme de normalisation NFC.
Syntaxe
Arguments
str — Chaîne d’entrée encodée en UTF-8. String
Valeur renvoyée
Renvoie la forme normalisée NFC de la chaîne encodée en UTF-8. String
Exemples
Exemple d’utilisation
SELECT
'é' AS original, -- e + combining acute accent (U+0065 + U+0301)
length(original),
normalizeUTF8NFC('é') AS nfc_normalized, -- é (U+00E9)
length(nfc_normalized);
┌─original─┬─length(original)─┬─nfc_normalized─┬─length(nfc_normalized)─┐
│ é │ 2 │ é │ 2 │
└──────────┴──────────────────┴────────────────┴────────────────────────┘
Introduit dans : v21.11.0
Normalise une chaîne UTF-8 conformément à la forme de normalisation NFD.
Syntaxe
Arguments
str — chaîne d’entrée encodée en UTF-8. String
Valeur renvoyée
Renvoie la forme normalisée NFD de la chaîne UTF-8. String
Exemples
Exemple d’utilisation
SELECT
'é' AS original, -- é (U+00E9)
length(original),
normalizeUTF8NFD('é') AS nfd_normalized, -- e + combining acute (U+0065 + U+0301)
length(nfd_normalized);
┌─original─┬─length(original)─┬─nfd_normalized─┬─length(nfd_normalized)─┐
│ é │ 2 │ é │ 3 │
└──────────┴──────────────────┴────────────────┴────────────────────────┘
Introduit dans : v21.11.0
Normalise une chaîne en UTF-8 selon la forme de normalisation NFKC.
Syntaxe
Arguments
str — Chaîne d’entrée encodée en UTF-8. String
Valeur renvoyée
Renvoie la forme normalisée NFKC de la chaîne en UTF-8. String
Exemples
Exemple d’utilisation
SELECT
'① ② ③' AS original, -- Circled number characters
normalizeUTF8NFKC('① ② ③') AS nfkc_normalized; -- Converts to 1 2 3
┌─original─┬─nfkc_normalized─┐
│ ① ② ③ │ 1 2 3 │
└──────────┴─────────────────┘
normalizeUTF8NFKCCasefold
Introduite dans : v26.3.0
Normalise une chaîne UTF-8 selon la forme de normalisation NFKC_Casefold, qui applique la normalisation NFKC puis le pliage de casse.
Ceci est utile pour la correspondance insensible à la casse des identifiants.
Syntaxe
normalizeUTF8NFKCCasefold(str)
Arguments
str — chaîne d’entrée encodée en UTF-8. String
Valeur renvoyée
Renvoie la forme normalisée NFKC_Casefold de la chaîne UTF-8. String
Exemples
Exemple d’utilisation
SELECT
'Ä ① Hello' AS original,
normalizeUTF8NFKCCasefold('Ä ① Hello') AS nfkc_cf_normalized;
┌─original───┬─nfkc_cf_normalized─┐
│ Ä ① Hello │ ä 1 hello │
└────────────┴────────────────────┘
Introduit dans : v21.11.0
Normalise une chaîne UTF-8 conformément à la forme de normalisation NFKD.
Syntaxe
Arguments
str — chaîne d’entrée encodée en UTF-8. String
Valeur renvoyée
Renvoie la forme normalisée NFKD de la chaîne UTF-8. String
Exemples
Exemple d’utilisation
SELECT
'H₂O²' AS original, -- H + subscript 2 + O + superscript 2
normalizeUTF8NFKD('H₂O²') AS nfkd_normalized; -- Converts to H 2 O 2
┌─original─┬─nfkd_normalized─┐
│ H₂O² │ H2O2 │
└──────────┴─────────────────┘
Introduite dans : v24.1.0
Renvoie le texte en clair encodé en UTF8 d’une chaîne encodée en Punycode.
Si la chaîne fournie n’est pas une chaîne encodée en Punycode valide, une exception est levée.
Syntaxe
Arguments
s — Chaîne encodée en Punycode. String
Valeur renvoyée
Renvoie le texte en clair de la valeur d’entrée. String
Exemples
Exemple d’utilisation
SELECT punycodeDecode('Mnchen-3ya')
┌─punycodeDecode('Mnchen-3ya')─┐
│ München │
└──────────────────────────────┘
Introduit dans : v24.1.0
Renvoie la représentation en Punycode d’une chaîne.
La chaîne doit être encodée en UTF8, sinon le comportement est indéfini.
Syntaxe
Arguments
Valeur renvoyée
Renvoie une représentation en Punycode de la valeur d’entrée. String
Exemples
Exemple d’utilisation
SELECT punycodeEncode('München')
┌─punycodeEncode('München')─┐
│ Mnchen-3ya │
└───────────────────────────┘
Introduit dans : v23.2.0
Extrait la première chaîne de haystack qui correspond au motif regexp et à l’indice du groupe regex.
Syntaxe
regexpExtract(haystack, pattern[, index])
Alias : REGEXP_EXTRACT, REGEXP_SUBSTR
Arguments
haystack — String dans laquelle le motif regexp sera recherché. String
pattern — String, expression régulière. pattern peut contenir plusieurs groupes regexp ; index indique quel groupe regex extraire. Un index de 0 signifie que l’expression régulière entière est extraite. const String
index — Facultatif. Un entier non négatif indiquant quel groupe regex extraire. La valeur par défaut est 1 si pattern contient au moins un groupe de capture, et 0 (la correspondance complète) si pattern ne contient aucun groupe de capture. (U)Int*
Valeur renvoyée
Renvoie une chaîne correspondant au motif String
Exemples
Exemple d’utilisation
SELECT
regexpExtract('100-200', '(\\d+)-(\\d+)', 1),
regexpExtract('100-200', '(\\d+)-(\\d+)', 2),
regexpExtract('100-200', '(\\d+)-(\\d+)', 0),
regexpExtract('100-200', '(\\d+)-(\\d+)'),
regexpExtract('100-200', '\\d+');
┌─regexpExtract('100-200', '(\\d+)-(\\d+)', 1)─┬─regexpExtract('100-200', '(\\d+)-(\\d+)', 2)─┬─regexpExtract('100-200', '(\\d+)-(\\d+)', 0)─┬─regexpExtract('100-200', '(\\d+)-(\\d+)')─┬─regexpExtract('100-200', '\\d+')─┐
│ 100 │ 200 │ 100-200 │ 100 │ 100 │
└──────────────────────────────────────────────┴──────────────────────────────────────────────┴──────────────────────────────────────────────┴───────────────────────────────────────────┴──────────────────────────────────┘
Introduit dans : v26.5.0
Renvoie la position en octets (à partir de 1) de la occurrence-ième correspondance de pattern dans haystack, en commençant la recherche à la position en octets position.
Si return_option vaut 0 (par défaut), la position du premier octet de la correspondance est renvoyée. Si return_option vaut 1, la position du premier octet après la correspondance est renvoyée.
Si subexpression est supérieur à 0, la position du groupe de capture correspondant est renvoyée à la place de celle de la correspondance entière.
Renvoie 0 si aucune correspondance n’est trouvée, ou si le groupe de capture demandé n’a pas participé à la correspondance.
Cette fonction est fournie pour assurer la compatibilité avec regexp_instr de PostgreSQL (également exposé sous cet alias). Notez que les positions sont exprimées en octets, conformément aux autres fonctions Regex de ClickHouse ; regexp_instr de PostgreSQL est basé sur les caractères.
Syntaxe
regexpPosition(haystack, pattern[, position[, occurrence[, return_option[, flags[, subexpression]]]]])
Aliases : regexpInstr, regexp_instr
Arguments
haystack — Chaîne dans laquelle effectuer la recherche. String
pattern — Motif d’expression régulière. const String
position — Facultatif. Position en octets, indexée à partir de 1, à partir de laquelle commencer la recherche. Par défaut : 1. (U)Int*
occurrence — Facultatif. Occurrence à renvoyer. Par défaut : 1. (U)Int*
return_option — Facultatif. 0 renvoie la position du début de la correspondance, 1 renvoie la position immédiatement après la correspondance. Par défaut : 0. (U)Int*
flags — Facultatif. Indicateurs Regex. Pris en charge : i (insensible à la casse), c (sensible à la casse), m/n (ancres multiligne), s (le point correspond à un saut de ligne). Par défaut : vide. const String
subexpression — Facultatif. Indice du groupe de capture dont la position doit être renvoyée. 0 signifie la correspondance entière. Par défaut : 0. (U)Int*
Valeur renvoyée
Renvoie la position en octets de la correspondance, ou 0 si aucune correspondance n’est trouvée. UInt64
Exemples
Utilisation de base
SELECT
regexpPosition('hello world', 'world'),
regexpPosition('aXbXcXd', 'X', 1, 2),
regexpPosition('aXbXcXd', 'X', 1, 2, 1),
regexpPosition('Hello WORLD', 'world', 1, 1, 0, 'i'),
regexpPosition('foo123bar456', '([a-z]+)([0-9]+)', 1, 2, 0, '', 2);
┌─...─┬─...─┬─...─┬─...─┬─...─┐
│ 7 │ 4 │ 5 │ 7 │ 10 │
└─────┴─────┴─────┴─────┴─────┘
Introduit dans : v26.3.0
Supprime les signes diacritiques (accents) d’une chaîne UTF-8 en décomposant les caractères via NFD,
en supprimant les marques combinatoires (catégorie Unicode Mn), puis en les recomposant via NFC.
Syntaxe
removeDiacriticsUTF8(str)
Alias: removeAccentsUTF8
Arguments
str — Chaîne d’entrée encodée en UTF-8. String
Valeur renvoyée
Chaîne UTF-8 sans diacritiques. String
Exemples
Suppression simple des accents
SELECT removeDiacriticsUTF8('café résumé naïve')
┌─removeDiacriticsUTF8('café résumé naïve')─┐
│ cafe resume naive │
└────────────────────────────────────────────┘
Introduit dans : v20.1.0
Concatène une chaîne avec elle-même autant de fois que spécifié.
Syntaxe
Arguments
s — La chaîne à répéter. String
n — Le nombre de répétitions de la chaîne. (U)Int*
Valeur renvoyée
Une chaîne contenant s répété n fois. Si n est négatif, la fonction renvoie une chaîne vide. String
Exemples
Exemple d’utilisation
┌─repeat('abc', 10)──────────────┐
│ abcabcabcabcabcabcabcabcabcabc │
└────────────────────────────────┘
Introduit dans : v1.1.0
Inverse une séquence de points de code Unicode dans une chaîne.
Suppose que la chaîne contient du texte encodé en UTF-8 valide.
Si cette hypothèse n’est pas respectée, aucune exception n’est levée et le résultat est indéfini.
Syntaxe
Arguments
s — Chaîne contenant du texte valide encodé en UTF-8. String
Valeur renvoyée
Renvoie une chaîne dont la séquence de points de code Unicode est inversée. String
Exemples
Exemple d’utilisation
SELECT reverseUTF8('ClickHouse')
Introduit dans : v22.1.0
Renvoie une sous-chaîne de la chaîne s avec l’offset spécifié, en partant de la droite.
Syntaxe
Arguments
s — La chaîne dont il faut extraire une sous-chaîne. String ou FixedString
offset — Le décalage, exprimé en nombre d’octets. (U)Int*
Valeur renvoyée
Renvoie :
- Pour un
offset positif, une sous-chaîne de s de offset octets, en partant de la droite de la chaîne.
- Pour un
offset négatif, une sous-chaîne de s de length(s) - |offset| octets, en partant de la droite de la chaîne.
- Une chaîne vide si
length vaut 0.
String
Exemples
Décalage positif
Décalage négatif
SELECT right('Hello', -3)
Introduit dans : v21.8.0
Ajoute des espaces ou une chaîne spécifiée à droite d’une chaîne (à plusieurs reprises si nécessaire) jusqu’à ce que la chaîne obtenue atteigne la length spécifiée.
Syntaxe
rightPad(string, length[, pad_string])
Alias : rpad
Arguments
string — Chaîne d’entrée à compléter. String
length — Longueur de la chaîne obtenue. Si la valeur est inférieure à la longueur de la chaîne d’entrée, celle-ci est tronquée à length caractères. (U)Int*
pad_string — Facultatif. Chaîne utilisée pour compléter la chaîne d’entrée. Si elle n’est pas spécifiée, la chaîne d’entrée est complétée avec des espaces. String
Valeur renvoyée
Renvoie une chaîne complétée à droite de la longueur spécifiée. String
Exemples
Exemple d’utilisation
SELECT rightPad('abc', 7, '*'), rightPad('abc', 7)
┌─rightPad('abc', 7, '*')─┬─rightPad('abc', 7)─┐
│ abc**** │ abc │
└─────────────────────────┴────────────────────┘
Introduit dans : v21.8.0
Ajoute à droite de la chaîne des espaces ou une chaîne spécifiée (répétée plusieurs fois si nécessaire) jusqu’à ce que la chaîne obtenue atteigne la longueur indiquée.
Contrairement à rightPad, qui mesure la longueur de la chaîne en octets, ici la longueur de la chaîne est mesurée en points de code.
Syntaxe
rightPadUTF8(string, length[, pad_string])
Arguments
string — Chaîne d’entrée à compléter. String
length — Longueur de la chaîne résultante. Si cette valeur est inférieure à la longueur de la chaîne d’entrée, celle-ci est tronquée à length caractères. (U)Int*
pad_string — Facultatif. Chaîne utilisée pour compléter la chaîne d’entrée. Si elle n’est pas spécifiée, la chaîne d’entrée est complétée avec des espaces. String
Valeur renvoyée
Renvoie une chaîne complétée à droite jusqu’à la longueur indiquée. String
Exemples
Exemple d’utilisation
SELECT rightPadUTF8('абвг', 7, '*'), rightPadUTF8('абвг', 7)
┌─rightPadUTF8('абвг', 7, '*')─┬─rightPadUTF8('абвг', 7)─┐
│ абвг*** │ абвг │
└──────────────────────────────┴─────────────────────────┘
Introduit dans : v22.1.0
Renvoie une sous-chaîne de la chaîne s encodée en UTF-8 avec un offset spécifié en partant de la droite.
Syntaxe
Arguments
s — La chaîne encodée en UTF-8 dont il faut calculer une sous-chaîne. String ou FixedString
offset — Le décalage, en nombre d’octets. (U)Int*
Valeur renvoyée
Renvoie :
- Pour un
offset positif, une sous-chaîne de s de offset octets, en partant de la droite de la chaîne.
- Pour un
offset négatif, une sous-chaîne de s de length(s) - |offset| octets, en partant de la droite de la chaîne.
- Une chaîne vide si
length vaut 0.
String
Exemples
Décalage positif
SELECT rightUTF8('Привет', 4)
OFFSET négatif
SELECT rightUTF8('Привет', -4)
Introduit dans : v23.4.0
Renvoie le code Soundex d’une chaîne de caractères.
Syntaxe
Arguments
Valeur renvoyée
Renvoie le code Soundex de la chaîne d’entrée. String
Exemples
Exemple d’utilisation
┌─soundex('aksel')─┐
│ A240 │
└──────────────────┘
Introduite dans : v23.5.0
Concatène un espace ( ) avec lui-même autant de fois que spécifié.
Syntaxe
Arguments
n — Le nombre de répétitions de l’espace. (U)Int*
Valeur renvoyée
Renvoie une chaîne contenant un espace répété n fois. Si n <= 0, la fonction renvoie une chaîne vide. String
Exemples
Exemple d’utilisation
SELECT space(3) AS res, length(res);
┌─res─┬─length(res)─┐
│ │ 3 │
└─────┴─────────────┘
Introduit dans : v25.5.0
Trouve toutes les sous-chaînes d’une chaîne donnée dont la longueur est d’au moins n,
où les hachages des (n-1)-grammes aux extrémités de la sous-chaîne
sont strictement supérieurs à ceux de tout (n-1)-gramme situé à l’intérieur de la sous-chaîne.
Utilise CRC32 comme fonction de hachage.
Syntaxe
sparseGrams(s[, min_ngram_length[, max_ngram_length[, min_cutoff_length]]])
Arguments
s — Une chaîne en entrée. String
min_ngram_length — Facultatif. Longueur minimale du n-gramme extrait. La valeur par défaut et la valeur minimale sont de 3. UInt*
max_ngram_length — Facultatif. Longueur maximale du n-gramme extrait. La valeur par défaut est de 100. Elle ne doit pas être inférieure à min_ngram_length. UInt*
min_cutoff_length — Facultatif. Si ce paramètre est spécifié, seuls les n-grammes d’une longueur supérieure ou égale à min_cutoff_length sont renvoyés. La valeur par défaut est la même que min_ngram_length. Elle ne doit pas être inférieure à min_ngram_length ni supérieure à max_ngram_length. UInt*
Valeur renvoyée
Renvoie un tableau de sous-chaînes sélectionnées. Array(String)
Exemples
Exemple d’utilisation
SELECT sparseGrams('alice', 3)
┌─sparseGrams('alice', 3)────────────┐
│ ['ali','lic','lice','ice'] │
└────────────────────────────────────┘
Introduit dans : v25.5.0
Trouve les hachages de toutes les sous-chaînes d’une chaîne donnée d’une longueur d’au moins n,
pour lesquelles les hachages des n-grammes de longueur (n-1) situés aux extrémités de la sous-chaîne
sont strictement supérieurs à ceux de tous les n-grammes de longueur (n-1) qu’elle contient.
Utilise CRC32 comme fonction de hachage.
Syntaxe
sparseGramsHashes(s[, min_ngram_length, max_ngram_length])
Arguments
s — Une chaîne d’entrée. String
min_ngram_length — Facultatif. Longueur minimale du n-gramme extrait. La valeur par défaut, qui est aussi la valeur minimale, est 3. UInt*
max_ngram_length — Facultatif. Longueur maximale du n-gramme extrait. La valeur par défaut est 100. Doit être supérieure ou égale à min_ngram_length. UInt*
min_cutoff_length — Facultatif. Si ce paramètre est spécifié, seuls les n-grammes dont la longueur est supérieure ou égale à min_cutoff_length sont renvoyés. La valeur par défaut est la même que min_ngram_length. Doit être supérieure ou égale à min_ngram_length et inférieure ou égale à max_ngram_length. UInt*
Valeur renvoyée
Renvoie un tableau de hachages CRC32 des sous-chaînes sélectionnées. Array(UInt32)
Exemples
Exemple d’utilisation
SELECT sparseGramsHashes('alice', 3)
┌─sparseGramsHashes('alice', 3)──────────────────────┐
│ [1481062250,2450405249,4012725991,1918774096] │
└────────────────────────────────────────────────────┘
Introduit dans : v25.5.0
Trouve les hachages de toutes les sous-chaînes d’une chaîne UTF-8 donnée dont la longueur est d’au moins n, lorsque les hachages des n-grammes de longueur (n-1) situés aux extrémités de la sous-chaîne sont strictement supérieurs à ceux de tout n-gramme de longueur (n-1) à l’intérieur de la sous-chaîne.
Attend une chaîne UTF-8 et lève une exception en cas de séquence UTF-8 non valide.
Utilise CRC32 comme fonction de hachage.
Syntaxe
sparseGramsHashesUTF8(s[, min_ngram_length, max_ngram_length])
Arguments
s — Une chaîne d’entrée. String
min_ngram_length — Facultatif. Longueur minimale du n-gramme extrait. La valeur par défaut, qui est aussi la valeur minimale, est 3. UInt*
max_ngram_length — Facultatif. Longueur maximale du n-gramme extrait. La valeur par défaut est 100. Ne doit pas être inférieure à min_ngram_length. UInt*
min_cutoff_length — Facultatif. Si cette valeur est spécifiée, seuls les n-grammes dont la longueur est supérieure ou égale à min_cutoff_length sont renvoyés. La valeur par défaut est la même que min_ngram_length. Ne doit pas être inférieure à min_ngram_length ni supérieure à max_ngram_length. UInt*
Valeur renvoyée
Renvoie un tableau de hachages CRC32 des sous-chaînes UTF-8 sélectionnées. Array(UInt32)
Exemples
Exemple d’utilisation
SELECT sparseGramsHashesUTF8('алиса', 3)
┌─sparseGramsHashesUTF8('алиса', 3)─┐
│ [4178533925,3855635300,561830861] │
└───────────────────────────────────┘
Introduit dans : v25.5.0
Trouve toutes les sous-chaînes d’une chaîne UTF-8 donnée dont la longueur est d’au moins n, lorsque les hachages des (n-1)-grammes aux extrémités de la sous-chaîne sont strictement supérieurs à ceux de tout (n-1)-gramme à l’intérieur de la sous-chaîne.
Attend une chaîne UTF-8 et lève une exception en cas de séquence UTF-8 non valide.
Utilise CRC32 comme fonction de hachage.
Syntaxe
sparseGramsUTF8(s[, min_ngram_length[, max_ngram_length[, min_cutoff_length]]])
Arguments
s — Une chaîne d’entrée. String
min_ngram_length — Facultatif. Longueur minimale du n-gramme extrait. La valeur minimale et la valeur par défaut sont 3. UInt*
max_ngram_length — Facultatif. Longueur maximale du n-gramme extrait. La valeur par défaut est 100. Elle ne doit pas être inférieure à min_ngram_length. UInt*
min_cutoff_length — Facultatif. Si cette valeur est spécifiée, seuls les n-grammes dont la longueur est supérieure ou égale à min_cutoff_length sont renvoyés. La valeur par défaut est identique à min_ngram_length. Elle ne doit pas être inférieure à min_ngram_length ni supérieure à max_ngram_length. UInt*
Valeur renvoyée
Renvoie un tableau des sous-chaînes UTF-8 sélectionnées. Array(String)
Exemples
Exemple d’utilisation
SELECT sparseGramsUTF8('алиса', 3)
┌─sparseGramsUTF8('алиса', 3)─┐
│ ['али','лис','иса'] │
└─────────────────────────────┘
Introduit dans : v1.1.0
Vérifie si une chaîne commence par la chaîne indiquée.
Syntaxe
Arguments
s — Chaîne à vérifier. String
prefix — Préfixe à rechercher. String
Valeur renvoyée
Renvoie 1 si s commence par prefix, sinon 0. UInt8
Exemples
Exemple d’utilisation
SELECT startsWith('ClickHouse', 'Click');
┌─startsWith('⋯', 'Click')─┐
│ 1 │
└──────────────────────────┘
startsWithCaseInsensitive
Introduit dans : v25.10.0
Vérifie si une chaîne commence par la chaîne fournie, de manière insensible à la casse.
Syntaxe
startsWithCaseInsensitive(s, prefix)
Arguments
s — String à vérifier. String
prefix — Préfixe insensible à la casse à rechercher. String
Valeur renvoyée
Renvoie 1 si s commence par le prefix de manière insensible à la casse, sinon 0. UInt8
Exemples
Exemple d’utilisation
SELECT startsWithCaseInsensitive('ClickHouse', 'CLICK');
┌─startsWithCaseInsensitive('⋯', 'CLICK')─┐
│ 1 │
└─────────────────────────────────────────┘
startsWithCaseInsensitiveUTF8
Introduit dans : v25.10.0
Vérifie si une chaîne commence par le préfixe fourni, de manière insensible à la casse.
Suppose que la chaîne contient du texte valide encodé en UTF-8.
Si cette hypothèse n’est pas respectée, aucune exception n’est levée et le résultat est indéfini.
Syntaxe
startsWithCaseInsensitiveUTF8(s, prefix)
Arguments
s — Chaîne à vérifier. String
prefix — Préfixe à vérifier, insensible à la casse. String
Valeur renvoyée
Renvoie 1 si s commence par le prefix, de manière insensible à la casse, sinon 0. UInt8
Exemples
Exemple d’utilisation
SELECT startsWithCaseInsensitiveUTF8('приставка', 'при')
┌─startsWithUT⋯ка', 'при')─┐
│ 1 │
└──────────────────────────┘
Introduit dans : v23.8.0
Vérifie si une chaîne commence par le préfixe fourni.
Suppose que la chaîne contient du texte valide encodé en UTF-8.
Si cette hypothèse n’est pas respectée, aucune exception n’est levée et le résultat est indéfini.
Syntaxe
startsWithUTF8(s, prefix)
Arguments
s — Chaîne à vérifier. String
prefix — Préfixe à vérifier. String
Valeur renvoyée
Renvoie 1 si s commence par prefix, sinon 0. UInt8
Exemples
Exemple d’utilisation
SELECT startsWithUTF8('приставка', 'при')
┌─startsWithUT⋯ка', 'при')─┐
│ 1 │
└──────────────────────────┘
Introduit dans : v25.6.0
Calcule l’entropie de Shannon de la distribution des octets d’une chaîne.
Syntaxe
Arguments
s — La chaîne à analyser. String
Valeur renvoyée
Renvoie l’entropie de Shannon de la distribution des octets de la chaîne. Float64
Exemples
Exemple d’utilisation
SELECT stringBytesEntropy('Hello, world!')
┌─stringBytesEntropy('Hello, world!')─┐
│ 3.07049960 │
└─────────────────────────────────────┘
Introduit dans : v25.6.0
Compte le nombre d’octets distincts dans une chaîne de caractères.
Syntaxe
Arguments
s — La chaîne à analyser. String
Valeur renvoyée
Renvoie le nombre d’octets distincts de la chaîne. UInt16
Exemples
Exemple d’utilisation
SELECT stringBytesUniq('Hello')
┌─stringBytesUniq('Hello')─┐
│ 4 │
└──────────────────────────┘
Introduit dans : v23.11.0
Calcule l’indice de similarité de Jaccard entre deux chaînes d’octets.
Syntaxe
stringJaccardIndex(s1, s2)
Arguments
s1 — Première chaîne en entrée. String
s2 — Deuxième chaîne en entrée. String
Valeur renvoyée
Renvoie l’indice de similarité de Jaccard entre les deux chaînes. Float64
Exemples
Exemple d’utilisation
SELECT stringJaccardIndex('clickhouse', 'mouse')
┌─stringJaccardIndex('clickhouse', 'mouse')─┐
│ 0.4 │
└───────────────────────────────────────────┘
Introduit dans : v23.11.0
Comme stringJaccardIndex, mais pour les chaînes codées en UTF8.
Syntaxe
stringJaccardIndexUTF8(s1, s2)
Arguments
s1 — Première chaîne d’entrée UTF8. String
s2 — Deuxième chaîne d’entrée UTF8. String
Valeur renvoyée
Renvoie l’indice de similarité de Jaccard entre les deux chaînes UTF8. Float64
Exemples
Exemple d’utilisation
SELECT stringJaccardIndexUTF8('我爱你', '我也爱你')
┌─stringJaccardIndexUTF8('我爱你', '我也爱你')─┐
│ 0.75 │
└─────────────────────────────────────────────┘
Introduit dans : v1.1.0
Renvoyer la sous-chaîne d’une chaîne s à partir de l’index d’octet offset spécifié.
Le comptage des octets commence à 1, selon la logique suivante :
- Si
offset vaut 0, une chaîne vide est renvoyée.
- Si
offset est négatif, la sous-chaîne commence à offset caractères de la fin de la chaîne, et non du début.
Un argument facultatif, length, spécifie le nombre maximal d’octets que la sous-chaîne renvoyée peut contenir.
Syntaxe
substring(s, offset[, length])
Alias: byteSlice, mid, substr
Arguments
s — La chaîne à partir de laquelle extraire une sous-chaîne. String ou FixedString ou Enum
offset — La position de début de la sous-chaîne dans s. (U)Int*
length — Facultatif. La longueur maximale de la sous-chaîne. (U)Int*
Valeur renvoyée
Renvoie une sous-chaîne de s de length octets, à partir de l’indice offset. String
Exemples
Utilisation de base
SELECT 'database' AS db, substr(db, 5), substr(db, 5, 1)
┌─db───────┬─substring('database', 5)─┬─substring('database', 5, 1)─┐
│ database │ base │ b │
└──────────┴──────────────────────────┴─────────────────────────────┘
Introduit dans : v23.7.0
Renvoie la sous-chaîne de s située avant count occurrences du délimiteur delim, comme dans Spark ou MySQL.
Syntaxe
substringIndex(s, delim, count)
Alias : SUBSTRING_INDEX
Arguments
s — La chaîne à partir de laquelle extraire la sous-chaîne. String
delim — Le caractère utilisé pour le découpage. String
count — Le nombre d’occurrences du délimiteur à compter avant d’extraire la sous-chaîne. Si count est positif, tout ce qui se trouve à gauche du délimiteur final (en comptant depuis la gauche) est renvoyé. Si count est négatif, tout ce qui se trouve à droite du délimiteur final (en comptant depuis la droite) est renvoyé. UInt ou Int
Valeur renvoyée
Renvoie une sous-chaîne de s avant count occurrences de delim. String
Exemples
Exemple d’utilisation
SELECT substringIndex('www.clickhouse.com', '.', 2)
┌─substringIndex('www.clickhouse.com', '.', 2)─┐
│ www.clickhouse │
└──────────────────────────────────────────────┘
Introduit dans : v23.7.0
Renvoie la sous-chaîne de s située avant count occurrences du délimiteur delim, en se basant sur les points de code Unicode.
Suppose que la chaîne contient du texte valide codé en UTF-8.
Si cette hypothèse n’est pas respectée, aucune exception n’est levée et le résultat est indéfini.
Syntaxe
substringIndexUTF8(s, delim, count)
Arguments
s — La chaîne dont extraire la sous-chaîne. String
delim — Le caractère de séparation. String
count — Le nombre d’occurrences du délimiteur à compter avant d’extraire la sous-chaîne. Si count est positif, tout ce qui se trouve à gauche du délimiteur final (en comptant depuis la gauche) est renvoyé. Si count est négatif, tout ce qui se trouve à droite du délimiteur final (en comptant depuis la droite) est renvoyé. UInt ou Int
Valeur renvoyée
Renvoie la sous-chaîne de s située avant count occurrences de delim. String
Exemples
Exemple UTF8
SELECT substringIndexUTF8('www.straßen-in-europa.de', '.', 2)
Introduit dans : v1.1.0
Renvoie la sous-chaîne d’une chaîne s qui commence à l’indice de point de code offset spécifié.
Le comptage des points de code commence à 1, selon la logique suivante :
- Si
offset vaut 0, une chaîne vide est renvoyée.
- Si
offset est négatif, la sous-chaîne commence à offset points de code de la fin de la chaîne, plutôt que du début.
Un argument facultatif length spécifie le nombre maximal de points de code que la sous-chaîne renvoyée peut contenir.
Cette fonction suppose que la chaîne contient du texte valide encodé en UTF-8.
Si cette hypothèse n’est pas respectée, aucune exception n’est levée et le résultat est indéfini.
Syntaxe
substringUTF8(s, offset[, length])
Arguments
s — La chaîne à partir de laquelle extraire une sous-chaîne. String ou FixedString ou Enum
offset — La position de début de la sous-chaîne dans s. Int ou UInt
length — La longueur maximale de la sous-chaîne. Facultatif. Int ou UInt
Valeur renvoyée
Renvoie une sous-chaîne de s de length points de code, à partir de l’indice de point de code offset. String
Exemples
Exemple d’utilisation
SELECT 'Täglich grüßt das Murmeltier.' AS str, substringUTF8(str, 9), substringUTF8(str, 9, 5)
Täglich grüßt das Murmeltier. grüßt das Murmeltier. grüßt
Introduite dans : v20.1.0
Convertit une chaîne en UTF-8 valide en remplaçant tout caractère UTF-8 non valide par le caractère de remplacement � (U+FFFD).
Lorsque plusieurs caractères non valides consécutifs sont détectés, ils sont remplacés par un seul caractère de remplacement.
Syntaxe
Arguments
s — Tout ensemble d’octets représenté par un objet du type de données String. String
Valeur renvoyée
Renvoie une chaîne UTF-8 valide. String
Exemples
Exemple d’utilisation
SELECT toValidUTF8('\\x61\\xF0\\x80\\x80\\x80b')
c
┌─toValidUTF8('a����b')─┐
│ a�b │
└───────────────────────┘
Introduit dans : v20.1.0
Supprime les caractères spécifiés au début et à la fin d’une chaîne.
Par défaut, supprime les caractères d’espacement (ASCII) les plus courants.
Syntaxe
trimBoth(s[, trim_characters])
Alias : trim
Arguments
s — Chaîne à traiter. String
trim_characters — Facultatif. Caractères à supprimer. S’ils ne sont pas spécifiés, les caractères d’espacement courants sont supprimés. String
Valeur renvoyée
Renvoie la chaîne dont les caractères spécifiés ont été supprimés aux deux extrémités. String
Exemples
Exemple d’utilisation
SELECT trimBoth('$$ClickHouse$$', '$')
┌─trimBoth('$$⋯se$$', '$')─┐
│ ClickHouse │
└──────────────────────────┘
Introduit dans : v20.1.0
Supprime les caractères spécifiés au début d’une chaîne.
Par défaut, supprime les caractères d’espacement (ASCII) courants.
Syntaxe
trimLeft(input[, trim_characters])
Alias : ltrim
Arguments
input — Chaîne à traiter. String
trim_characters — Facultatif. Caractères à supprimer. S’ils ne sont pas spécifiés, les caractères d’espacement courants sont supprimés. String
Valeur renvoyée
Renvoie la chaîne dont les caractères spécifiés ont été supprimés à gauche. String
Exemples
Exemple d’utilisation
SELECT trimLeft('ClickHouse', 'Click');
┌─trimLeft('Cl⋯', 'Click')─┐
│ House │
└──────────────────────────┘
Introduit dans : v20.1.0
Supprime les caractères spécifiés à la fin d’une chaîne.
Par défaut, supprime les caractères d’espacement (ASCII) courants.
Syntaxe
trimRight(s[, trim_characters])
Alias : rtrim
Arguments
s — Chaîne à rogner. String
trim_characters — Caractères optionnels à rogner. S’ils ne sont pas spécifiés, les caractères d’espacement courants sont supprimés. String
Valeur renvoyée
Renvoie la chaîne dont les caractères spécifiés ont été supprimés à droite. String
Exemples
Exemple d’utilisation
SELECT trimRight('ClickHouse','House');
┌─trimRight('C⋯', 'House')─┐
│ Click │
└──────────────────────────┘
Introduit dans : v25.6.0
Accepte une chaîne et la décode selon le schéma d’encodage Base32.
Syntaxe
Arguments
encoded — colonne String ou constante à décoder. Si la chaîne n’est pas encodée en Base32 de manière valide, renvoie une chaîne vide en cas d’erreur. String
Valeur renvoyée
Renvoie une chaîne contenant la valeur décodée de l’argument. String
Exemples
Exemple d’utilisation
SELECT tryBase32Decode('IVXGG33EMVSA====');
┌─tryBase32Decode('IVXGG33EMVSA====')─┐
│ Encoded │
└─────────────────────────────────────┘
Introduit dans : v22.10.0
Comme base58Decode, mais renvoie une chaîne vide en cas d’erreur.
Syntaxe
tryBase58Decode(encoded[, expected_size])
Arguments
encoded — Colonne ou constante de type String. Si la chaîne n’est pas un encodage Base58 valide, renvoie une chaîne vide en cas d’erreur. String
expected_size — Facultatif. Taille décodée attendue en octets. Lorsqu’elle vaut 32 ou 64, un décodeur optimisé est utilisé ; pour les autres valeurs, le décodeur générique est utilisé. UInt8, UInt16, UInt32, or UInt64
Valeur renvoyée
Renvoie une chaîne contenant la valeur décodée de l’argument. String
Exemples
Exemple d’utilisation
SELECT tryBase58Decode('3dc8KtHrwM') AS res, tryBase58Decode('invalid') AS res_invalid;
┌─res─────┬─res_invalid─┐
│ Encoded │ │
└─────────┴─────────────┘
Introduit dans : v18.16.0
Comme base64Decode, mais renvoie une chaîne vide en cas d’erreur.
Syntaxe
Arguments
encoded — colonne String ou constante à décoder. Si la chaîne n’est pas un encodage Base64 valide, renvoie une chaîne vide en cas d’erreur. String
Valeur renvoyée
Renvoie une chaîne contenant la valeur décodée de l’argument. String
Exemples
Exemple d’utilisation
SELECT tryBase64Decode('Y2xpY2tob3VzZQ==')
┌─tryBase64Decode('Y2xpY2tob3VzZQ==')─┐
│ clickhouse │
└─────────────────────────────────────┘
Introduit dans : v18.16.0
Comme base64URLDecode, mais renvoie une chaîne vide en cas d’erreur.
Syntaxe
tryBase64URLDecode(encoded)
Arguments
encoded — Colonne ou constante de type String à décoder. Si la chaîne n’est pas correctement encodée en Base64, renvoie une chaîne vide en cas d’erreur. String
Valeur renvoyée
Renvoie une chaîne contenant la valeur décodée de l’argument. String
Exemples
Exemple d’utilisation
SELECT tryBase64URLDecode('aHR0cHM6Ly9jbGlja2hvdXNlLmNvbQ')
┌─tryBase64URLDecode('aHR0cHM6Ly9jbGlja2hvdXNlLmNvbQ')─┐
│ https://clickhouse.com │
└──────────────────────────────────────────────────────┘
Introduit dans : v24.1.0
Renvoie la représentation Unicode (UTF-8) (algorithme ToUnicode) d’un nom de domaine selon le mécanisme Internationalized Domain Names in Applications (IDNA).
En cas d’erreur, renvoie une chaîne vide au lieu de lever une exception.
Syntaxe
Arguments
Valeur renvoyée
Renvoie une représentation ASCII de la chaîne d’entrée conforme au mécanisme IDNA appliqué à la valeur d’entrée, ou une chaîne vide si l’entrée n’est pas valide. String
Exemples
Exemple d’utilisation
SELECT tryIdnaEncode('straße.münchen.de')
┌─tryIdnaEncode('straße.münchen.de')──┐
│ xn--strae-oqa.xn--mnchen-3ya.de │
└─────────────────────────────────────┘
Introduit dans : v24.1.0
Comme punycodeDecode, mais renvoie une chaîne vide si la chaîne fournie n’est pas une chaîne encodée en Punycode valide.
Syntaxe
Arguments
s — Chaîne encodée en Punycode. String
Valeur renvoyée
Renvoie le texte en clair de la valeur en entrée, ou une chaîne vide si l’entrée n’est pas valide. String
Exemples
Exemple d’utilisation
SELECT tryPunycodeDecode('Mnchen-3ya')
┌─tryPunycodeDecode('Mnchen-3ya')─┐
│ München │
└─────────────────────────────────┘
Introduit dans : v1.1.0
Convertit les caractères latins ASCII d’une chaîne en majuscules.
Syntaxe
Alias : ucase
Arguments
s — La chaîne à convertir en majuscules. String
Valeur renvoyée
Renvoie s convertie en majuscules. String
Exemples
Exemple d’utilisation
SELECT upper('clickhouse')
┌─upper('clickhouse')─┐
│ CLICKHOUSE │
└─────────────────────┘
Introduit dans : v1.1.0
Convertit une chaîne en majuscules, en supposant qu’elle contient du texte UTF-8 valide.
Si cette hypothèse n’est pas respectée, aucune exception n’est levée et le résultat est indéfini.
Cette fonction ne détecte pas la langue ; par exemple, pour le turc, le résultat peut ne pas être parfaitement correct (i/İ vs. i/I).
Si la longueur de la séquence d’octets UTF-8 diffère entre la forme majuscule et la forme minuscule d’un point de code (comme ẞ et ß), le résultat peut être incorrect pour ce point de code.
Syntaxe
Arguments
Valeur renvoyée
Une valeur de type String. String
Exemples
Exemple d’utilisation
SELECT upperUTF8('München') AS Upperutf8
┌─Upperutf8─┐
│ MÜNCHEN │
└───────────┘