Passer au contenu principal
Il s’agit d’une extension de la fonction de table hudi. Elle permet de traiter, en parallèle sur plusieurs nœuds d’un cluster spécifié, des fichiers issus de tables Apache Hudi dans Amazon S3. Sur l’initiateur, elle établit une connexion à tous les nœuds du cluster et répartit dynamiquement les fichiers. Sur le nœud worker, elle demande à l’initiateur la tâche suivante à traiter, puis l’exécute. Ce processus se répète jusqu’à ce que toutes les tâches soient terminées.

Syntaxe

hudiCluster(cluster_name, url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression] [,extra_credentials])

Arguments

ArgumentDescription
cluster_nameNom d’un cluster utilisé pour construire un ensemble d’adresses et de paramètres de connexion pour des serveurs distants et locaux.
urlURL du bucket contenant le chemin vers une table Hudi existante dans S3.
aws_access_key_id, aws_secret_access_keyInformations d’identification à long terme de l’utilisateur du compte AWS. Vous pouvez les utiliser pour authentifier vos requêtes. Ces paramètres sont facultatifs. Si aucune information d’identification n’est spécifiée, celles de la configuration de ClickHouse sont utilisées. Pour plus d’informations, consultez Utilisation de S3 pour le stockage des données.
formatLe format du fichier.
structureStructure de la table. Format : 'column1_name column1_type, column2_name column2_type, ...'.
compressionLe paramètre est facultatif. Valeurs prises en charge : none, gzip/gz, brotli/br, xz/LZMA, zstd/zst. Par défaut, la compression est détectée automatiquement à partir de l’extension du fichier.
extra_credentialsLe paramètre est facultatif. Il permet de transmettre un role_arn pour le contrôle d’accès basé sur les rôles dans ClickHouse Cloud. Consultez Secure S3 pour connaître les étapes de configuration.

Valeur renvoyée

Une table ayant la structure spécifiée pour lire les données d’un cluster à partir de la table Hudi spécifiée dans S3.

Colonnes virtuelles

  • _path — Chemin du fichier. Type : LowCardinality(String).
  • _file — Nom du fichier. Type : LowCardinality(String).
  • _size — Taille du fichier en octets. Type : Nullable(UInt64). Si la taille du fichier est inconnue, la valeur est NULL.
  • _time — Date et heure de la dernière modification du fichier. Type : Nullable(DateTime). Si cette information est inconnue, la valeur est NULL.
  • _etag — ETag du fichier. Type : LowCardinality(String). Si l’ETag est inconnu, la valeur est NULL.
Dernière modification le 25 juin 2026