Passer au contenu principal
Fournit une interface de type table en lecture seule pour des tables Apache Iceberg stockées dans Amazon S3, Azure, HDFS ou localement.

Syntaxe

icebergS3(url [, NOSIGN | access_key_id, secret_access_key, [session_token]] [,format] [,compression_method] [,extra_credentials])
icebergS3(named_collection[, option=value [,..]])

icebergAzure(connection_string|storage_account_url, container_name, blobpath, [,account_name], [,account_key] [,format] [,compression_method])
icebergAzure(named_collection[, option=value [,..]])

icebergHDFS(path_to_table, [,format] [,compression_method])
icebergHDFS(named_collection[, option=value [,..]])

icebergLocal(path_to_table, [,format] [,compression_method])
icebergLocal(named_collection[, option=value [,..]])

Arguments

La description des arguments est identique à celle des fonctions de table s3, azureBlobStorage, HDFS et file. format désigne le format des fichiers de données de la table Iceberg. Pour icebergS3, le paramètre facultatif extra_credentials peut être utilisé pour transmettre un role_arn afin d’activer l’accès basé sur les rôles dans ClickHouse Cloud. Voir Secure S3 pour connaître les étapes de configuration.

Valeur renvoyée

Une table ayant la structure spécifiée pour lire les données de la table Iceberg indiquée.

Exemple

SELECT * FROM icebergS3('http://test.s3.amazonaws.com/clickhouse-bucket/test_table', 'test', 'test')
ClickHouse prend actuellement en charge la lecture des versions v1 et v2 du format Iceberg via les fonctions de table icebergS3, icebergAzure, icebergHDFS et icebergLocal, ainsi que les moteurs de table IcebergS3, icebergAzure, IcebergHDFS et IcebergLocal.

Définir une collection nommée

Voici un exemple de configuration d’une collection nommée pour stocker l’URL et les informations d’authentification :
<clickhouse>
    <named_collections>
        <iceberg_conf>
            <url>http://test.s3.amazonaws.com/clickhouse-bucket/</url>
            <access_key_id>test</access_key_id>
            <secret_access_key>test</secret_access_key>
            <format>auto</format>
            <structure>auto</structure>
        </iceberg_conf>
    </named_collections>
</clickhouse>
SELECT * FROM icebergS3(iceberg_conf, filename = 'test_table')
DESCRIBE icebergS3(iceberg_conf, filename = 'test_table')

Utilisation d’un catalogue de données

Les tables Iceberg peuvent également être utilisées avec différents catalogues de données, tels que REST Catalog, AWS Glue Data Catalog et Unity Catalog.
Lors de l’utilisation d’un catalogue, la plupart des utilisateurs préféreront utiliser le moteur de base de données DataLakeCatalog, qui connecte ClickHouse à votre catalogue pour découvrir vos tables. Vous pouvez utiliser ce moteur de base de données au lieu de créer manuellement des tables individuelles avec le moteur de table IcebergS3.
Pour les utiliser, créez une table avec le moteur IcebergS3 et fournissez les paramètres nécessaires. Par exemple, en utilisant REST Catalog avec le stockage MinIO :
CREATE TABLE `database_name.table_name`
ENGINE = IcebergS3(
  'http://minio:9000/warehouse-rest/table_name/',
  'minio_access_key',
  'minio_secret_key'
)
Ou, avec AWS Glue Data Catalog et S3 :
CREATE TABLE `my_database.my_table`  
ENGINE = IcebergS3(
  's3://my-data-bucket/warehouse/my_database/my_table/',
  'aws_access_key',
  'aws_secret_key'
)

Évolution du schéma

À ce stade, avec CH, vous pouvez lire des tables Iceberg dont le schéma a évolué au fil du temps. Nous prenons actuellement en charge la lecture de tables dans lesquelles des colonnes ont été ajoutées ou supprimées, et dont l’ordre a été modifié. Vous pouvez également transformer une colonne où une valeur est obligatoire en colonne où NULL est autorisé. De plus, nous prenons en charge les conversions de type autorisées pour les types simples, à savoir :  
  • int -> long
  • float -> double
  • decimal(P, S) -> decimal(P’, S) where P’ > P.
À l’heure actuelle, il n’est pas possible de modifier des structures imbriquées ni les types des éléments au sein des Array et des Map.

Élagage des partitions

ClickHouse prend en charge l’élagage des partitions lors des requêtes SELECT sur les tables Iceberg, ce qui permet d’optimiser les performances des requêtes en ignorant les fichiers de données non pertinents. Pour activer l’élagage des partitions, définissez use_iceberg_partition_pruning = 1. Pour en savoir plus sur l’élagage des partitions dans Iceberg, consultez https://iceberg.apache.org/spec/#partitioning

Time travel

ClickHouse prend en charge le time travel pour les tables Iceberg, ce qui permet d’interroger des données historiques à l’aide d’un horodatage spécifique ou d’un ID de snapshot.

Traitement des tables contenant des lignes supprimées

Actuellement, seules les tables Iceberg avec des suppressions par position sont prises en charge. Les méthodes de suppression suivantes ne sont pas prises en charge :

Utilisation de base

 SELECT * FROM example_table ORDER BY 1 
 SETTINGS iceberg_timestamp_ms = 1714636800000
 SELECT * FROM example_table ORDER BY 1 
 SETTINGS iceberg_snapshot_id = 3547395809148285433
Remarque : vous ne pouvez pas spécifier à la fois les paramètres iceberg_timestamp_ms et iceberg_snapshot_id dans une même requête.

Points importants

  • Les snapshots sont généralement créés dans les cas suivants :
  • De nouvelles données sont écrites dans la table
  • Une opération de compaction des données est effectuée
  • Les modifications du schéma ne créent généralement pas de snapshots - Cela entraîne des comportements importants lors de l’utilisation du time travel sur des tables ayant subi une évolution du schéma.

Exemples de scénarios

Tous les scénarios sont écrits en Spark, car CH ne prend pas encore en charge l’écriture dans les tables Iceberg.

Scénario 1 : Modifications de schéma sans nouveaux snapshots

Considérez la séquence d’opérations suivante :
 -- Create a table with two columns
  CREATE TABLE IF NOT EXISTS spark_catalog.db.time_travel_example (
  order_number bigint, 
  product_code string
  ) 
  USING iceberg 
  OPTIONS ('format-version'='2')

- - Insert data into the table
  INSERT INTO spark_catalog.db.time_travel_example VALUES 
    (1, 'Mars')

  ts1 = now() // A piece of pseudo code

- - Alter table to add a new column
  ALTER TABLE spark_catalog.db.time_travel_example ADD COLUMN (price double)
 
  ts2 = now()

- - Insert data into the table
  INSERT INTO spark_catalog.db.time_travel_example VALUES (2, 'Venus', 100)

   ts3 = now()

- - Query the table at each timestamp
  SELECT * FROM spark_catalog.db.time_travel_example TIMESTAMP AS OF ts1;

+------------+------------+
|order_number|product_code|
+------------+------------+
|           1|        Mars|
+------------+------------+
  SELECT * FROM spark_catalog.db.time_travel_example TIMESTAMP AS OF ts2;

+------------+------------+
|order_number|product_code|
+------------+------------+
|           1|        Mars|
+------------+------------+

  SELECT * FROM spark_catalog.db.time_travel_example TIMESTAMP AS OF ts3;

+------------+------------+-----+
|order_number|product_code|price|
+------------+------------+-----+
|           1|        Mars| NULL|
|           2|       Venus|100.0|
+------------+------------+-----+
Résultats de la requête à différents horodatages :
  • À ts1 & ts2 : seules les deux colonnes d’origine sont présentes
  • À ts3 : les trois colonnes sont présentes, avec NULL pour le prix de la première ligne

Scénario 2 : Différences entre le schéma historique et le schéma actuel

Une requête de time travel exécutée à l’instant présent peut afficher un schéma différent de celui de la table actuelle :
-- Create a table
  CREATE TABLE IF NOT EXISTS spark_catalog.db.time_travel_example_2 (
  order_number bigint, 
  product_code string
  ) 
  USING iceberg 
  OPTIONS ('format-version'='2')

-- Insert initial data into the table
  INSERT INTO spark_catalog.db.time_travel_example_2 VALUES (2, 'Venus');

-- Alter table to add a new column
  ALTER TABLE spark_catalog.db.time_travel_example_2 ADD COLUMN (price double);

  ts = now();

-- Query the table at a current moment but using timestamp syntax

  SELECT * FROM spark_catalog.db.time_travel_example_2 TIMESTAMP AS OF ts;

    +------------+------------+
    |order_number|product_code|
    +------------+------------+
    |           2|       Venus|
    +------------+------------+

-- Query the table at a current moment
  SELECT * FROM spark_catalog.db.time_travel_example_2;
    +------------+------------+-----+
    |order_number|product_code|price|
    +------------+------------+-----+
    |           2|       Venus| NULL|
    +------------+------------+-----+
Cela s’explique par le fait que ALTER TABLE ne crée pas de nouvel instantané ; pour la table actuelle, Spark prend la valeur de schema_id dans le fichier de métadonnées le plus récent, et non dans un instantané.

Scénario 3 : Différences entre le schéma historique et le schéma actuel

Le second point est que, lors d’un time travel, vous ne pouvez pas obtenir l’état de la table avant que des données n’y aient été écrites :
-- Create a table
  CREATE TABLE IF NOT EXISTS spark_catalog.db.time_travel_example_3 (
  order_number bigint, 
  product_code string
  ) 
  USING iceberg 
  OPTIONS ('format-version'='2');

  ts = now();

-- Query the table at a specific timestamp
  SELECT * FROM spark_catalog.db.time_travel_example_3 TIMESTAMP AS OF ts; -- Finises with error: Cannot find a snapshot older than ts.
Dans ClickHouse, le comportement est le même que dans Spark. Vous pouvez considérer les requêtes Select de Spark comme des requêtes Select de ClickHouse, et cela fonctionnera de la même manière.

Résolution du fichier de métadonnées

Lors de l’utilisation de la fonction de table iceberg dans ClickHouse, le système doit trouver le fichier metadata.json approprié, qui décrit la structure de la table Iceberg. Voici comment ce processus de résolution fonctionne :
  1. Spécification directe du chemin : *Si vous définissez iceberg_metadata_file_path, le système utilisera exactement ce chemin en le combinant avec le chemin du répertoire de la table Iceberg.
  • Lorsque ce paramètre est fourni, tous les autres paramètres de résolution sont ignorés.
  1. Correspondance de l’UUID de la table : *Si iceberg_metadata_table_uuid est spécifié, le système : *N’examinera que les fichiers .metadata.json du répertoire metadata *Filtrera les fichiers contenant un champ table-uuid correspondant à l’UUID spécifié (sans distinction de casse)
  2. Recherche par défaut : *Si aucun des paramètres ci-dessus n’est fourni, tous les fichiers .metadata.json du répertoire metadata deviennent des candidats

Sélection du fichier le plus récent

Après avoir identifié les fichiers candidats à l’aide des règles ci-dessus, le système détermine lequel est le plus récent :
  • Si iceberg_recent_metadata_file_by_last_updated_ms_field est activé :
  • Le fichier dont la valeur last-updated-ms est la plus élevée est sélectionné
  • Sinon :
  • Le fichier dont le numéro de version est le plus élevé est sélectionné
  • (La version apparaît sous la forme V dans les noms de fichiers au format V.metadata.json ou V-uuid.metadata.json)
Remarque : tous les paramètres mentionnés sont des paramètres de fonction de table (et non des paramètres globaux ou au niveau de la requête) et doivent être spécifiés comme indiqué ci-dessous :
SELECT * FROM iceberg('s3://bucket/path/to/iceberg_table', 
    SETTINGS iceberg_metadata_table_uuid = 'a90eed4c-f74b-4e5b-b630-096fb9d09021');
Remarque : si les catalogues Iceberg assurent généralement la résolution des métadonnées, la fonction de table iceberg de ClickHouse interprète directement les fichiers stockés dans S3 comme des tables Iceberg ; il est donc important de comprendre ces règles de résolution.

Cache de métadonnées

Le moteur de table Iceberg et la fonction de table prennent en charge un cache de métadonnées qui stocke les informations des fichiers manifest, de la liste des manifests et du JSON de métadonnées. Ce cache est stocké en mémoire. Cette fonctionnalité est contrôlée par le paramètre use_iceberg_metadata_files_cache, activé par défaut.

Aliases

La fonction de table iceberg est désormais un alias pour icebergS3.

Colonnes virtuelles

  • _path — Chemin du fichier. Type : LowCardinality(String).
  • _file — Nom du fichier. Type : LowCardinality(String).
  • _size — Taille du fichier en octets. Type : Nullable(UInt64). Si la taille du fichier est inconnue, la valeur est NULL.
  • _time — Date et heure de la dernière modification du fichier. Type : Nullable(DateTime). Si cette date et heure sont inconnues, la valeur est NULL.
  • _etag — ETag du fichier. Type : LowCardinality(String). Si l’ETag est inconnu, la valeur est NULL.

Écriture dans une table Iceberg

À partir de la version 25.7, ClickHouse prend en charge la modification des tables Iceberg des utilisateurs. Pour l’instant, cette fonctionnalité est expérimentale ; vous devez donc d’abord l’activer :
SET allow_insert_into_iceberg = 1;

Création d’une table

Pour créer votre propre table Iceberg vide, utilisez les mêmes commandes que pour la lecture, mais indiquez explicitement le schéma. L’écriture prend en charge tous les formats de données définis par la spécification Iceberg, tels que Parquet, Avro et ORC.

Exemple

CREATE TABLE iceberg_writes_example
(
    x Nullable(String),
    y Nullable(Int32)
)
ENGINE = IcebergLocal('/home/scanhex12/iceberg_example/')
Remarque : pour créer un fichier d’indice de version, activez le paramètre iceberg_use_version_hint. Si vous souhaitez compresser le fichier metadata.json, indiquez le nom du codec dans le paramètre iceberg_metadata_compression_method.

INSERT

Après avoir créé une nouvelle table, vous pouvez insérer des données à l’aide de la syntaxe ClickHouse standard.

Exemple

INSERT INTO iceberg_writes_example VALUES ('Pavel', 777), ('Ivanov', 993);

SELECT *
FROM iceberg_writes_example
FORMAT VERTICAL;

Row 1:
──────
x: Pavel
y: 777

Row 2:
──────
x: Ivanov
y: 993

DELETE

La suppression des lignes supplémentaires dans le format merge-on-read est également prise en charge par ClickHouse. Cette requête créera un nouveau snapshot avec des fichiers de suppression par position.

Exemple

ALTER TABLE iceberg_writes_example DELETE WHERE x != 'Ivanov';

SELECT *
FROM iceberg_writes_example
FORMAT VERTICAL;

Row 1:
──────
x: Ivanov
y: 993

Évolution du schéma

ClickHouse vous permet d’ajouter, de supprimer, de modifier ou de renommer des colonnes à types simples (hors Tuple, Array et Map).

Exemple

ALTER TABLE iceberg_writes_example MODIFY COLUMN y Nullable(Int64);
SHOW CREATE TABLE iceberg_writes_example;

   ┌─statement─────────────────────────────────────────────────┐
1. │ CREATE TABLE default.iceberg_writes_example              ↴│
   │↳(                                                        ↴│
   │↳    `x` Nullable(String),                                ↴│
   │↳    `y` Nullable(Int64)                                  ↴│
   │↳)                                                        ↴│
   │↳ENGINE = IcebergLocal('/home/scanhex12/iceberg_example/') │
   └───────────────────────────────────────────────────────────┘

ALTER TABLE iceberg_writes_example ADD COLUMN z Nullable(Int32);
SHOW CREATE TABLE iceberg_writes_example;

   ┌─statement─────────────────────────────────────────────────┐
1. │ CREATE TABLE default.iceberg_writes_example              ↴│
   │↳(                                                        ↴│
   │↳    `x` Nullable(String),                                ↴│
   │↳    `y` Nullable(Int64),                                 ↴│
   │↳    `z` Nullable(Int32)                                  ↴│
   │↳)                                                        ↴│
   │↳ENGINE = IcebergLocal('/home/scanhex12/iceberg_example/') │
   └───────────────────────────────────────────────────────────┘

SELECT *
FROM iceberg_writes_example
FORMAT VERTICAL;

Row 1:
──────
x: Ivanov
y: 993
z: ᴺᵁᴸᴸ

ALTER TABLE iceberg_writes_example DROP COLUMN z;
SHOW CREATE TABLE iceberg_writes_example;
   ┌─statement─────────────────────────────────────────────────┐
1. │ CREATE TABLE default.iceberg_writes_example              ↴│
   │↳(                                                        ↴│
   │↳    `x` Nullable(String),                                ↴│
   │↳    `y` Nullable(Int64)                                  ↴│
   │↳)                                                        ↴│
   │↳ENGINE = IcebergLocal('/home/scanhex12/iceberg_example/') │
   └───────────────────────────────────────────────────────────┘

SELECT *
FROM iceberg_writes_example
FORMAT VERTICAL;

Row 1:
──────
x: Ivanov
y: 993

ALTER TABLE iceberg_writes_example RENAME COLUMN y TO value;
SHOW CREATE TABLE iceberg_writes_example;

   ┌─statement─────────────────────────────────────────────────┐
1. │ CREATE TABLE default.iceberg_writes_example              ↴│
   │↳(                                                        ↴│
   │↳    `x` Nullable(String),                                ↴│
   │↳    `value` Nullable(Int64)                              ↴│
   │↳)                                                        ↴│
   │↳ENGINE = IcebergLocal('/home/scanhex12/iceberg_example/') │
   └───────────────────────────────────────────────────────────┘

SELECT *
FROM iceberg_writes_example
FORMAT VERTICAL;

Row 1:
──────
x: Ivanov
value: 993

Compaction

ClickHouse prend en charge la compaction des tables Iceberg. Actuellement, elle peut fusionner les fichiers de suppression par position avec les fichiers de données tout en mettant à jour les métadonnées. Les ID et les timestamps des snapshots précédents restent inchangés, de sorte que la fonctionnalité de time travel peut toujours être utilisée avec les mêmes valeurs. Comment l’utiliser :
SET allow_experimental_iceberg_compaction = 1

OPTIMIZE TABLE iceberg_writes_example;

SELECT *
FROM iceberg_writes_example
FORMAT VERTICAL;

Row 1:
──────
x: Ivanov
y: 993

Expiration des snapshots

Les tables Iceberg accumulent des snapshots à chaque opération INSERT, DELETE ou UPDATE. Au fil du temps, cela peut entraîner un grand nombre de snapshots et de fichiers de données associés. La commande expire_snapshots supprime les anciens snapshots et nettoie les fichiers de données qui ne sont plus référencés par aucun snapshot conservé. Syntaxe :
ALTER TABLE iceberg_table EXECUTE expire_snapshots(
    ['timestamp']
    [, expire_before = 'timestamp']
    [, retention_period = '3d']
    [, retain_last = 100]
    [, snapshot_ids = [1, 2, 3, 4]]
    [, dry_run = 1]
);
Par défaut, les snapshots à conserver sont déterminés par la politique de rétention (propriétés de la table min-snapshots-to-keep, max-snapshot-age-ms et surcharges par référence). Lorsque snapshot_ids est spécifié, la politique de rétention est ignorée et seuls les snapshots listés sont pris en compte pour l’expiration. Arguments :
  • 'timestamp' (positionnel) ou expire_before = 'timestamp' — une chaîne DateTime (par ex. '2024-06-01 00:00:00') interprétée dans le fuseau horaire du serveur. Sert de garde-fou : les snapshots dont timestamp-ms est égal ou postérieur à cette valeur sont protégés contre l’expiration, même si la politique de rétention les ferait autrement expirer. Peut être combiné avec snapshot_ids ; dans ce cas, les snapshots listés dont la date est égale ou postérieure à l’horodatage n’expirent pas.
  • retention_period = '<duration>' — remplace history.expire.max-snapshot-age-ms défini au niveau de la table, pour cet appel uniquement. Les snapshots plus anciens que cette durée (calculée à partir de maintenant) deviennent candidats à l’expiration. La valeur est une chaîne de durée composée d’une ou plusieurs paires {number}{unit} concaténées. Unités prises en charge : y (365 jours), w (7 jours), d (24 heures), h (60 minutes), m (60 secondes), s (1 seconde), ms (1 milliseconde). Les unités peuvent être combinées, par ex. '3d', '12h', '1d12h30m', '500ms'.
  • retain_last = N — remplace history.expire.min-snapshots-to-keep défini au niveau de la table, pour cet appel uniquement. Au moins N snapshots sont toujours conservés, quel que soit leur âge.
  • snapshot_ids = [id1, id2, ...] — fait expirer exactement les ID de snapshot listés (à l’exception des snapshots référencés par le snapshot actuel, des branches ou des tags). Ce mode contourne entièrement la politique de rétention et ne peut pas être combiné avec retention_period ou retain_last.
  • dry_run = 1 — calcule ce qui expirerait et renvoie des métriques sans écrire de nouvelles métadonnées ni supprimer de fichiers.
retention_period et retain_last ne remplacent que les valeurs de rétention par défaut au niveau de la table. Les surcharges de rétention par référence (branche/tag) configurées dans les propriétés de la table Iceberg (par ex. refs.<branch>.min-snapshots-to-keep) ne sont jamais remplacées — elles s’appliquent toujours telles qu’elles sont spécifiées dans les métadonnées de la table.
Exemple :
SET allow_insert_into_iceberg = 1;

-- Create some snapshots by inserting data
INSERT INTO iceberg_table VALUES (1);
INSERT INTO iceberg_table VALUES (2);
INSERT INTO iceberg_table VALUES (3);

-- Expire using retention policy only
ALTER TABLE iceberg_table EXECUTE expire_snapshots();

-- Expire with a safety fuse: protect snapshots newer than the timestamp (positional syntax)
ALTER TABLE iceberg_table EXECUTE expire_snapshots('2025-01-01 00:00:00');

-- Same using the named argument form
ALTER TABLE iceberg_table EXECUTE expire_snapshots(expire_before = '2025-01-01 00:00:00');

-- Override retention parameters for one execution
ALTER TABLE iceberg_table EXECUTE expire_snapshots(retention_period = '3d', retain_last = 10);

-- Expire explicit snapshots
ALTER TABLE iceberg_table EXECUTE expire_snapshots(snapshot_ids = [101, 102, 103]);

-- Dry-run preview (no metadata updates, no file deletes)
ALTER TABLE iceberg_table EXECUTE expire_snapshots(retention_period = '1d', dry_run = 1);
Sortie : La commande renvoie un tableau comportant deux colonnes (metric_name String, metric_value Int64) et contenant une ligne par métrique. Les noms des métriques suivent la spécification Iceberg :
metric_nameDescription
deleted_data_files_countNombre de fichiers de données supprimés
deleted_position_delete_files_countNombre de fichiers de suppression par position supprimés
deleted_equality_delete_files_countNombre de fichiers de suppression par égalité supprimés
deleted_manifest_files_countNombre de fichiers manifest supprimés
deleted_manifest_lists_countNombre de fichiers de liste de manifests supprimés
deleted_statistics_files_countNombre de fichiers de statistiques supprimés (toujours 0 actuellement)
dry_run1 pour le mode simulation, 0 pour l’exécution normale
La commande effectue les étapes suivantes :
  1. Évalue la politique de rétention (voir ci-dessous) afin de déterminer quels snapshots doivent être conservés
  2. Si un argument d’horodatage a été fourni, protège également tous les snapshots correspondant à cet horodatage ou plus récents
  3. Fait expirer les snapshots qui ne sont ni conservés par la politique ni protégés par le seuil d’horodatage
  4. Détermine quels fichiers sont associés exclusivement aux snapshots expirés
  5. En mode normal : génère de nouvelles métadonnées sans les snapshots expirés
  6. En mode normal : supprime physiquement les listes de manifests, les fichiers manifest et les fichiers de données devenus inaccessibles
  7. En mode dry_run = 1 : ignore les étapes 5 et 6 et renvoie uniquement les métriques calculées

Politique de rétention des snapshots

La commande expire_snapshots respecte la politique de rétention des snapshots d’Iceberg. La rétention se configure via les propriétés de table Iceberg et des remplacements par référence :
PropriétéPortéePar défautDescription
history.expire.min-snapshots-to-keepTableiceberg_expire_default_min_snapshots_to_keep (par défaut 1)Nombre minimal de snapshots à conserver dans la chaîne d’ancêtres de chaque branche
history.expire.max-snapshot-age-msTableiceberg_expire_default_max_snapshot_age_ms (par défaut 432000000, 5 jours)Âge maximal (en ms) des snapshots à conserver dans une branche
history.expire.max-ref-age-msTableiceberg_expire_default_max_ref_age_ms (par défaut )Âge maximal (en ms) d’une référence de snapshot (branche ou tag) avant la suppression de la référence elle-même
Chaque référence de snapshot (refs dans les métadonnées Iceberg) peut remplacer ces valeurs au moyen de champs propres à la référence : min-snapshots-to-keep, max-snapshot-age-ms et max-ref-age-ms. Évaluation de la rétention :
  • Pour chaque branche (y compris main) : la chaîne d’ancêtres est parcourue à partir de la tête de la branche. Les snapshots sont conservés tant qu’au moins l’une des conditions suivantes est vraie :
    • Le snapshot fait partie des min-snapshots-to-keep premiers snapshots de la chaîne
    • L’âge du snapshot ne dépasse pas max-snapshot-age-ms (c.-à-d. now - timestamp-ms <= max-snapshot-age-ms)
  • Pour les tags : le snapshot tagué est conservé, sauf si le tag a dépassé sa valeur max-ref-age-ms, auquel cas la référence du tag est supprimée
  • Les références autres que main dont l’âge dépasse max-ref-age-ms sont entièrement supprimées (la branche main n’est jamais supprimée)
  • Les références orphelines qui pointent vers des snapshots inexistants sont supprimées avec un avertissement
  • Le snapshot actuel est toujours conservé, quels que soient les paramètres de rétention
Privilèges requis : Le privilège ALTER TABLE EXECUTE est requis. Il s’agit d’un privilège enfant de ALTER TABLE dans la hiérarchie du contrôle d’accès de ClickHouse. Vous pouvez l’accorder spécifiquement ou via le parent :
-- Grant only EXECUTE permission
GRANT ALTER TABLE EXECUTE ON my_iceberg_table TO my_user;

-- Or grant all ALTER TABLE permissions (includes ALTER TABLE EXECUTE)
GRANT ALTER TABLE ON my_iceberg_table TO my_user;
  • Seules les tables Iceberg format version 2 sont prises en charge (les snapshots v1 ne garantissent pas manifest-list, requis pour identifier en toute sécurité les fichiers à nettoyer)
  • Le snapshot actuel est toujours conservé, même s’il est antérieur à l’horodatage spécifié
  • Nécessite que le paramètre allow_insert_into_iceberg soit activé
  • Nécessite que le paramètre allow_experimental_expire_snapshots soit activé
  • Le mécanisme d’autorisation propre au catalog (authentification du catalogue REST, AWS Glue IAM, etc.) est appliqué indépendamment lorsque ClickHouse met à jour les métadonnées

Supprimer les fichiers orphelins

Les fichiers orphelins sont des fichiers présents dans le stockage qui ne sont référencés par aucun snapshot dans les métadonnées de la table Iceberg. Ils s’accumulent à la suite d’écritures ayant échoué, d’un nettoyage partiel après la compaction et d’opérations interrompues, ce qui entraîne une augmentation incontrôlée du stockage. La commande remove_orphan_files identifie et supprime ces fichiers orphelins. Syntaxe :
-- Positional form: single unnamed older_than argument
ALTER TABLE iceberg_table EXECUTE remove_orphan_files('timestamp')

-- Named form
ALTER TABLE iceberg_table EXECUTE remove_orphan_files(
    older_than = 'timestamp',
    location = 'path',
    dry_run = 0|1
)

-- No arguments: use all defaults (older_than = 3 days ago)
ALTER TABLE iceberg_table EXECUTE remove_orphan_files()
Paramètres :
ParamètreTypePar défautDescription
older_thanString (horodatage)il y a 3 jours (configurable via iceberg_orphan_files_older_than_seconds)Considère uniquement comme fichiers orphelins potentiels les fichiers dont la date de dernière modification est antérieure à cet horodatage. Mesure de sécurité pour éviter de supprimer des fichiers provenant d’écritures en cours.
locationStringEmplacement de la tableLimite l’analyse à un sous-répertoire spécifique sous l’emplacement de la table (par ex., 'data/' ou 'metadata/').
dry_runUInt640Lorsque la valeur est 1, identifie les fichiers orphelins et renvoie un résumé des résultats sans rien supprimer.
Exemples :
-- Remove orphan files older than a specific timestamp
ALTER TABLE iceberg_table EXECUTE remove_orphan_files('2026-03-01 00:00:00');

-- Dry run: preview which files would be deleted
ALTER TABLE iceberg_table EXECUTE remove_orphan_files(dry_run = 1);

-- Scan only the data directory
ALTER TABLE iceberg_table EXECUTE remove_orphan_files(
    older_than = '2026-03-01 00:00:00',
    location = 'data/'
);

-- Combine positional older_than with named arguments
ALTER TABLE iceberg_table EXECUTE remove_orphan_files(
    '2026-03-01 00:00:00',
    dry_run = 1
);
Sortie : La commande renvoie une table avec les colonnes metric_name et metric_value, indiquant le nombre de fichiers supprimés (ou qui seraient supprimés en mode dry_run) par catégorie. Les catégories de fichiers sont déterminées au mieux à l’aide d’heuristiques basées sur les conventions de nommage des fichiers ; les fichiers qui ne correspondent à aucun motif spécifique sont comptabilisés par défaut dans deleted_data_files_count :
metric_namemetric_value
deleted_data_files_count5
deleted_position_delete_files_count2
deleted_equality_delete_files_count0
deleted_manifest_files_count3
deleted_manifest_lists_count1
deleted_metadata_files_count0
deleted_statistics_files_count0
skipped_missing_metadata_count0
failed_deletions_count0
Paramètres :
SettingTypePar défautDescription
allow_iceberg_remove_orphan_filesBoolfalseParamètre de contrôle permettant d’activer la fonctionnalité (expérimentale).
iceberg_orphan_files_older_than_secondsUInt64259200 (3 jours)Seuil older_than par défaut, en secondes, lorsque l’argument est omis.
  • Nécessite Iceberg format version 2 (ou supérieure). Les tables version 1 sont rejetées, car elles ne contiennent pas de pointeurs manifest-list dans les snapshots, nécessaires pour déterminer en toute sécurité l’ensemble des fichiers accessibles. L’exécution de la commande sur une table v1 renvoie une erreur BAD_ARGUMENTS.
  • Les paramètres allow_insert_into_iceberg et allow_iceberg_remove_orphan_files doivent tous deux être activés
  • Il est recommandé d’exécuter expire_snapshots avant remove_orphan_files afin que les fichiers référencés uniquement par des snapshots expirés soient d’abord nettoyés
  • Utilisez dry_run = 1 pour prévisualiser les fichiers orphelins avant leur suppression
  • Le seuil older_than évite la suppression de fichiers issus d’écritures en cours — le seuil par défaut de 3 jours offre une marge de sécurité confortable

Voir aussi

Dernière modification le 25 juin 2026