Prérequis
- Amazon RDS Postgres
- Amazon Aurora Postgres
- Supabase Postgres
- Google Cloud SQL Postgres
- Azure Flexible Server for Postgres
- Neon Postgres
- Crunchy Bridge Postgres
- Source Postgres générique, si vous utilisez un autre fournisseur Postgres ou une instance autohébergée.
- TimescaleDB, si vous utilisez l’extension TimescaleDB sur un service géré ou une instance autohébergée.
Création de votre ClickPipe
- Dans la console ClickHouse Cloud, accédez à votre service ClickHouse Cloud.
- Sélectionnez le bouton
Data Sourcesdans le menu de gauche, puis cliquez sur « Set up a ClickPipe »
-
Sélectionnez la vignette
Postgres CDC
Ajout de la connexion à votre base de données source Postgres
- Renseignez les informations de connexion de votre base de données source Postgres que vous avez configurée à l’étape des prérequis.
Avant de commencer à ajouter vos informations de connexion, assurez-vous d’avoir autorisé les adresses IP de ClickPipes dans les règles de votre pare-feu. Vous trouverez la liste des adresses IP de ClickPipes ici.
Pour plus d’informations, consultez les guides de configuration de la source Postgres dont les liens figurent en haut de cette page.
(Facultatif) Configuration d’AWS Private Link
(Facultatif) Configuration du tunnel SSH
- Activez le bouton bascule “Utiliser le tunnel SSH”.
- Renseignez les informations de connexion SSH.
-
Pour utiliser l’authentification par clé, cliquez sur “Révoquer et générer une paire de clés” afin de générer une nouvelle paire de clés, puis copiez la clé publique générée dans
~/.ssh/authorized_keyssur votre serveur SSH. - Cliquez sur “Vérifier la connexion” pour la vérifier.
Assurez-vous d’autoriser les adresses IP de ClickPipes dans les règles de pare-feu de l’hôte bastion SSH afin que ClickPipes puisse établir le tunnel SSH.
Configuration des paramètres de réplication
- Assurez-vous de sélectionner le slot de réplication dans la liste déroulante créée à l’étape des prérequis.
Paramètres avancés
- Intervalle de synchronisation : il s’agit de l’intervalle auquel ClickPipes interroge la base de données source pour détecter les changements. Cela a un impact sur le service ClickHouse de destination ; pour les utilisateurs attentifs aux coûts, nous recommandons de conserver une valeur élevée (supérieure à
3600). - Threads parallèles pour le chargement initial : il s’agit du nombre de workers parallèles utilisés pour récupérer l’instantané initial. Ce paramètre est utile si vous avez un grand nombre de tables et souhaitez contrôler le nombre de workers parallèles utilisés pour récupérer cet instantané. Ce paramètre s’applique à chaque table.
- Taille du lot d’extraction : le nombre de lignes à récupérer en un seul lot. Il s’agit d’un paramètre appliqué dans la mesure du possible, qui peut ne pas être respecté dans tous les cas.
- Nombre de lignes de l’instantané par partition : il s’agit du nombre de lignes récupérées dans chaque partition pendant l’instantané initial. Ce paramètre est utile si vos tables contiennent un grand nombre de lignes et que vous souhaitez contrôler le nombre de lignes récupérées dans chaque partition.
- Nombre de tables de l’instantané en parallèle : il s’agit du nombre de tables récupérées en parallèle pendant l’instantané initial. Ce paramètre est utile si vous avez un grand nombre de tables et souhaitez contrôler le nombre de tables récupérées en parallèle.
Configuration des tables
- Ici, vous pouvez sélectionner la base de données de destination pour votre ClickPipe. Vous pouvez soit choisir une base de données existante, soit en créer une nouvelle.
- Vous pouvez sélectionner les tables que vous souhaitez répliquer depuis la base de données Postgres source. Lors de la sélection des tables, vous pouvez également choisir de renommer les tables dans la base de données ClickHouse de destination et d’exclure certaines colonnes.
Vérifier les autorisations et démarrer le ClickPipe
- Sélectionnez le rôle « Accès complet » dans le menu déroulant des autorisations, puis cliquez sur « Terminer la configuration ».