Passer au contenu principal
Le moyen le plus rapide et le plus simple pour démarrer avec ClickHouse consiste à créer un nouveau service dans ClickHouse Cloud. Dans ce guide de prise en main rapide, nous allons vous montrer comment le configurer en trois étapes simples.
1

Créer un service ClickHouse

Pour créer un service ClickHouse gratuit dans ClickHouse Cloud, il vous suffit de vous inscrire en suivant les étapes ci-dessous :
  • Créez un compte sur la page d’inscription
  • Vous pouvez choisir de vous inscrire avec votre adresse e-mail ou via Google SSO, Microsoft SSO, AWS Marketplace, Google Cloud ou Microsoft Azure
  • Si vous vous inscrivez avec une adresse e-mail et un mot de passe, pensez à vérifier votre adresse e-mail dans les 24 heures via le lien reçu par e-mail
  • Connectez-vous avec le nom d’utilisateur et le mot de passe que vous venez de créer

Une fois connecté, ClickHouse Cloud lance l’assistant d’onboarding, qui vous guide dans la création d’un nouveau service ClickHouse. Sélectionnez la région dans laquelle déployer le service, puis donnez un nom à votre nouveau service :
Par défaut, les nouvelles organisations sont placées sur l’offre Scale et créent 3 répliques, chacune avec 4 vCPU et 16 GiB de RAM. Le Vertical autoscaling est activé par défaut dans l’offre Scale. Vous pourrez modifier ultérieurement votre niveau d’organisation sur la page ‘Plans’.Personnalisez les ressources du service si nécessaire en spécifiant une taille minimale et une taille maximale entre lesquelles les répliques pourront évoluer. Lorsque tout est prêt, sélectionnez Create service.
Félicitations ! Votre service ClickHouse Cloud est opérationnel et l’onboarding est terminé. Poursuivez votre lecture pour savoir comment commencer à ingérer et interroger vos données.
2

Se connecter à ClickHouse

Il existe 2 façons de se connecter à ClickHouse :
  • Se connecter via notre SQL Console web
  • Se connecter avec votre application

Se connecter via la SQL Console

Pour démarrer rapidement, ClickHouse met à disposition une SQL Console web vers laquelle vous serez redirigé une fois l’onboarding terminé.Créez un onglet de requête et saisissez une requête simple pour vérifier que votre connexion fonctionne :
SHOW databases
Vous devriez voir 4 bases de données dans la liste, ainsi que celles que vous avez éventuellement ajoutées.
C’est tout : vous êtes prêt à commencer à utiliser votre nouveau service ClickHouse !

Connectez votre application

Cliquez sur le bouton Connect dans le menu de navigation. Une fenêtre modale s’ouvrira et vous fournira les identifiants de votre service, ainsi qu’un ensemble d’instructions pour vous connecter via votre interface ou vos bibliothèques clientes.
Si vous ne voyez pas votre bibliothèque cliente, vous pouvez consulter notre liste d’Integrations.
3

Ajouter des données

ClickHouse est encore mieux avec des données ! Il existe plusieurs façons d’ajouter des données, et la plupart d’entre elles sont disponibles sur la page Sources de données, accessible depuis le menu de navigation.
Vous pouvez téléverser des données à l’aide des méthodes suivantes :
  • Configurez un ClickPipe pour commencer à ingérer des données à partir de sources de données telles que S3, Postgres, Kafka et GCS
  • Utilisez la console SQL
  • Utilisez le client ClickHouse
  • Téléversez un fichier - les formats acceptés incluent JSON, CSV et TSV
  • Téléversez des données depuis l’URL d’un fichier

ClickPipes

ClickPipes est une plateforme d’intégration managée qui simplifie l’ingestion de données depuis un ensemble varié de sources en quelques clics. Conçue pour les charges de travail les plus exigeantes, l’architecture robuste et évolutive de ClickPipes garantit des performances et une fiabilité constantes. ClickPipes peut être utilisé pour des besoins de streaming à long terme ou pour un chargement de données ponctuel.

Ajouter des données via la SQL Console

Comme la plupart des systèmes de gestion de bases de données, ClickHouse regroupe logiquement les tables en bases de données. Utilisez la commande CREATE DATABASE pour créer une nouvelle base de données dans ClickHouse :
CREATE DATABASE IF NOT EXISTS helloworld
Exécutez la commande suivante pour créer une table nommée my_first_table dans la base de données helloworld :
CREATE TABLE helloworld.my_first_table
(
    user_id UInt32,
    message String,
    timestamp DateTime,
    metric Float32
)
ENGINE = MergeTree()
PRIMARY KEY (user_id, timestamp)
Dans l’exemple ci-dessus, my_first_table est une table MergeTree comportant quatre colonnes :
  • user_id : un entier non signé sur 32 bits (UInt32)
  • message : un type de données String, qui remplace des types comme VARCHAR, BLOB, CLOB et d’autres utilisés dans d’autres systèmes de base de données
  • timestamp : une valeur DateTime, qui représente un instant donné
  • metric : un nombre à virgule flottante sur 32 bits (Float32)
Moteurs de tableLes moteurs de table déterminent :
  • Comment et où les données sont stockées
  • Quelles requêtes sont prises en charge
  • Si les données sont répliquées ou non

Il existe de nombreux moteurs de table, mais pour une table simple sur un serveur ClickHouse à nœud unique, MergeTree sera probablement le choix le plus approprié.

Brève introduction aux clés primaires

Avant d’aller plus loin, il est important de comprendre le fonctionnement des clés primaires dans ClickHouse (leur implémentation peut sembler inattendue !) :
  • les clés primaires dans ClickHouse ne sont pas uniques pour chaque ligne d’une table
La clé primaire d’une table ClickHouse détermine la façon dont les données sont triées lors de leur écriture sur le disque. Toutes les 8 192 lignes ou 10 Mo de données (désignés par le terme index granularity) créent une entrée dans le fichier d’index de clé primaire. Ce concept de granularité crée un sparse index qui tient aisément en mémoire, et les granules représentent une stripe de la plus petite quantité de données de colonne traitées lors des requêtes SELECT.La clé primaire peut être définie à l’aide du paramètre PRIMARY KEY. Si vous définissez une table sans PRIMARY KEY spécifié, la clé devient alors le tuple défini dans la clause ORDER BY. Si vous spécifiez à la fois un PRIMARY KEY et un ORDER BY, la clé primaire doit être un sous-ensemble de l’ordre de tri.La clé primaire est également la clé de tri, qui est un tuple de (user_id, timestamp). Par conséquent, les données stockées dans chaque fichier de colonne seront triées par user_id, puis par timestamp.Pour approfondir les concepts fondamentaux de ClickHouse, consultez “Concepts fondamentaux”.

Insérer des données dans votre table

Vous pouvez utiliser la commande familière INSERT INTO TABLE avec ClickHouse, mais il est important de comprendre que chaque insertion dans une table MergeTree entraîne la création d’un part dans le stockage.
Bonne pratique pour ClickHouseInsérez un grand nombre de lignes par lot — des dizaines de milliers, voire des millions de lignes d’un seul coup. Pas d’inquiétude : ClickHouse gère facilement ce type de volume, et cela vous fera économiser de l’argent en envoyant moins de requêtes d’écriture à votre service.

Même pour un exemple simple, insérons plusieurs lignes à la fois :
INSERT INTO helloworld.my_first_table (user_id, message, timestamp, metric) VALUES
    (101, 'Hello, ClickHouse!',                                 now(),       -1.0    ),
    (102, 'Insert a lot of rows per batch',                     yesterday(), 1.41421 ),
    (102, 'Sort your data based on your commonly-used queries', today(),     2.718   ),
    (101, 'Granules are the smallest chunks of data read',      now() + 5,   3.14159 )
Notez que la colonne timestamp est renseignée à l’aide de diverses fonctions Date et DateTime. ClickHouse propose des centaines de fonctions utiles, que vous pouvez consulter dans la section Fonctions.
Vérifions que cela a fonctionné :
SELECT * FROM helloworld.my_first_table

Ajouter des données avec le client ClickHouse

Vous pouvez également vous connecter à votre service ClickHouse Cloud à l’aide d’un outil en ligne de commande nommé clickhouse client. Cliquez sur Connect dans le menu de gauche pour accéder à ces informations. Dans la boîte de dialogue, sélectionnez Native dans la liste déroulante :
  1. Installez ClickHouse.
  2. Exécutez la commande en remplaçant le nom d’hôte, le nom d’utilisateur et le mot de passe par les vôtres :
./clickhouse client --host HOSTNAME.REGION.CSP.clickhouse.cloud \
--secure --port 9440 \
--user default \
--password <password>
Si l’invite avec le smiley s’affiche, vous êtes prêt à exécuter des requêtes !
:)
  1. Pour l’essayer, exécutez la requête suivante :

SELECT *
FROM helloworld.my_first_table
ORDER BY timestamp
Notez que la réponse est renvoyée dans un format de tableau clair :
┌─user_id─┬─message────────────────────────────────────────────┬───────────timestamp─┬──metric─┐
│     102 │ Insert a lot of rows per batch                     │ 2022-03-21 00:00:00 │ 1.41421 │
│     102 │ Sort your data based on your commonly-used queries │ 2022-03-22 00:00:00 │   2.718 │
│     101 │ Hello, ClickHouse!                                 │ 2022-03-22 14:04:09 │      -1 │
│     101 │ Granules are the smallest chunks of data read      │ 2022-03-22 14:04:14 │ 3.14159 │
└─────────┴────────────────────────────────────────────────────┴─────────────────────┴─────────┘

4 rows in set. Elapsed: 0.008 sec.
  1. Ajoutez une clause FORMAT pour indiquer l’un des nombreux formats de sortie pris en charge par ClickHouse :

SELECT *
FROM helloworld.my_first_table
ORDER BY timestamp
FORMAT TabSeparated
Dans la requête ci-dessus, la sortie est renvoyée sous forme de valeurs séparées par des tabulations :
Query id: 3604df1c-acfd-4117-9c56-f86c69721121

102 Insert a lot of rows per batch      2022-03-21 00:00:00     1.41421
102 Sort your data based on your commonly-used queries  2022-03-22 00:00:00     2.718
101 Hello, ClickHouse!  2022-03-22 14:04:09     -1
101 Granules are the smallest chunks of data read       2022-03-22 14:04:14     3.14159

4 rows in set. Elapsed: 0.005 sec.
  1. Pour quitter le clickhouse client, entrez la commande exit :

exit

Téléverser un fichier

Une tâche courante lors de la prise en main d’une base de données consiste à insérer des données que vous possédez déjà dans des fichiers. Nous mettons à disposition en ligne des données d’exemple représentant des données de clickstream — elles comprennent un identifiant utilisateur, une URL visitée et le timestamp de l’événement.Supposons que nous ayons le texte suivant dans un fichier CSV nommé data.csv :
data.csv
102,This is data in a file,2022-02-22 10:43:28,123.45
101,It is comma-separated,2022-02-23 00:00:00,456.78
103,Use FORMAT to specify the format,2022-02-21 10:43:30,678.90
  1. La commande suivante insère les données dans my_first_table :

./clickhouse client --host HOSTNAME.REGION.CSP.clickhouse.cloud \
--secure --port 9440 \
--user default \
--password <password> \
--query='INSERT INTO helloworld.my_first_table FORMAT CSV' < data.csv
  1. Notez que les nouvelles lignes apparaissent désormais dans la table lorsque vous exécutez une requête depuis la console SQL :


Filtrage par liste d’accès IPAvant de poursuivre, nous vous recommandons de configurer le filtrage par liste d’accès IP. Consultez « Configurer les filtres IP » pour plus de détails.

Et ensuite ?

Dernière modification le 25 juin 2026