Envoyer des données avec Vector
- Managed ClickStack
- ClickStack open source
Le guide suivant suppose que vous avez déjà créé un service Managed ClickStack et enregistré vos identifiants de service. Si ce n’est pas le cas, suivez le guide Getting Started pour Managed ClickStack jusqu’à l’étape de configuration de Vector.Créez une table pour vos données. Celle-ci doit correspondre au schéma de sortie de vos données. L’exemple ci-dessous repose sur une structure Nginx classique. Adaptez-la à vos données, en respectant les bonnes pratiques relatives aux schémas. Nous vous recommandons vivement de vous familiariser avec le concept des clés primaires, en choisissant votre clé primaire selon les recommandations décrites ici.Par défaut, nous recommandons d’utiliser le format
Créer une base de données et une table
Vector nécessite qu’une table et un schéma soient définis avant toute ingestion de données.Commencez par créer une base de données. Cela peut se faire dans la ClickHouse Cloud console.Dans l’exemple ci-dessous, nous utilisonslogs :Clé primaire NginxLa clé primaire ci-dessus correspond aux modes d’accès typiques dans ClickStack UI pour les logs Nginx, mais il peut être nécessaire de l’adapter selon votre charge de travail en production.
Ajouter le sink ClickHouse à la configuration Vector
Modifiez votre configuration Vector pour y inclure le sink ClickHouse, en mettant à jour le champinputs pour recevoir les événements de vos pipelines existants.Cette configuration suppose que votre pipeline Vector en amont a déjà préparé les données pour qu’elles correspondent au schéma ClickHouse cible : les champs sont correctement analysés, nommés et typés pour l’insertion. Consultez l’exemple Nginx ci-dessous pour une illustration complète de l’analyse et de la normalisation de lignes de logs brutes en un schéma adapté à ClickStack.json_each_row, qui encode chaque événement sous la forme d’un objet JSON unique par ligne. Il s’agit du format par défaut et recommandé pour ClickStack lors de l’ingestion de données JSON, et il est préférable aux autres formats, comme les objets JSON encodés sous forme de chaînes.Le sink ClickHouse prend également en charge l’encodage Arrow en flux (actuellement en bêta). Cela peut offrir un débit plus élevé, mais s’accompagne de contraintes importantes : la base de données et la table doivent être statiques, car le schéma n’est récupéré qu’une seule fois au démarrage, et le routage dynamique n’est pas pris en charge. Pour cette raison, l’encodage Arrow convient particulièrement aux pipelines d’ingestion fixes et bien définis.Nous vous recommandons de consulter les options de configuration disponibles pour le sink dans la documentation Vector :L’exemple ci-dessus utilise l’utilisateur par défaut pour Managed ClickStack. Pour les déploiements en production, nous recommandons de créer un utilisateur d’ingestion dédié avec les autorisations et limites appropriées.
Accédez à la ClickStack UI
Accédez à votre service Managed ClickStack et sélectionnez “ClickStack” dans le menu de gauche. Si vous avez déjà terminé l’onboarding, la ClickStack UI s’ouvrira dans un nouvel onglet et vous serez automatiquement authentifié. Sinon, vous pouvez poursuivre l’onboarding et sélectionner « Launch ClickStack » une fois Vector choisi comme source d’ingestion.Créer une source de données
Créez une source de données pour les logs. Si aucune source de données n’existe, il vous sera demandé d’en créer une lors de votre première connexion. Sinon, accédez à Team Settings et ajoutez une nouvelle source de données.La configuration ci-dessus suppose un schéma de type Nginx, avec une colonnetime_local utilisée comme horodatage. Il doit s’agir, dans la mesure du possible, de la colonne d’horodatage déclarée dans la clé primaire. Cette colonne est obligatoire.Nous vous recommandons également de mettre à jour Default SELECT afin de définir explicitement les colonnes renvoyées dans la vue des logs. Si des champs supplémentaires sont disponibles, comme le nom du service, le niveau de log ou une colonne body, ils peuvent également être configurés. La colonne d’affichage de l’horodatage peut aussi être redéfinie si elle diffère de la colonne utilisée dans la clé primaire de la table et configurée ci-dessus.Dans l’exemple ci-dessus, il n’existe pas de colonne Body dans les données. Elle est définie à la place à l’aide d’une expression SQL qui reconstitue une ligne de log Nginx à partir des champs disponibles.Pour les autres options possibles, consultez la référence de configuration.Explorer les données
Accédez à la vue des logs pour explorer les données et commencer à utiliser ClickStack.Jeu de données d’exemple avec Vector
- ClickStack managé
- ClickStack open source
Le guide suivant suppose que vous avez déjà créé un service Managed ClickStack et noté vos identifiants de service. Si ce n’est pas le cas, suivez le guide Getting Started pour Managed ClickStack jusqu’à l’invite de configuration de Vector.Créez une table pour vos données.Cela reconstitue la ligne de journal à partir des champs structurés.Pour les autres options disponibles, consultez la référence de configuration.
Installation de Vector
Avant de continuer, assurez-vous que Vector est installé sur le système sur lequel vous prévoyez d’exécuter votre pipeline d’ingestion. Suivez le guide officiel d’installation de Vector pour installer un binaire précompilé ou un paquet adapté à votre environnement :Une fois l’installation terminée, vérifiez que le binairevector est disponible dans votre PATH avant de poursuivre avec les étapes de configuration ci-dessous.Vector peut être installé sur la même instance que votre ClickStack OTel collector.Suivez les bonnes pratiques en matière d’architecture et de sécurité lorsque vous faites passer Vector en production.Téléchargez les données d’exemple
Si vous souhaitez faire des essais avec un jeu de données d’exemple, téléchargez l’exemple nginx ci-dessous.Ces données ont été collectées à partir d’une instance Nginx configurée pour écrire les logs au format JSON afin d’en faciliter l’analyse. Pour la configuration Nginx correspondante, consultez “Surveillance des logs Nginx avec ClickStack”.
Créer une base de données et une table
Vector nécessite qu’une table et un schéma soient définis avant toute ingestion de données.Créez d’abord une base de données. Vous pouvez le faire depuis la ClickHouse Cloud console.Créez une base de donnéeslogs :Clé primaire NginxLa clé primaire ci-dessus correspond aux modes d’accès typiques dans ClickStack UI pour les logs Nginx, mais elle devra peut-être être ajustée en fonction de votre charge de travail en production.
Copier la configuration Vector
Copiez la configuration Vector et créez un fichiernginx.yaml en renseignant CLICKHOUSE_ENDPOINT et CLICKHOUSE_PASSWORD.L’exemple ci-dessus utilise l’utilisateur par défaut de Managed ClickStack. Pour les déploiements en production, nous recommandons de créer un utilisateur d’ingestion dédié avec les autorisations et les limites appropriées.
Démarrer Vector
Démarrez Vector avec la commande suivante, en créant d’abord le répertoire de données afin d’enregistrer les offsets de fichier.Accéder à la ClickStack UI
Accédez à votre service Managed ClickStack, puis sélectionnez “ClickStack” dans le menu de gauche. Si vous avez déjà terminé l’onboarding, la ClickStack UI s’ouvrira dans un nouvel onglet et vous serez automatiquement authentifié. Sinon, vous pouvez poursuivre l’onboarding et sélectionner « Launch ClickStack » une fois Vector choisi comme source d’entrée.Créer une source de données
Créez une source de données de logs. S’il n’existe encore aucune source de données, il vous sera demandé d’en créer une lors de votre première connexion. Sinon, accédez à Team Settings et ajoutez une nouvelle source de données.La configuration repose sur le schéma Nginx, avec une colonnetime_local utilisée comme horodatage. Il s’agit de la colonne d’horodatage déclarée dans la clé primaire. Cette colonne est obligatoire.Nous avons également défini la sélection par défaut sur time_local, remote_addr, status, request, ce qui détermine les colonnes renvoyées dans la vue des logs.Dans l’exemple ci-dessus, il n’y a pas de colonne Body dans les données. À la place, elle est définie comme l’expression SQL :Explorer les données
Accédez à la vue de recherche du20 octobre 2025 pour explorer les données et commencer à utiliser ClickStack.