- ClickStack managé
- ClickStack Open Source
Pour les déploiements en production, Managed ClickStack est recommandé. Il applique par défaut des pratiques de sécurité conformes aux standards du secteur, notamment un chiffrement renforcé, l’authentification et la connectivité, ainsi que des contrôles d’accès gérés, tout en offrant les avantages suivants :
Le tableau suivant présente des exemples de dimensionnement basés sur un débit d’ingestion croissant en mégaoctets par seconde, ainsi que les volumes de données correspondants en téraoctets par mois. Il suppose une moyenne soutenue de 1 QPS depuis ClickStack sur l’ensemble des types de requêtes (recherche, tableaux de bord, alertes).
Pour plus de détails sur l’affinage des hypothèses de dimensionnement pour votre environnement, consultez “Refining sizing assumptions for your environment”.
- Mise à l’échelle automatique de la capacité de calcul, indépendamment du stockage
- Rétention à faible coût et pratiquement illimitée, basée sur le stockage objet
- Possibilité d’isoler indépendamment les charges de travail de lecture et d’écriture avec les Warehouses
- Authentification intégrée
- Sauvegardes automatisées
- Mises à niveau sans interruption
Sécuriser l’ingestion
Par défaut, le ClickStack OpenTelemetry Collector n’est pas sécurisé lorsqu’il est déployé en dehors des distributions open source et ne nécessite pas d’authentification sur ses ports OTLP.Pour sécuriser l’ingestion, spécifiez un jeton d’authentification lors du déploiement du collector à l’aide de la variable d’environnementOTLP_AUTH_TOKEN. Consultez “Securing the collector” pour plus de détails.Créer un utilisateur d’ingestion
Il est recommandé de créer un utilisateur dédié pour l’OTel collector afin d’ingérer les données dans Managed ClickHouse et de garantir que l’ingestion est envoyée vers une base de données spécifique, par exempleotel. Consultez “Creating an ingestion user” pour plus de détails.Configurer le Time To Live (TTL)
Assurez-vous que le Time To Live (TTL) a été configuré de manière appropriée pour votre déploiement Managed ClickStack. Il contrôle la durée de conservation des données ; la valeur par défaut de 3 jours doit souvent être modifiée.Estimation des ressources
Ce qui suit propose un modèle pour estimer les ressources de calcul et de stockage nécessaires à un déploiement ClickStack en fonction du volume d’ingestion prévu. Les valeurs obtenues sont uniquement des estimations et doivent servir de référence initiale - elles ne constituent pas une recommandation prescriptive. Les besoins réels dépendent de la complexité des requêtes, de la concurrence, des politiques de rétention et des variations du débit d’ingestion. Surveillez toujours l’utilisation des ressources et adaptez le dimensionnement selon les besoins.Lors du déploiement de ClickStack, provisionnez les ressources de calcul pour couvrir deux charges de travail indépendantes : ingestion et requêtes.| Charge de travail | Ressources estimées |
|---|---|
| Ingestion | 1 vCPU pour 10 MB/s de débit d’ingestion soutenu |
| Requêtes | 1 vCPU par QPS et pour 10 MB/s de débit d’ingestion soutenu |
Isolation des requêtes par rapport à l’ingestionDans la plupart des déploiements autogérés, l’ingestion et les requêtes partagent les mêmes nœuds. Dans ce cas, utilisez le total des CPU comme référence. Le dimensionnement isolé - où les ressources de calcul pour l’ingestion et les requêtes sont provisionnées indépendamment - est pris en charge dans ClickHouse Cloud via des pools de calcul distincts, appelés Warehouses.
Hypothèses
Hypothèses
- Un taux de compression de 10x pour le stockage - généralement une hypothèse prudente pour les logs et les traces.
- Des SLA de requête avec un P50 de 1,5 seconde et un P99 de 5 secondes.
- Nous supposons que la plupart des requêtes portent sur des données récentes, selon une distribution log-normale qui culmine autour d’une heure et décroît jusqu’à environ six heures. Les utilisateurs peuvent souhaiter provisionner des ressources de calcul dédiées pour interroger des données plus anciennes. Dans ClickHouse Cloud, celles-ci peuvent rester inactives (et donc ne pas engendrer de coûts) lorsqu’elles ne sont pas utilisées.
- Bien que les ressources de calcul des requêtes puissent être dimensionnées indépendamment de celles de l’ingestion, elles restent intrinsèquement liées au volume d’ingestion. Nous partons du principe qu’à mesure que l’ingestion augmente, la densité des données croît, ce qui entraîne des volumes analysés plus importants au moment des requêtes et, par conséquent, des besoins plus élevés en ressources de calcul pour les requêtes.
| MB/s | TB/mois | CPU d’ingestion | CPU de requête | CPU totaux | Stockage total (par mois) (GB) |
|---|---|---|---|---|---|
| 10 | 25.92 | 1 | 3 | 4 | 2,592 |
| 20 | 51.84 | 2 | 6 | 8 | 5,184 |
| 50 | 129.6 | 5 | 15 | 20 | 12,960 |
| 100 | 259.2 | 10 | 30 | 40 | 25,920 |
| 200 | 518.4 | 20 | 60 | 80 | 51,840 |
| 500 | 1,296 | 50 | 150 | 200 | 129,600 |
| 1000 | 2,592 | 100 | 300 | 400 | 259,200 |
Isoler les charges de travail d’observabilité
Si vous ajoutez ClickStack à un service ClickHouse Cloud existant qui prend déjà en charge d’autres charges de travail, comme l’analytique applicative en temps réel, il est fortement recommandé d’isoler le trafic d’observabilité.Utilisez les Managed Warehouses pour créer un service enfant dédié à ClickStack. Cela vous permet de :- Isoler la charge d’ingestion et de requête des applications existantes
- Mettre à l’échelle indépendamment les charges de travail d’observabilité
- Empêcher les requêtes d’observabilité d’avoir un impact sur l’analytique de production
- Partager, si nécessaire, les mêmes jeux de données sous-jacents entre les services