Ce document présente la migration des données d’Amazon Redshift vers ClickHouse.
Introduction
ClickHouse vs Redshift
- Redshift compile du code pour chaque plan d’exécution de requête, ce qui ajoute un surcoût important à la première exécution d’une requête. Ce surcoût peut se justifier lorsque les modèles de requêtes sont prévisibles et que les plans d’exécution compilés peuvent être stockés dans un cache de requêtes. Cela pose toutefois des difficultés pour les applications interactives dont les requêtes varient. Même lorsque Redshift est capable d’exploiter ce cache de compilation du code, ClickHouse reste plus rapide sur la plupart des requêtes. Voir “ClickBench”.
- Redshift limite la concurrence à 50 sur l’ensemble des files d’attente, ce qui, bien que suffisant pour la BI, le rend inadapté aux applications analytiques à forte concurrence.
| Avantage | Description |
|---|---|
| Latences de requête plus faibles | ClickHouse offre des latences de requête plus faibles, y compris pour des modèles de requêtes variés, en situation de forte concurrence et avec des insertions en streaming. Même lorsqu’une requête ne bénéficie pas du cache — ce qui est inévitable dans les usages analytiques interactifs orientés utilisateur — ClickHouse peut malgré tout la traiter rapidement. |
| Limites de requêtes concurrentes plus élevées | ClickHouse fixe des limites bien plus élevées pour les requêtes concurrentes, ce qui est essentiel pour les applications en temps réel. Dans ClickHouse, en autogéré comme dans ClickHouse Cloud, vous pouvez augmenter vos ressources de calcul afin d’atteindre le niveau de concurrence nécessaire à chaque service de votre application. Le niveau de concurrence autorisé pour les requêtes est configurable dans ClickHouse, et ClickHouse Cloud utilise par défaut une valeur de 1000. |
| Compression des données supérieure | ClickHouse offre une meilleure compression des données, ce qui vous permet de réduire votre volume total de stockage (et donc les coûts), ou de conserver davantage de données à coût égal et d’en tirer davantage d’insights en temps réel. Voir « ClickHouse vs Redshift Storage Efficiency » ci-dessous. |