Interroger dans ClickHouse CloudLes données de cette table système sont stockées localement sur chaque nœud de ClickHouse Cloud. Pour obtenir une vue complète de l’ensemble des données, il faut donc utiliser la fonction
clusterAllReplicas. Consultez cette page pour plus de détails.Description
Colonnes
metric(String) — Nom de la métrique.value(Float64) — Valeur de la métrique.description(String - Description de la métrique)
Exemple
Descriptions des métriques
utils/generate-async-metrics-docs. La référence qui fait foi est la chaîne littérale placée à côté de chaque appel d’enregistrement de métrique dans src/Common/AsynchronousMetrics.cpp, src/Interpreters/ServerAsynchronousMetrics.cpp et src/Coordination/KeeperAsynchronousMetrics.cpp. Les noms de métriques qui incluent un suffixe variable (par disque, par CPU, par interface, …) sont représentés par l’espace réservé *name* ; le serveur en cours d’exécution les expose avec le suffixe concret substitué.
AsynchronousHeavyMetricsCalculationTimeSpent
AsynchronousHeavyMetricsUpdateInterval
AsynchronousMetricsCalculationTimeSpent
AsynchronousMetricsUpdateInterval
AsyncLoggingmetric_firstQueueSize
BlockActiveTime_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
BlockActiveTimePerOp_name
BlockActiveTime, mais la valeur est divisée par le nombre d’opérations d’E/S afin de calculer le temps par opération.
BlockDiscardBytes_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardMerges_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardOps_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardTime_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
BlockInFlightOps_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
BlockQueueTime_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
BlockQueueTimePerOp_name
BlockQueueTime, mais la valeur est divisée par le nombre d’opérations d’E/S afin de calculer le temps par opération.
BlockReadBytes_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadMerges_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadOps_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadTime_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteBytes_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteMerges_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteOps_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteTime_name
/sys/block. Voir https://www.kernel.org/doc/Documentation/block/stat.txt
CGroupMaxCPU
Mémoire totale du CGroup
CGroupMemoryUsed
CGroupMemoryUsedWithoutPageCache
CGroupSystemTime
CGroupSystemTimeNormalized
CGroupSystemTime, mais divisée par le nombre de cœurs de CPU disponibles afin d’être mesurée dans l’intervalle [0..1], quel que soit le nombre de cœurs. Cela permet de calculer la moyenne des valeurs de cette métrique sur plusieurs serveurs d’un cluster, même si le nombre de cœurs n’est pas uniforme, tout en obtenant une métrique moyenne d’utilisation des ressources. S’il est spécifié, le quota CPU du cgroup divisé par sa période peut être utilisé à la place du nombre réel de cœurs de CPU, et dans ce cas, la valeur de cette métrique peut dépasser 1 à certains moments.
CGroupUserTime
CGroupUserTimeNormalized
CGroupUserTime, mais divisée par le nombre de cœurs CPU disponibles afin d’être mesurée dans l’intervalle [0..1], quel que soit le nombre de cœurs. Cela vous permet de calculer la moyenne des valeurs de cette métrique sur plusieurs serveurs d’un cluster, même si le nombre de cœurs n’est pas uniforme, et d’obtenir malgré tout la métrique moyenne d’utilisation des ressources. Si elle est spécifiée, le quota CPU du cgroup divisé par sa période peut être utilisé à la place du nombre réel de cœurs CPU, et dans ce cas, la valeur de cette métrique peut dépasser 1 à certains moments.
CPUFrequencyMHz_core_id
DictionaryMaxUpdateDelay
DictionaryTotalFailedUpdates
DiskAvailable_name
DiskGetObjectThrottlerAvailable_name
DiskGetObjectThrottlerRPS_name
DiskPutObjectThrottlerAvailable_name
DiskPutObjectThrottlerRPS_name
DiskTotal_name
DiskUnreserved_name
DiskUsed_name
EDACi_Correctable
/sys/devices/system/edac/mc/
EDACi_Uncorrectable
/sys/devices/system/edac/mc/
Octets du cache du système de fichiers
cache. Ce cache est stocké sur disque.
FilesystemCacheCapacity
cache. Ce cache est stocké sur disque.
FilesystemCacheFiles
cache. Ce cache est stocké sur disque.
FilesystemLogsPathAvailableBytes
FilesystemLogsPathAvailableINodes
FilesystemLogsPathTotalBytes
FilesystemLogsPathTotalINodes
FilesystemLogsPathUsedBytes
FilesystemLogsPathUsedINodes
FilesystemMainPathAvailableBytes
FilesystemMainPathAvailableINodes
FilesystemMainPathTotalBytes
FilesystemMainPathTotalINodes
FilesystemMainPathUsedBytes
Inodes utilisés du chemin principal du système de fichiers
GRPCRejectedConnections
GRPCThreads
HashTableStatsCacheEntries
HashTableStatsCacheHits
HashTableStatsCacheMisses
HTTPConnectionPoolgroup_nameTCPRcvBufTotalBytes
HTTPConnectionPoolgroup_nameTCPSndBufTotalBytes
HTTPRejectedConnections
HTTPSecureRejectedConnections
HTTPSecureThreads
HTTPThreads
InterserverRejectedConnections
InterserverSecureRejectedConnections
InterserverSecureThreads
InterserverThreads
jemalloc.active
jemalloc.allocated
jemalloc.arenas.all.dirty_purged
jemalloc.arenas.all.muzzy_purged
jemalloc.arenas.all.pactive
jemalloc.arenas.all.pdirty
jemalloc.arenas.all.pmuzzy
jemalloc.arenas.dirty_decay_ms
jemalloc.background_thread.num_runs
jemalloc.background_thread.num_threads
jemalloc.background_thread.run_intervals
jemalloc.cache_arena.pactive
jemalloc.cache_arena.pdirty
jemalloc.epoch
jemalloc.
jemalloc.mapped
jemalloc.mergetree_arena.active_bytes
NamesAndTypesList, SerializationInfoByName, la map serializations, column_name_to_position, l’arbre MergeTreeDataPartChecksums, les délégués Poco::LRUCache<String, ColumnSize> à l’intérieur de chaque IMergeTreeDataPart, les maps ColumnSize/IndexSize par part, MinMaxIndex, VersionMetadataOnDisk et l’objet MergeTreeDataPart{Compact,Wide} lui-même) ainsi que les métadonnées par table (clones de StorageInMemoryMetadata / ColumnsDescription / VirtualColumnsDescription initialisés par setProperties, l’agrégation serialization_hints et le columns_descriptions_cache). Les parts actives et les parts obsolètes en attente de nettoyage y contribuent toutes deux. Séparée de l’arène de cache et de l’arène JIT. Les colonnes par part system.parts.primary_key_bytes_in_memory[_allocated] et system.parts.index_granularity_bytes_in_memory[_allocated] sont des sous-ensembles de cette métrique (lorsque leurs valeurs sont non nulles — elles peuvent aussi se trouver à la place dans PrimaryIndexCacheBytes, qui appartient à l’arène de cache et n’est pas compté ici).
jemalloc.mergetree_arena.dirty_bytes
jemalloc.mergetree_arena.pactive
jemalloc.mergetree_arena.pdirty
jemalloc.metadata
jemalloc.metadata_thp
jemalloc.prof.active
jemalloc.prof.lg_sample
jemalloc.prof.thread_active_init
jemalloc.resident
jemalloc.retained
Jitter
KeeperApproximateDataSize
KeeperAvgLatency
KeeperCommitLogsCacheEntries
KeeperCommitLogsCacheSize
KeeperEphemeralsCount
KeeperFollowers
KeeperIsExceedingMemorySoftLimitHit
KeeperIsFollower
KeeperIsLeader
KeeperIsObserver
KeeperIsStandalone
KeeperKeyArenaSize
KeeperLastCommittedLogIdx
KeeperLastLogIdx
KeeperLastLogTerm
KeeperLastSnapshotIdx
KeeperLatestLogsCacheEntries
KeeperLatestLogsCacheSize
KeeperLatestSnapshotSize
KeeperMaxFileDescriptorCount
KeeperMaxLatency
KeeperMinLatency
KeeperOpenFileDescriptorCount
KeeperPacketsReceived
KeeperPacketsSent
KeeperPathsWatched
KeeperSessionWithWatches
KeeperSyncedFollowers
KeeperTargetCommitLogIdx
KeeperTCPRejectedConnections
KeeperTCPSecureRejectedConnections
KeeperTCPSecureThreads
KeeperTCPThreads
KeeperWatchCount
KeeperZnodeCount
KeeperZxid
LoadAverage1
LoadAverage15
LoadAverage5
LongestRunningMerge
MaxPartCountForPartition
MemoryCode
MemoryDataAndStack
mmap. Cette métrique n’existe que par souci d’exhaustivité. Je recommande d’utiliser la métrique MemoryResident pour la surveillance.
MemoryResident
MemoryResidentMax
MemoryResidentWithoutPageCache
MemoryVirtual
MySQLRejectedConnections
MySQLThreads
NetworkReceiveBytes_interface_name
NetworkReceiveDrop_interface_name
NetworkReceiveErrors_interface_name
NetworkReceivePackets_interface_name
NetworkSendBytes_interface_name
NetworkSendDrop_interface_name
NetworkSendErrors_interface_name
NetworkSendPackets_interface_name
NetworkTCPReceiveQueue
NetworkTCPSocketRemoteAddresses
NetworkTCPSockets
NetworkTCPSockets_description
NetworkTCPTransmitQueue
NetworkTCPUnrecoveredRetransmits
NumberOfDatabases
NumberOfDetachedByUserParts
ALTER TABLE DETACH (par opposition aux parts inattendues, endommagées ou ignorées). Le serveur ne tient pas compte des parts détachées et elles peuvent être supprimées.
NumberOfDetachedParts
ALTER TABLE DETACH, ou par le serveur lui-même si la part est corrompue, inattendue ou devenue inutile. Le serveur ignore les parts détachées, qui peuvent donc être supprimées.
NumberOfPendingMutations
NombreDeMutationsEnAttenteAu-delàDeLaDuréeDExécution
NumberOfTables
Lazy, MySQL, PostgreSQL, SQlite.
NumberOfTablesSystem
OSContextSwitches
OSCPUOverload
OSGuestNiceTimecpu_suffix
man procfs). Il s’agit d’une métrique à l’échelle du système : elle inclut tous les processus de la machine hôte, et pas seulement clickhouse-server. Cette métrique n’est pas pertinente pour ClickHouse, mais elle existe néanmoins par souci d’exhaustivité. La valeur pour un seul cœur CPU se situe dans l’intervalle [0..1]. La valeur pour l’ensemble des cœurs CPU est calculée comme la somme de leurs valeurs [0..num cores].
OSGuestNiceTimeNormalized
OSGuestNiceTime, mais divisée par le nombre de cœurs CPU afin d’être mesurée dans l’intervalle [0..1], quel que soit le nombre de cœurs. Cela vous permet de calculer la moyenne des valeurs de cette métrique sur plusieurs serveurs d’un cluster, même si le nombre de cœurs varie, tout en obtenant une métrique moyenne d’utilisation des ressources. Si elle est définie, le quota CPU du cgroup divisé par sa période peut être utilisé à la place du nombre réel de cœurs CPU ; dans ce cas, la valeur de cette métrique peut dépasser 1 à certains moments.
OSGuestTimecpu_suffix
man procfs). Il s’agit d’une métrique système globale : elle inclut tous les processus de la machine hôte, et pas seulement clickhouse-server. Cette métrique n’est pas pertinente pour ClickHouse, mais elle existe tout de même par souci d’exhaustivité. La valeur pour un seul cœur de CPU se situe dans l’intervalle [0..1]. La valeur pour l’ensemble des cœurs de CPU est calculée comme la somme de leurs valeurs [0..num cores].
OSGuestTimeNormalized
OSGuestTime, mais divisée par le nombre de cœurs CPU afin d’être ramenée à l’intervalle [0..1], quel que soit le nombre de cœurs. Cela permet de moyenner les valeurs de cette métrique sur plusieurs serveurs d’un cluster, même si le nombre de cœurs n’est pas uniforme, tout en conservant une métrique moyenne d’utilisation des ressources. Si elle est définie, le quota CPU du cgroup divisé par sa période peut être utilisé à la place du nombre réel de cœurs CPU ; dans ce cas, la valeur de cette métrique peut dépasser 1 à certains moments.
OSIdleTimecpu_suffix
OSIdleTimeNormalized
OSIdleTime, mais divisée par le nombre de cœurs de CPU afin d’être ramenée à l’intervalle [0..1], quel que soit le nombre de cœurs. Cela permet de calculer la moyenne des valeurs de cette métrique sur plusieurs serveurs d’un cluster, même si le nombre de cœurs n’est pas uniforme, tout en obtenant une métrique moyenne d’utilisation des ressources. Si elle est spécifiée, la Cgroup CPU quota divisée par sa période peut être utilisée à la place du nombre réel de cœurs de CPU ; dans ce cas, la valeur de cette métrique peut dépasser 1 à certains moments.
OSInterrupts
OSIOWaitTimecpu_suffix
OSIOWaitTimeNormalized
OSIOWaitTime, mais divisée par le nombre de cœurs de processeur afin d’être exprimée dans l’intervalle [0..1], quel que soit le nombre de cœurs. Cela permet de calculer la moyenne des valeurs de cette métrique sur plusieurs serveurs d’un cluster, même si le nombre de cœurs n’est pas uniforme, tout en obtenant une métrique moyenne d’utilisation des ressources. Si elle est définie, la Cgroup CPU quota divisée par sa période peut être utilisée à la place du nombre réel de cœurs de processeur ; dans ce cas, la valeur de cette métrique peut dépasser 1 à certains moments.
OSIrqTimecpu_suffix
OSIrqTimeNormalized
OSIrqTime, mais divisée par le nombre de cœurs CPU afin d’être exprimée dans l’intervalle [0..1], quel que soit le nombre de cœurs. Cela permet de moyenner les valeurs de cette métrique sur plusieurs serveurs d’un cluster, même si le nombre de cœurs varie, tout en obtenant une métrique moyenne d’utilisation des ressources. Si elle est définie, la quota CPU du cgroup divisée par sa période peut être utilisée à la place du nombre réel de cœurs CPU. Dans ce cas, la valeur de cette métrique peut dépasser 1 à certains moments.
Mémoire OS disponible
OSMemoryFreePlusCached. Il s’agit d’une métrique à l’échelle du système : elle inclut tous les processus sur la machine hôte, et pas seulement clickhouse-server.
OSMemoryBuffers
OSMemoryCached
OSMemoryFreePlusCached
OSMemoryAvailable. Il s’agit d’une métrique à l’échelle du système : elle inclut tous les processus de la machine hôte, et pas seulement clickhouse-server.
OSMemoryFreeWithoutCached
OSMemoryAvailable. Par commodité, nous fournissons également la métrique OSMemoryFreePlusCached, qui devrait être assez proche de OSMemoryAvailable. Voir aussi https://www.linuxatemyram.com/. Il s’agit d’une métrique à l’échelle du système : elle inclut tous les processus sur la machine hôte, et pas seulement clickhouse-server.
OSMemorySwapCached
OSMemoryTotal
OSNiceTimecpu_suffix
OSNiceTimeNormalized
OSNiceTime, mais divisée par le nombre de cœurs CPU afin d’être mesurée dans l’intervalle [0..1], quel que soit le nombre de cœurs. Cela permet de calculer la moyenne des valeurs de cette métrique sur plusieurs serveurs d’un cluster, même si le nombre de cœurs n’est pas uniforme, tout en obtenant une métrique moyenne d’utilisation des ressources. Si elle est spécifiée, la Cgroup CPU quota divisée par sa période peut être utilisée à la place du nombre réel de cœurs CPU ; dans ce cas, la valeur de cette métrique peut dépasser 1 à certains moments.
OSOpenFiles
OSProcessesBlocked
man procfs). Il s’agit d’une métrique à l’échelle du système : elle inclut tous les processus de la machine hôte, et pas seulement clickhouse-server.
OSProcessesCreated
clickhouse-server.
ProcessusOSEnCours
OSSoftIrqTimecpu_suffix
OSSoftIrqTimeNormalized
OSSoftIrqTime, mais divisée par le nombre de cœurs du CPU afin d’être comprise dans l’intervalle [0..1], quel que soit le nombre de cœurs. Cela permet de calculer la moyenne des valeurs de cette métrique sur plusieurs serveurs d’un cluster, même si le nombre de cœurs n’est pas uniforme, tout en obtenant une métrique moyenne d’utilisation des ressources. Si elle est définie, le quota CPU du cgroup divisé par sa période peut être utilisé à la place du nombre réel de cœurs du CPU ; dans ce cas, la valeur de cette métrique peut dépasser 1 à certains moments.
OSStealTimecpu_suffix
OSStealTimeNormalized
OSStealTime, mais divisée par le nombre de cœurs CPU afin d’être comprise dans l’intervalle [0..1], quel que soit le nombre de cœurs. Cela permet de calculer la moyenne des valeurs de cette métrique sur plusieurs serveurs d’un cluster, même si le nombre de cœurs n’est pas uniforme, tout en obtenant une métrique moyenne d’utilisation des ressources. Si elle est spécifiée, le quota CPU du cgroup divisé par sa période peut être utilisé à la place du nombre réel de cœurs CPU ; dans ce cas, la valeur de cette métrique peut dépasser 1 à certains moments.
OSSystemTimecpu_suffix
OSSystemTimeNormalized
OSSystemTime, mais divisée par le nombre de cœurs CPU afin d’être exprimée dans l’intervalle [0..1], quel que soit le nombre de cœurs. Cela permet de calculer la moyenne des valeurs de cette métrique sur plusieurs serveurs d’un cluster, même si le nombre de cœurs n’est pas uniforme, tout en obtenant une métrique moyenne d’utilisation des ressources. Si elle est définie, la Cgroup CPU quota divisée par sa période peut être utilisée à la place du nombre réel de cœurs CPU ; dans ce cas, la valeur de cette métrique peut dépasser 1 à certains moments.
OSThreadsRunnable
OSThreadsTotal
OSUptime
OSUserTimecpu_suffix
OSUserTimeNormalized
OSUserTime, mais divisée par le nombre de cœurs CPU afin d’être comprise dans l’intervalle [0..1], quel que soit le nombre de cœurs. Cela vous permet de calculer la moyenne des valeurs de cette métrique sur plusieurs serveurs d’un cluster, même si le nombre de cœurs n’est pas uniforme, et d’obtenir malgré tout une métrique moyenne d’utilisation des ressources. Si elle est définie, la Cgroup CPU quota divisée par sa période peut être utilisée à la place du nombre réel de cœurs CPU. Dans ce cas, la valeur de cette métrique peut dépasser 1 à certains moments.
PageCacheMaxBytes
PostgreSQLRejectedConnections
PostgreSQLThreads
Limite de la file d’attente des signaux
ProcessSignalQueueSize
PrometheusRejectedConnections
PrometheusThreads
PSI_type_stall_type
QueriesMemoryUsage
Utilisation mémoire maximale des requêtes
ProcessList, en octets. Le pic de chaque utilisateur correspond au niveau maximal atteint par le memory tracker de cet utilisateur, qui est réinitialisé lorsque l’utilisateur n’a plus de requêtes en cours d’exécution. Il s’agit donc d’une agrégation des pics par utilisateur actuellement suivis, et non d’un pic unique à l’échelle du serveur pour l’ensemble des requêtes depuis le démarrage.
ReplicasMaxAbsoluteDelay
ReplicasMaxInsertsInQueue
ReplicasMaxMergesInQueue
ReplicasMaxQueueSize
ReplicasMaxRelativeDelay
ReplicasSumInsertsInQueue
ReplicasSumMergesInQueue
ReplicasSumQueueSize
TCPRejectedConnections
TCPSecureRejectedConnections
TCPSecureThreads
TCPThreads
Températurei
/sys/class/thermal
Temperature_hwmon_name
/sys/class/hwmon
Temperature_hwmon_name_sensor_name
/sys/class/hwmon
TotalBytesOfMergeTreeTables
TotalBytesOfMergeTreeTablesSystem
TotalIndexGranularityBytesInMemory
TotalIndexGranularityBytesInMemoryAllocated
Nombre total de parts de données des tables MergeTree
TotalPartsOfMergeTreeTablesSystem
TotalPrimaryKeyBytesInMemory
TotalPrimaryKeyBytesInMemoryAllocated
TotalProjectionIndexGranularityBytesInMemory
TotalProjectionIndexGranularityBytesInMemoryAllocated
TotalProjectionPrimaryKeyBytesInMemory
TotalProjectionPrimaryKeyBytesInMemoryAllocated
Nombre total de lignes des tables MergeTree
TotalRowsOfMergeTreeTablesSystem
TotalUncompressedBytesOfMergeTreeTables
total_bytes_uncompressed de system.tables, et elle n’inclut pas les fichiers stockés sans compression, tels que les marks et les index de clé primaire.
TotalUncompressedBytesOfMergeTreeTablesSystem
total_bytes_uncompressed de system.tables et n’inclut pas les fichiers stockés sans compression, tels que les marks et les index de clé primaire.
TrackedMemory
Temps de fonctionnement
VMMaxMapCount
VMNumMaps
ZooKeeperClientLastZXIDSeen
- Monitoring — Concepts de base de la supervision de ClickHouse.
- system.metrics — Contient des métriques calculées instantanément.
- system.events — Contient les événements qui se sont produits.
- system.metric_log — Contient l’historique des valeurs de métriques des tables
system.metricsetsystem.events.