Passer au contenu principal
Les services ClickHouse Cloud incluent des composants de monitoring prêts à l’emploi, qui mettent à la disposition des utilisateurs des tableaux de bord et des notifications. Par défaut, tous les utilisateurs de la Cloud Console peuvent accéder à ces tableaux de bord.

Tableaux de bord

État du service

Le tableau de bord Service Health permet de surveiller l’état global d’un service. ClickHouse Cloud collecte et stocke les métriques affichées sur ce tableau de bord à partir des tables système afin qu’elles puissent être consultées lorsqu’un service est mis en veille.

Utilisation des ressources

Le tableau de bord Infrastructure fournit une vue détaillée des ressources utilisées par le processus ClickHouse. ClickHouse Cloud collecte et stocke les métriques affichées sur ce tableau de bord à partir des tables système, afin qu’elles puissent être consultées lorsqu’un service est mis en veille.

Mémoire et CPU

Les graphiques CPU alloué et Mémoire allouée affichent le total des ressources de calcul disponibles pour chaque réplique de votre service. Ces allocations peuvent être modifiées à l’aide des fonctionnalités de mise à l’échelle de ClickHouse Cloud. Les graphiques Utilisation de la mémoire et Utilisation du CPU estiment la quantité de CPU et de mémoire réellement utilisée par les processus ClickHouse dans chaque réplique, y compris les requêtes ainsi que les processus d’arrière-plan comme les fusions.
Dégradation des performancesSi l’utilisation de la mémoire ou du CPU s’approche des ressources mémoire ou CPU allouées, vous pouvez commencer à observer une dégradation des performances. Pour y remédier, nous recommandons de :
  • Optimiser vos requêtes
  • Modifier le partitionnement de vos moteurs de table
  • Ajouter davantage de ressources de calcul à votre service à l’aide de la mise à l’échelle
Voici les métriques correspondantes de la table système affichées dans ces graphiques :
GraphiqueNom de métrique correspondantAgrégationNotes
Mémoire allouéeCGroupMemoryTotalMax
CPU allouéCGroupMaxCPUMax
Mémoire utiliséeMemoryResidentMax
CPU utiliséMétrique système du CPUMaxClickHouseServer_UsageCores via l’endpoint Prometheus

Transfert de données

Les graphiques affichent les flux de données entrants et sortants de ClickHouse Cloud. Pour en savoir plus, consultez le transfert de données réseau.

Tableau de bord avancé

Ce tableau de bord est une version modifiée du tableau de bord d’observabilité avancé intégré, où chaque série représente les métriques par réplique. Ce tableau de bord peut être utile pour surveiller et résoudre les problèmes spécifiques à ClickHouse.
ClickHouse Cloud collecte et stocke les métriques affichées sur ce tableau de bord à partir des tables système afin qu’elles puissent être consultées même lorsqu’un service est inactif. L’accès à ces métriques n’exécute pas de query sur le service sous-jacent et ne réactive pas les services inactifs.
Le tableau ci-dessous associe chaque graphique du tableau de bord avancé à la métrique ClickHouse correspondante, à la table système source et au type d’agrégation correspondant :
GraphiqueNom de la métrique ClickHouse correspondanteTable systèmeType d’agrégation
Requêtes/sProfileEvent_Querymetric_logSomme / bucketSizeSeconds
Requêtes en coursCurrentMetric_Querymetric_logMoy.
Fusions en coursCurrentMetric_Mergemetric_logMoy.
Octets sélectionnés/sProfileEvent_SelectedBytesmetric_logSomme / bucketSizeSeconds
Attente d’E/SProfileEvent_OSIOWaitMicrosecondsmetric_logSomme / bucketSizeSeconds
Attente de lecture S3ProfileEvent_ReadBufferFromS3Microsecondsmetric_logSomme / bucketSizeSeconds
Erreurs de lecture S3/sProfileEvent_ReadBufferFromS3RequestsErrorsmetric_logSomme / bucketSizeSeconds
Attente CPUProfileEvent_OSCPUWaitMicrosecondsmetric_logSomme / bucketSizeSeconds
Utilisation CPU de l’OS (userspace, normalized)OSUserTimeNormalizedasynchronous_metric_log
Utilisation CPU de l’OS (kernel, normalized)OSSystemTimeNormalizedasynchronous_metric_log
Lecture depuis le diskProfileEvent_OSReadBytesmetric_logSomme / bucketSizeSeconds
Lecture depuis le filesystemProfileEvent_OSReadCharsmetric_logSomme / bucketSizeSeconds
Memory (suivie, octets)CurrentMetric_MemoryTrackingmetric_log
Nombre total de parts MergeTreeTotalPartsOfMergeTreeTablesasynchronous_metric_log
Nombre maximal de parts par partitionMaxPartCountForPartitionasynchronous_metric_log
Lecture depuis S3ProfileEvent_ReadBufferFromS3Bytesmetric_logSomme / bucketSizeSeconds
Taille du filesystem cacheCurrentMetric_FilesystemCacheSizemetric_log
Requêtes d’écriture Disk S3/sProfileEvent_DiskS3PutObject + ProfileEvent_DiskS3UploadPart + ProfileEvent_DiskS3CreateMultipartUpload + ProfileEvent_DiskS3CompleteMultipartUploadmetric_logSomme / bucketSizeSeconds
Requêtes de lecture Disk S3/sProfileEvent_DiskS3GetObject + ProfileEvent_DiskS3HeadObject + ProfileEvent_DiskS3ListObjectsmetric_logSomme / bucketSizeSeconds
Taux de réussite du cache FSsum(ProfileEvent_CachedReadBufferReadFromCacheBytes) / (sum(ProfileEvent_CachedReadBufferReadFromCacheBytes) + sum(ProfileEvent_CachedReadBufferReadFromSourceBytes))metric_log
Taux de réussite du page cachegreatest(0, (sum(ProfileEvent_OSReadChars) - sum(ProfileEvent_OSReadBytes)) / (sum(ProfileEvent_OSReadChars) + sum(ProfileEvent_ReadBufferFromS3Bytes)))metric_log
Octets reçus sur le réseau/sNetworkReceiveBytesasynchronous_metric_logSomme / bucketSizeSeconds
Octets envoyés sur le réseau/sNetworkSendBytesasynchronous_metric_logSomme / bucketSizeSeconds
Connexions TCP simultanéesCurrentMetric_TCPConnectionmetric_log
Connexions MySQL simultanéesCurrentMetric_MySQLConnectionmetric_log
Connexions HTTP simultanéesCurrentMetric_HTTPConnectionmetric_log
Pour des informations détaillées sur chaque visualisation et sur la façon de les utiliser pour le dépannage, consultez la documentation du tableau de bord avancé.

Query insights

La fonctionnalité Query Insights rend le journal des requêtes intégré de ClickHouse plus facile à utiliser grâce à diverses visualisations et tableaux. La table system.query_log de ClickHouse est une source d’informations essentielle pour l’optimisation des requêtes, le débogage, ainsi que la surveillance globale de l’état de santé et des performances du cluster. Après avoir sélectionné un service, l’élément de navigation Monitoring dans la barre latérale gauche se développe pour révéler un sous-élément Query insights :

Métriques principales

Les encadrés statistiques en haut représentent les métriques de base des requêtes sur la période sélectionnée. En dessous, des graphiques de séries temporelles montrent le volume de requêtes, la latence et le taux d’erreur, ventilés par type de requête (select, insert, other). Le graphique de latence peut être ajusté pour afficher les latences p50, p90 et p99 :

Requêtes récentes

Un tableau affiche les entrées du journal des requêtes regroupées par hash de requête normalisée et par utilisateur sur la plage temporelle sélectionnée. Les requêtes récentes peuvent être filtrées et triées selon n’importe quel champ disponible, et le tableau peut être configuré pour afficher ou masquer des champs supplémentaires, tels que les tables et les latences p90 et p99 :

Analyse détaillée des requêtes

La sélection d’une requête dans le tableau Recent queries ouvre un panneau latéral contenant des métriques et des informations propres à la requête sélectionnée : Toutes les métriques de l’onglet Query info sont des métriques agrégées, mais il est également possible d’afficher les métriques de chaque exécution en sélectionnant l’onglet Query history : Depuis ce panneau, les éléments Settings et Profile Events de chaque exécution de requête peuvent être développés pour afficher des informations supplémentaires.
  • Notifications — Configurez des alertes pour les événements de mise à l’échelle, les erreurs et la facturation
  • tableau de bord avancé — Référence détaillée pour chaque visualisation du tableau de bord
  • Interroger les tables système — Exécutez des requêtes custom SQL sur les tables système pour une introspection approfondie
  • endpoint Prometheus — Exportez les métriques vers Grafana, Datadog ou d’autres outils compatibles Prometheus
Dernière modification le 29 juin 2026