Passer au contenu principal

Vue d’ensemble

Ce guide fournit aux équipes d’entreprise des informations sur les capacités de monitoring et d’observabilité pour les déploiements de production de ClickHouse Cloud. Les clients Enterprise demandent fréquemment quelles sont les fonctionnalités de monitoring disponibles prêtes à l’emploi, comment la plateforme s’intègre aux stacks d’observabilité existantes, y compris avec des outils comme Datadog et AWS CloudWatch, et comment le monitoring de ClickHouse se compare à celui des déploiements auto-hébergés. Les utilisateurs peuvent utiliser les méthodes suivantes pour surveiller leur déploiement ClickHouse :
SectionDescriptionRéveille les services inactifs ?Configuration requise
Tableaux de bord de la Cloud ConsoleMonitoring au quotidien à l’aide de tableaux de bord intégrés pour l’état de santé du service, l’utilisation des ressources et les performances des requêtesNonAucune
NotificationsAlertes pour les événements de scaling, les erreurs, les mutations et la facturationNonAucune (personnalisable)
Point de terminaison PrometheusExportez les métriques vers Grafana, Datadog ou d’autres outils compatibles PrometheusNonClé API + configuration du scraper
Requêtes sur les tables systèmeDébogage approfondi et analyse personnalisée via des requêtes SQL directes sur les tables systemOuiRequêtes SQL
Intégrations communautaires et partenairesIntégration de l’agent Datadog, outils de monitoring communautaires et API Billing & UsageVariableSpécifique à l’outil
Référence du tableau de bord avancéRéférence détaillée pour chaque visualisation du tableau de bord avancé, y compris des exemples de dépannageNonAucune

Quick start

Ouvrez la console ClickHouse Cloud dans l’onglet Monitoring. Ce blog présente les points de vigilance les plus courants au moment de la prise en main. Pour la plupart des utilisateurs, les tableaux de bord de la Cloud Console offrent tout le nécessaire pour surveiller l’état du service, l’utilisation des ressources et les performances des requêtes, sans configuration. Si vous devez intégrer une stack de monitoring externe, commencez par le metrics endpoint compatible Prometheus.

Considérations relatives à l’impact sur le système

Les approches ci-dessus reposent soit sur des endpoints Prometheus, soit sur une gestion par ClickHouse Cloud, soit sur l’interrogation directe des tables système. Cette dernière option implique d’interroger le service ClickHouse en production, ce qui ajoute une charge de requêtes au système observé et empêche les instances ClickHouse Cloud de passer en veille, avec un impact potentiel sur les coûts. De plus, si le système de production tombe en panne, la supervision peut elle aussi être affectée, puisque les deux sont couplés. L’interrogation directe des tables système est très efficace pour l’introspection approfondie et le débogage, mais elle convient moins à une supervision de production en temps réel. Les tableaux de bord de la Cloud Console et le point de terminaison Prometheus utilisent tous deux des métriques déjà collectées qui ne réveillent pas les services en veille, ce qui les rend mieux adaptés à une supervision continue en production. Tenez compte de ces compromis entre capacités d’analyse détaillée du système et surcharge opérationnelle.
Dernière modification le 29 juin 2026