Surveiller votre déploiement ClickHouse Cloud

Vue d’ensemble

Ce guide fournit aux équipes d’entreprise des informations sur les capacités de monitoring et d’observabilité pour les déploiements de production de ClickHouse Cloud. Les clients Enterprise demandent fréquemment quelles sont les fonctionnalités de monitoring disponibles prêtes à l’emploi, comment la plateforme s’intègre aux stacks d’observabilité existantes, y compris avec des outils comme Datadog et AWS CloudWatch, et comment le monitoring de ClickHouse se compare à celui des déploiements auto-hébergés. Les utilisateurs peuvent utiliser les méthodes suivantes pour surveiller leur déploiement ClickHouse :

Section	Description	Réveille les services inactifs ?	Configuration requise
Tableaux de bord de la Cloud Console	Monitoring au quotidien à l’aide de tableaux de bord intégrés pour l’état de santé du service, l’utilisation des ressources et les performances des requêtes	Non	Aucune
Notifications	Alertes pour les événements de scaling, les erreurs, les mutations et la facturation	Non	Aucune (personnalisable)
Point de terminaison Prometheus	Exportez les métriques vers Grafana, Datadog ou d’autres outils compatibles Prometheus	Non	Clé API + configuration du scraper
Requêtes sur les tables système	Débogage approfondi et analyse personnalisée via des requêtes SQL directes sur les tables `system`	Oui	Requêtes SQL
Intégrations communautaires et partenaires	Intégration de l’agent Datadog, outils de monitoring communautaires et API Billing & Usage	Variable	Spécifique à l’outil
Référence du tableau de bord avancé	Référence détaillée pour chaque visualisation du tableau de bord avancé, y compris des exemples de dépannage	Non	Aucune

Quick start

Ouvrez la console ClickHouse Cloud dans l’onglet Monitoring. Ce blog présente les points de vigilance les plus courants au moment de la prise en main. Pour la plupart des utilisateurs, les tableaux de bord de la Cloud Console offrent tout le nécessaire pour surveiller l’état du service, l’utilisation des ressources et les performances des requêtes, sans configuration. Si vous devez intégrer une stack de monitoring externe, commencez par le metrics endpoint compatible Prometheus.

Considérations relatives à l’impact sur le système

Les approches ci-dessus reposent soit sur des endpoints Prometheus, soit sur une gestion par ClickHouse Cloud, soit sur l’interrogation directe des tables système. Cette dernière option implique d’interroger le service ClickHouse en production, ce qui ajoute une charge de requêtes au système observé et empêche les instances ClickHouse Cloud de passer en veille, avec un impact potentiel sur les coûts. De plus, si le système de production tombe en panne, la supervision peut elle aussi être affectée, puisque les deux sont couplés. L’interrogation directe des tables système est très efficace pour l’introspection approfondie et le débogage, mais elle convient moins à une supervision de production en temps réel. Les tableaux de bord de la Cloud Console et le point de terminaison Prometheus utilisent tous deux des métriques déjà collectées qui ne réveillent pas les services en veille, ce qui les rend mieux adaptés à une supervision continue en production. Tenez compte de ces compromis entre capacités d’analyse détaillée du système et surcharge opérationnelle.

​Vue d’ensemble

​Quick start

​Considérations relatives à l’impact sur le système

Vue d’ensemble

Quick start

Considérations relatives à l’impact sur le système