9.3.1.6. show health
A - Introduction
La commande `health` du sous-groupe `show` permet d’afficher des statistiques et des informations de santé du GCap.
B - Prérequis
Utilisateur : setup, gviewadm
Dépendances : N/A
C - Commande
`show health`
D - Procédure
L’invite de commande est affichée.
(gcap-cli)
Saisir la commande
show health
- ValiderLe système affiche les informations suivantes
les compteurs
`block`- Statistiques sur les stockages de masseles compteurs
`cpu_stats`- Statistiques sur le processeurles compteurs
`disks`- Statistiques d’occupation des points de montageles compteurs
`emergency`- Informations sur l’emergency mode du GCaples compteurs
`gcenter`- Informations sur le GCenter appairéles compteurs
`high_availability`- Informations sur la haute disponibilité (HA)les compteurs
`interfaces`- Statistiques sur les interfaces réseauxles compteurs
`loadavg`- Statistiques sur la charge moyenne du GCaples compteurs
`meminfo`- Statistiques sur la mémoire viveles compteurs
`numastat`- Statistiques sur les nœud NUMAles compteurs
`quotas`- Informations sur les quotasles compteurs
`sofnet`- Statistiques sur les paquets reçus en fonction des cœurs de processeursles compteurs
`suricata`- Informations sur Sigflow (monitoring-engine)les compteurs
`systemd`- Informations du système d’initialisation du systèmeles compteurs
`uptime`- Temps de disponibilitéles compteurs
`virtualmemory`- Information sur l’espace d’échange (swap)
E - Détails des compteurs `block` - Statistiques sur les stockages de masse
`sdN`- Statistiques du disque N où N est une lettre de l’alphabet`read_bytes`- Octets lus depuis le démarrage`written_bytes`- Octets écrits depuis le démarrage
Exemple :
{ "block": { "sda": { "read_bytes": 302867968, "written_bytes": 4837645312 }, "sdb": { "read_bytes": 3894272, "written_bytes": 4096 } }
F - Détails des compteurs `cpu_stats` - Statistiques sur le processeur
`cpus`- Statistiques d’utilisation des CPUs`cpu`- Statistiques d’utilisation globales des cœurs`cpuX`- Statistique du cœur CPU X`idle`- Temps écoulé à ne rien faire en millisecondes`iowait`- Temps écoulé à attendre des opérations disques en millisecondes`irq`- Temps écoulé sur les IRQ matériel`nice`- Temps écoulé en espace utilisateur sur des processus à priorité faible en millisecondes`softirq`- Temps écoulé sur les IRQ matériel en millisecondes`system`- Temps écoulé en espace noyau en millisecondes`user`- Temps écoulé en espace utilisateur en millisecondes`interrupts`- Nombre d’interruptions depuis le démarrage`processes_blocked`- Nombre de processus bloqués ou death`processes_running`- Nombre de processus en cours d’exécution
Exemple :
"cpu_stats": { "cpus": { "cpu": { "idle": 961816208, "iowait": 11419, "irq": 0, "nice": 0, "softirq": 397899, "system": 21788203, "user": 50806194 }, "cpu0": { "idle": 79960857, "iowait": 985, "irq": 0, "nice": 0, "softirq": 234748, "system": 1795880, "user": 4357374 }, "cpu1": { "idle": 80166571, "iowait": 951, "irq": 0, "nice": 0, "softirq": 88078, "system": 1830370, "user": 4138182 } }, "interrupts": 12942835029, "processes_blocked": 0, "processes_running": 1 }
G - Détails des compteurs `disks` - Statistiques d’occupation des points de montage
`/mountpoint/path`- Chemin du point de montage`block_free`- Nombre de blocks disponibles`block_total`- Nombre total de blocks`inode_free`- Nombre d’inodes restants`inode_total`- Nombre totale d’inodes
Exemple :
"disks": { "/": { "block_free": 247909, "block_total": 249830, "inode_free": 64258, "inode_total": 65536 }, "/data": { "block_free": 7150076, "block_total": 7161801, "inode_free": 1827417, "inode_total": 1827840 }, }
H - Détails des compteurs `emergency` - Informations sur l’emergency mode du GCap
`emergency_active`- État actif ou inactif de l’emergency mode
Exemple :
"emergency": { "emergency_active": false },
I - Détails des compteurs `gcenter` - Informations sur le GCenter appairé
`chronyc_sync`- État de la synchronisation NTP avec le GCenter`reachable`- GCenter joignable (true) ou non (false)
Exemple :
"gcenter": { "chronyc_sync": false, "reachable": false },
J - Détails des compteurs `high_availability` - Informations sur la haute disponibilité (HA)
`healthy`- État de santé de la HA`last_status`- Dernier état connu de la HA`last_transition`- Date du dernier changement d’état de la HA au format ISO8601`leader`- Vrai pour un GCap leader, faux pour un GCap follower`status`- État actif ou inactif (false) de la HA
Exemple :
"high_availability": { "healthy": false, "last_status": -1, "last_transition": "0001-01-01T00:00:00Z", "leader": false, "status": false },
K - Détails des compteurs `interfaces` - Statistiques sur les interfaces réseaux
`mon0`- Nom de l’interface réseau`rx_bytes`- Nombre d’octets reçus`rx_drop`- Nombre d’octets perdus en réception`rx_errs`- Nombre d’octets invalides en réception`rx_packets`- Nombre total de paquets reçus depuis cette interface`tx_bytes`- Nombre d’octets envoyés`tx_drop`- Nombre d’octets perdus en envoi`tx_errs`- Nombre d’octets invalides en envoi`tx_packets`- Nombre total de paquets envoyés depuis cette interface
Exemple :
"interfaces": { "mon0": { "rx_bytes": 0, "rx_drops": 0, "rx_errs": 0, "rx_packets": 0, "tx_bytes": 0, "tx_drops": 0, "tx_errs": 0, "tx_packets": 0 }, "tunnel": { "rx_bytes": 138433006, "rx_drops": 82901, "rx_errs": 0, "rx_packets": 2143236, "tx_bytes": 796294, "tx_drops": 0, "tx_errs": 0, "tx_packets": 3635 }, "management": { "rx_bytes": 137642525, "rx_drops": 82902, "rx_errs": 0, "rx_packets": 2135060, "tx_bytes": 0, "tx_drops": 0, "tx_errs": 0, "tx_packets": 0 } }
Note
`mon0`, `tunnel`, `management`).`management`.L - Détails des compteurs `loadavg` - Statistiques sur la charge moyenne du GCap
`active_processes`- Nombres de processus lancés`load_average_15_mins`- Charge moyenne sur les quinze dernières minutes`load_average_1_min`- Charge moyenne sur la dernière minute`load_average_5_mins`- Charge moyenne sur les cinq dernières minutes`running_processes`- Nombre de processus en cours d’exécution
Exemple :
"loadavg": { "active_processes": 561, "load_average_15_mins": 0.99, "load_average_1_min": 0.67, "load_average_5_mins": 1, "running_processes": 2 }
M - Détails des compteurs `meminfo` - Statistiques sur la mémoire vive
`available`- Mémoire physique totale en kilo-octets`buffers`- Mémoire utilisée par des opérations disques en kilo-octets`cached`- Mémoire utilisée par le cache en kilo-octets`dirty`- Mémoire utilisée par des opérations d’écritures en attente en kilo-octets`free`- Mémoire inutilisée en kilo-octets`hugepages_anonymous`- Nombre de huge pages transparentes anonymes utilisées`hugepages_free`- Nombre de huge pages transparentes disponibles`hugepages_reserved`- Nombre de huge pages transparentes réservées`hugepages_shmem`- Nombre de huge pages transparentes partagées`hugepages_surplus`- Nombre de huge pages transparentes en surplus`hugepages_total`- Nombre total de huge pages`kernel_stack`- Mémoire utilisée par les allocations de la pile du noyau en kilo-octets`page_tables`- Mémoire utilisée pour la gestion des pages en kilo-octets`s_reclaimable`- Mémoire de cache qui peut-être ré-alloué en cas de manque de mémoire en kilo-octets`shmem`- Mémoire utilisée par les pages partagées en kilo-octets`slab`- Mémoire utilisée par les structures de données du noyau en kilo-octets`swap_cached`- Mémoire utilisée par le cache du swap en kilo-octets`swap_free`- Mémoire disponible dans le swap en kilo-octets`swap_total`- Mémoire totale du swap en kilo-octets.`total`- Mémoire totale en kilo-octets`v_malloc_used`- Mémoire utilisée par les grandes zones de mémoire allouées par le noyauPour plus d’informations, se référer à cette documentation meminfoExemple :"meminfo": { "available": 13608896, "buffers": 380932, "cached": 1155824, "dirty": 28, "free": 13128080, "hugepages_anonymous": 423936, "hugepages_free": 0, "hugepages_reserved": 0, "hugepages_shmem": 0, "hugepages_surplus": 0, "hugepages_total": 0, "kernel_stack": 9152, "page_tables": 8400, "s_reclaimable": 43168, "shmem": 794564, "slab": 210008, "swap_cached": 0, "swap_free": 16777212, "swap_total": 16777212, "total": 15977468, "v_malloc_used": 66592 },
N - Détails des compteurs `numastat` - Statistiques sur les nœud NUMA
`nodes`- Liste des nœuds NUMA`nodeX`- Statistiques du nœud NUMA X`interleave_hit`- Mémoire entrelacée allouée avec succès dans ce nœud`local_node`- Mémoire allouée dans ce nœud alors qu’un processus fonctionnait dessus`numa_foreign`- Mémoire prévu pour ce nœud, mais actuellement allouée dans un nœud différent`numa_hit`- Mémoire allouée avec succès dans ce nœud comme prévu`numa_miss`- Mémoire allouée dans ce nœud en dépit des préférences de processus.Chaque numa_miss a un numa_foreign dans un autre nœud`other_node`- Mémoire allouée dans ce nœud alors qu’un processus fonctionnait dans un autre nœud
Exemple :
"numastat": {
"nodes": {
"node0": {
"interleave_hit": 3871,
"local_node": 4410557829,
"numa_foreign": 0,
"numa_hit": 4410454203,
"numa_miss": 0,
"other_node": 14170
},
"node1": {
"interleave_hit": 3869,
"local_node": 4224990850,
"numa_foreign": 0,
"numa_hit": 4224964539,
"numa_miss": 0,
"other_node": 21531
}
}
},
O - Détails des compteurs `quotas` - Statistiques sur les quotas par catégorie
`quotas`- Liste des quotas`by_gid`- Statistiques triés par groupe (identifiant gid)`by_prj`- Statistiques triés par projet (identifiant prj)`by_uid`- Statistiques triés par utilisateur (identifiant uid)
Dans chaque catégorie, les compteurs suivant sont affichés:
`block_grace`- Temps de grâce pour les blocks`block_hard_limit`- Limite matérielle des blocks.Définit une limite absolue pour l’utilisation de l’espace.L’utilisateur ne peut pas dépasser cette limite.Passée cette limite, l’écriture sur ce système de fichiers lui est interdite.`block_soft_limit`- Limite logicielle des blocksIndique la quantité maximale d’espace qu’un utilisateur peut occuper sur le système de fichiers.Si cette limite est atteinte, l’utilisateur reçoit des messages d’avertissement quant au dépassement du quota qui lui a été attribué.Si son utilisation est combinée avec les délais (ou grace period), lorsque l’utilisateur continue à dépasser la limite logicielle après que se soit écoulé le délai de grâce, alors il se retrouve dans le même cas que dans l’atteinte d’une limite dure.`block_used`- Nombre de blocks utilisés`file_grace`- Temps de grâce pour les fichiers`file_hard_limit`- Limite matérielle des fichiersDéfinit une limite absolue pour l’utilisation de l’espace.L’utilisateur ne peut pas dépasser cette limite.Passée cette limite, l’écriture sur ce système de fichiers lui est interdite.`file_soft_limit`- Limite logicielle des fichiersIndique la quantité maximale d’espace qu’un utilisateur peut occuper sur le système de fichiers.Si cette limite est atteinte, l’utilisateur reçoit des messages d’avertissement quant au dépassement du quota qui lui a été attribué.Si son utilisation est combinée avec les délais (ou grace period), lorsque l’utilisateur continue à dépasser la limite logicielle après que se soit écoulé le délai de grâce, alors il se retrouve dans le même cas que dans l’atteinte d’une limite dure.`file_used`- Nombre de fichiers utilisés
Exemple :
"quotas": {
"by_gid": {
"0": {
"block_grace": "0",
"block_hard_limit": "0",
"block_soft_limit": "0",
"block_used": "2148952",
"file_grace": "0",
"file_hard_limit": "0",
"file_soft_limit": "0",
"file_used": "177"
},
"10012": {
"block_grace": "0",
"block_hard_limit": "0",
"block_soft_limit": "0",
"block_used": "5216",
"file_grace": "0",
"file_hard_limit": "0",
"file_soft_limit": "0",
"file_used": "295"
},
}
},
"by_prj": {
"0": {
"block_grace": "0",
"block_hard_limit": "0",
"block_soft_limit": "0",
"block_used": "51600",
"file_grace": "0",
"file_hard_limit": "0",
"file_soft_limit": "0",
"file_used": "225"
},
"1": {
"block_grace": "0",
"block_hard_limit": "7980499",
"block_soft_limit": "7980499",
"block_used": "2101904",
"file_grace": "0",
"file_hard_limit": "1000",
"file_soft_limit": "1000",
"file_used": "43"
},
}
},
"by_uid": {
"0": {
"block_grace": "0",
"block_hard_limit": "0",
"block_soft_limit": "0",
"block_used": "2153356",
"file_grace": "0",
"file_hard_limit": "0",
"file_soft_limit": "0",
"file_used": "269"
},
"10012": {
"block_grace": "0",
"block_hard_limit": "0",
"block_soft_limit": "0",
"block_used": "1032",
"file_grace": "0",
"file_hard_limit": "0",
"file_soft_limit": "0",
"file_used": "258"
},
}
}
"10012": {
"block_grace": "0",
"block_hard_limit": "0",
"block_soft_limit": "0",
"block_used": "1032",
"file_grace": "0",
"file_hard_limit": "0",
"file_soft_limit": "0",
"file_used": "258"
},
P - Détails des compteurs `sofnet` - Statistiques sur les paquets reçus en fonction des cœurs de processeurs
`cpus`- Statistiques d’utilisation par CPU`cpuX`- Statistiques du cœur CPU X`backlog_len`-`dropped`- Nombre de paquets perdus`flow_limit_count`- Nombre de fois où la limite de débit a été atteinte`processed`- Nombre de paquets traités`received_rps`- Nombre de fois où le CPU a été réveillé`time_squeeze`- Nombre de fois où le thread n’a pas pu traiter tous les paquets de son backlog dans le budget imparti
`summed`- Statistiques d’utilisation globales des cœurs`backlog_len`-`dropped`- Nombre de paquets perdus`flow_limit_count`- Nombre de fois où la limite de débit a été atteinte`processed`- Nombre de paquets traités`received_rps`- Nombre de fois où le CPU a été réveillé`time_squeeze`- Nombre de fois où le thread n’a pas pu traiter tous les paquets de son backlog dans le budget imparti
"softnet": {
"cpus": {
"cpu0": {
"backlog_len": 0,
"dropped": 0,
"flow_limit_count": 0,
"processed": 448550,
"received_rps": 0,
"time_squeeze": 2
},
"cpu1": {
"backlog_len": 0,
"dropped": 0,
"flow_limit_count": 0,
"processed": 36250,
"received_rps": 0,
"time_squeeze": 0
}
},
"summed": {
"backlog_len": 0,
"dropped": 0,
"flow_limit_count": 0,
"processed": 5239450,
"received_rps": 0,
"time_squeeze": 27
}
},
Q - Détails des compteurs `Sigflow` - Informations sur Sigflow (monitoring-engine)
`detailed_status` - Statut du container Sigflow
`up`- État de Sigflow et du moteur de détectiondetailed_status + état
`up`signification
état
`Container down`+`up`falseétat moteur arrêté
état
`Container down`+`up`trueétat impossible: appli ne peut pas tourner dans un container éteint
état
`Container UP`+`up`falseétat instable : appeler le support de GATEWATCHER
état
`Container UP`+`up`trueétat moteur démarré
Exemple :
"suricata": {
"detailed_status": "Container down",
"up": false
},
R - Détails des compteurs `systemd` - Informations du système d’initialisation
`failed_services`- Liste des services échoués rapportée par`systemctl --failed`.
Exemple :
"systemd": {
"failed_services": [ "netdata.service" ]
},
S - Détails des compteurs `uptime` - Temps de disponibilité
`up_seconds`- Nombre de secondes écoulées depuis le démarrage.
Exemple :
"uptime": {
"up_seconds": 874179.8
},
T - Détails des compteurs `virtualmemory` - Information sur l’espace d’échange (swap)
`disk_in`: Nombre de pages sauvées sur le disque depuis le démarrage.`disk_out`- Nombre de pages sortantes du disque depuis le démarrage.`pagefaults_major`- Nombre de page faults par seconde.`pagefaults_minor`- Nombre de page faults par seconde pour charger une page mémoire du disque vers la RAM.`swap_in`- Nombre de kilo-octets que le système a échangé depuis le disque vers la RAM par seconde.`swap_out`- Nombre de kilo-octets que le système a échangé depuis la RAM vers le disque par seconde.Exemple :"virtualmemory": { "disk_in": 307828, "disk_out": 4724267, "pagefaults_major": 1210, "pagefaults_minor": 14233474300, "swap_in": 0, "swap_out": 0 }