6.2.1.11. health
6.2.1.11.1. Introduction
La commande health
du sous-groupe show
permet d’afficher des statistiques et des informations de santé du GCap.
6.2.1.11.2. Prérequis
Utilisateurs : setup, gviewadm
Dépendances : N/A
6.2.1.11.3. Commande
show health
6.2.1.11.4. Exemple
Entrer la commande suivante.
(gcap-cli) show health
Valider.
Le système affiche les informations suivantes:
les compteurs
block
- Statistiques sur les stockages de masseles compteurs
cpu_stats
- Statistiques sur le processeurles compteurs
disks
- Statistiques d’occupation des points de montageles compteurs
emergency
- Informations sur l'emergency mode du GCaples compteurs
gcenter
- Informations sur le GCenter appairéles compteurs
high_availability
- Informations sur la haute disponibilité (HA)les compteurs
interfaces
- Statistiques sur les interfaces réseauxles compteurs
loadavg
- Statistiques sur la charge moyenne du GCaples compteurs
meminfo
- Statistiques sur la mémoire viveles compteurs
numastat
- Statistiques sur les nœud NUMAles compteurs
sofnet
- Statistiques sur les paquets reçus en fonction des cœurs de processeursles compteurs
suricata
- Informations sur Sigflow (monitoring-engine)les compteurs
systemd
- Informations du système d’initialisation du systèmeles compteurs
uptime
- Temps de disponibilitéles compteurs
virtualmemory
- Information sur l’espace d’échange (swap)
6.2.1.11.4.1. Détails des compteurs block
- Statistiques sur les stockages de masse
sdN
- Statistiques du disque N où N est une lettre de l’alphabetread_bytes
- Octets lus depuis le démarragewritten_bytes
- Octets écrits depuis le démarrage
Exemple :
{
"block": {
"sda": {
"read_bytes": 302867968,
"written_bytes": 4837645312
},
"sdb": {
"read_bytes": 3894272,
"written_bytes": 4096
}
},
...
6.2.1.11.4.2. Détails des compteurs cpu_stats
- Statistiques sur le processeur
cpus
- Statistiques d’utilisation des CPUscpu
- Statistiques d’utilisation globales des cœurscpuX
- Statistique du cœur CPU Xidle
- Temps écoulé à ne rien faire en millisecondesiowait
- Temps écoulé à attendre des opérations disques en millisecondesirq
- Temps écoulé sur les IRQ matérielnice
- Temps écoulé en espace utilisateur sur des processus à priorité faible en millisecondessoftirq
- Temps écoulé sur les IRQ matériel en millisecondessystem
- Temps écoulé en espace noyau en millisecondesuser
- Temps écoulé en espace utilisateur en millisecondes
interrupts
- Nombre d’interruptions depuis le démarrageprocesses_blocked
- Nombre de processus bloqués ou deathprocesses_running
- Nombre de processus en cours d’exécution
Exemple :
...
"cpu_stats": {
"cpus": {
"cpu": {
"idle": 961816208,
"iowait": 11419,
"irq": 0,
"nice": 0,
"softirq": 397899,
"system": 21788203,
"user": 50806194
},
"cpu0": {
"idle": 79960857,
"iowait": 985,
"irq": 0,
"nice": 0,
"softirq": 234748,
"system": 1795880,
"user": 4357374
},
"cpu1": {
"idle": 80166571,
"iowait": 951,
"irq": 0,
"nice": 0,
"softirq": 88078,
"system": 1830370,
"user": 4138182
}
},
"interrupts": 12942835029,
"processes_blocked": 0,
"processes_running": 1
},
...
6.2.1.11.4.3. Détails des compteurs disks
- Statistiques d’occupation des points de montage
/mountpoint/path
- Chemin du point de montageblock_free
- Nombre de blocks disponiblesblock_total
- Nombre total de blocksinode_free
- Nombre d’inodes restantsinode_total
- Nombre totale d’inodes
Exemple :
...
"disks": {
"/": {
"block_free": 247909,
"block_total": 249830,
"inode_free": 64258,
"inode_total": 65536
},
"/data": {
"block_free": 7150076,
"block_total": 7161801,
"inode_free": 1827417,
"inode_total": 1827840
},
},
...
6.2.1.11.4.4. Détails des compteurs emergency
- Informations sur l'emergency mode du GCap
emergency_active
- État actif ou inactif de l’emergency mode
Exemple :
...
"emergency": {
"emergency_active": false
},
...
6.2.1.11.4.5. Détails des compteurs gcenter
- Informations sur le GCenter appairé
chronyc_sync
- État de la synchronisation NTP avec le GCenterreachable
- GCenter joignable ou non (false)
Exemple :
...
"gcenter": {
"chronyc_sync": false,
"reachable": false
},
...
6.2.1.11.4.6. Détails des Compteurs high_availability
- Informations sur la haute disponibilité (HA)
healthy
- État de santé de la HAlast_status
- Dernier état connu de la HAlast_transition
- Date du dernier changement d’état de la HA au format ISO8601leader
- Vrai pour un GCap leader, faux pour un GCap followerstatus
- État actif ou inactif (false) de la HA
Exemple :
...
"high_availability": {
"healthy": false,
"last_status": -1,
"last_transition": "0001-01-01T00:00:00Z",
"leader": false,
"status": false
},
...
6.2.1.11.4.7. Détails des compteurs interfaces
- Statistiques sur les interfaces réseaux
bond0
- Nom de l’interface réseaurx_bytes
- Nombre d’octets reçusrx_drop
- Nombre d’octets perdus en réceptionrx_errs
- Nombre d’octets invalides en réceptionrx_packets
- Nombre total de paquets reçus depuis cette interfacetx_bytes
- Nombre d’octets envoyéstx_drop
- Nombre d’octets perdus en envoitx_errs
- Nombre d’octets invalides en envoitx_packets
- Nombre total de paquets envoyés depuis cette interface
Exemple :
...
"interfaces": {
"bond0": {
"rx_bytes": 0,
"rx_drops": 0,
"rx_errs": 0,
"rx_packets": 0,
"tx_bytes": 0,
"tx_drops": 0,
"tx_errs": 0,
"tx_packets": 0
},
"gcp0": {
"rx_bytes": 138433006,
"rx_drops": 82901,
"rx_errs": 0,
"rx_packets": 2143236,
"tx_bytes": 796294,
"tx_drops": 0,
"tx_errs": 0,
"tx_packets": 3635
},
"gcp1": {
"rx_bytes": 137642525,
"rx_drops": 82902,
"rx_errs": 0,
"rx_packets": 2135060,
"tx_bytes": 0,
"tx_drops": 0,
"tx_errs": 0,
"tx_packets": 0
}
},
...
6.2.1.11.4.8. Détails des compteurs loadavg
- Statistiques sur la charge moyenne du GCap
active_processes
- Nombres de processus lancésload_average_15_mins
- Charge moyenne sur les quinze dernières minutesload_average_1_min
- Charge moyenne de la dernière minuteload_average_5_mins
- Charge moyenne sur les cinq dernières minutesrunning_processes
- Nombre de processus en cours d’exécution
Exemple :
...
"loadavg": {
"active_processes": 561,
"load_average_15_mins": 0.99,
"load_average_1_min": 0.67,
"load_average_5_mins": 1,
"running_processes": 2
},
...
6.2.1.11.4.9. Détails des compteurs meminfo
- Statistiques sur la mémoire vive
available
- Mémoire physique totale en kilo-octetsbuffers
- Mémoire utilisée par des opérations disques en kilo-octetscached
- Mémoire utilisée par le cache en kilo-octetsdirty
- Mémoire utilisée par des opérations d’écritures en attente en kilo-octetsfree
- Mémoire inutilisée en kilo-octetshugepages_anonymous
- Nombre de huge pages transparentes anonymes utiliséeshugepages_free
- Nombre de huge pages transparentes disponibleshugepages_reserved
- Nombre de huge pages transparentes réservéeshugepages_shmem
- Nombre de huge pages transparentes partagéeshugepages_surplus
- Nombre de huge pages transparentes en surplushugepages_total
- Nombre total de huge pageskernel_stack
- Mémoire utilisée par les allocations de la pile du noyau en kilo-octetspage_tables
- Mémoire utilisée pour la gestion des pages en kilo-octetss_reclaimable
- Mémoire de cache qui peut-être ré-alloué en cas de manque de mémoire en kilo-octetsshmem
- Mémoire utilisée par les pages partagées en kilo-octetsslab
- Mémoire utilisée par les structures de données du noyau en kilo-octetsswap_cached
- Mémoire utilisée par le cache du swap en kilo-octetsswap_free
- Mémoire disponible dans le swap en kilo-octetsswap_total
- Mémoire totale du swap en kilo-octets.total
- Mémoire totale en kilo-octetsv_malloc_used
- Mémoire utilisée par les grandes zones de mémoire allouées par le noyau
Pour plus d’informations, se référer à cette documentation meminfo
.
Exemple :
...
"meminfo": {
"available": 13608896,
"buffers": 380932,
"cached": 1155824,
"dirty": 28,
"free": 13128080,
"hugepages_anonymous": 423936,
"hugepages_free": 0,
"hugepages_reserved": 0,
"hugepages_shmem": 0,
"hugepages_surplus": 0,
"hugepages_total": 0,
"kernel_stack": 9152,
"page_tables": 8400,
"s_reclaimable": 43168,
"shmem": 794564,
"slab": 210008,
"swap_cached": 0,
"swap_free": 16777212,
"swap_total": 16777212,
"total": 15977468,
"v_malloc_used": 66592
},
...
6.2.1.11.4.10. Détails des compteurs numastat
- Statistiques sur les nœud NUMA
nodes
- Liste des nodes NUMAnodeX
- Statistiques du nœud NUMA Xinterleave_hit
- Mémoire entrelacée allouée avec succès dans ce nœudlocal_node
- Mémoire allouée dans ce nœud alors qu'un processus fonctionnait dessusnuma_foreign
- Mémoire prévu pour ce nœud, mais actuellement allouée dans un nœud différentnuma_hit
- Mémoire allouée avec succès dans ce nœud comme prévunuma_miss
- Mémoire allouée dans ce nœud en dépit des préférences de processus. Chaque numa_miss a un numa_foreign dans un autre nœudother_node
- Mémoire allouée dans ce nœud alors qu'un processus fonctionnait dans un autre nœud
Exemple :
...
"numastat": {
"nodes": {
"node0": {
"interleave_hit": 3871,
"local_node": 4410557829,
"numa_foreign": 0,
"numa_hit": 4410454203,
"numa_miss": 0,
"other_node": 14170
},
"node1": {
"interleave_hit": 3869,
"local_node": 4224990850,
"numa_foreign": 0,
"numa_hit": 4224964539,
"numa_miss": 0,
"other_node": 21531
}
}
},
...
6.2.1.11.4.11. Détails des compteurs sofnet
- Statistiques sur les paquets reçus en fonction des cœurs de processeurs
cpus
- Statistiques d’utilisation par CPUcpuX
- Statistiques du cœur CPU Xbacklog_len
-dropped
- Nombre de paquets perdusflow_limit_count
- Nombre de fois où la limite de débit a été atteinteprocessed
- Nombre de paquets traitésreceived_rps
- Nombre de fois où le CPU a été réveillétime_squeeze
- Nombre de fois où le thread n'a pas pu traiter tous les paquets de son backlog dans le budget imparti
summed
- Statistiques d’utilisation globales des cœursbacklog_len
-dropped
- Nombre de paquets perdusflow_limit_count
- Nombre de fois où la limite de débit a été atteinteprocessed
- Nombre de paquets traitésreceived_rps
- Nombre de fois où le CPU a été réveillétime_squeeze
- Nombre de fois où le thread n'a pas pu traiter tous les paquets de son backlog dans le budget imparti
Exemple :
...
"softnet": {
"cpus": {
"cpu0": {
"backlog_len": 0,
"dropped": 0,
"flow_limit_count": 0,
"processed": 448550,
"received_rps": 0,
"time_squeeze": 2
},
"cpu1": {
"backlog_len": 0,
"dropped": 0,
"flow_limit_count": 0,
"processed": 36250,
"received_rps": 0,
"time_squeeze": 0
}
},
"summed": {
"backlog_len": 0,
"dropped": 0,
"flow_limit_count": 0,
"processed": 5239450,
"received_rps": 0,
"time_squeeze": 27
}
},
...
6.2.1.11.4.12. Détails des compteurs Sigflow
- Informations sur Sigflow (monitoring-engine)
detailed_status
- Statut du container Sigflow
up
- État de Sigflow et du moteur de détection
detailed_status + etat "up" |
signification |
---|---|
état "Container down" + "up" false |
état moteur arrêté |
état "Container down" + "up" true |
état impossible: appli ne peut pas tourné dans un container éteint |
état "Container UP" + "up" false |
état instable : appeler le support de GATEWATCHER |
état "Container UP" + "up" true |
état moteur démarré |
Exemple :
...
"suricata": {
"detailed_status": "Container down",
"up": false
},
...
6.2.1.11.4.13. Détails des compteurs systemd
- Informations du système d’initialisation du système
failed_services
- Liste des services échoués rapportÉ parsystemctl --failed
.
Exemple :
...
"systemd": {
"failed_services": [ "netdata.service" ]
},
...
6.2.1.11.4.14. Détails des compteurs uptime
- Temps de disponibilité
up_seconds
- Nombre de secondes écoulées depuis le démarrage.
Exemple :
...
"uptime": {
"up_seconds": 874179.8
},
...
6.2.1.11.4.15. Détails des compteurs virtualmemory
- Information sur l’espace d’échange (swap)
disk_in
: Nombre de pages sauvées sur le disque depuis le démarrage.disk_out
- Nombre de pages sortantes du disque depuis le démarrage.pagefaults_major
- Nombre de page faults par seconde.pagefaults_minor
- Nombre de page faults par seconde pour charger une page mémoire du disque vers la RAM.swap_in
- Nombre de kilo-octets que le système a échangé depuis le disque vers la RAM par seconde.swap_out
- Nombre de kilo-octets que le système a échangé depuis la RAM vers le disque par seconde.
Exemple :
...
"virtualmemory": {
"disk_in": 307828,
"disk_out": 4724267,
"pagefaults_major": 1210,
"pagefaults_minor": 14233474300,
"swap_in": 0,
"swap_out": 0
}
}
...