6.2.1.10. health
6.2.1.10.1. Introduction
La commande health
du sous-groupe show
permet d’afficher des statistiques et des informations de santé du GCap.
6.2.1.10.2. Prérequis
Utilisateurs : setup, gviewadm
Dépendances : N/A
6.2.1.10.3. Commande
show health
6.2.1.10.4. Exemple
Entrer la commande suivante.
(gcap-cli) show health
Valider.
Le système affiche les informations suivantes :les compteurs
block
- Statistiques sur les stockages de masseles compteurs
cpu_stats
- Statistiques sur le processeurles compteurs
disks
- Statistiques d’occupation des points de montageles compteurs
emergency
- Informations sur l'emergency mode du GCaples compteurs
gcenter
- Informations sur le GCenter appairéles compteurs
high_availability
- Informations sur la haute disponibilité (HA)les compteurs
interfaces
- Statistiques sur les interfaces réseauxles compteurs
loadavg
- Statistiques sur la charge moyenne du GCaples compteurs
meminfo
- Statistiques sur la mémoire viveles compteurs
numastat
- Statistiques sur les nœud NUMAles compteurs
quotas
- Informations sur les quotasles compteurs
sofnet
- Statistiques sur les paquets reçus en fonction des cœurs de processeursles compteurs
suricata
- Informations sur Sigflow (monitoring-engine)les compteurs
systemd
- Informations du système d’initialisation du systèmeles compteurs
uptime
- Temps de disponibilitéles compteurs
virtualmemory
- Information sur l’espace d’échange (swap)
6.2.1.10.4.1. Détails des compteurs block
- Statistiques sur les stockages de masse
sdN
- Statistiques du disque N où N est une lettre de l’alphabetread_bytes
- Octets lus depuis le démarragewritten_bytes
- Octets écrits depuis le démarrage
Exemple :
{
"block": {
"sda": {
"read_bytes": 302867968,
"written_bytes": 4837645312
},
"sdb": {
"read_bytes": 3894272,
"written_bytes": 4096
}
}
6.2.1.10.4.2. Détails des compteurs cpu_stats
- Statistiques sur le processeur
cpus
- Statistiques d’utilisation des CPUscpu
- Statistiques d’utilisation globales des cœurscpuX
- Statistique du cœur CPU Xidle
- Temps écoulé à ne rien faire en millisecondesiowait
- Temps écoulé à attendre des opérations disques en millisecondesirq
- Temps écoulé sur les IRQ matérielnice
- Temps écoulé en espace utilisateur sur des processus à priorité faible en millisecondessoftirq
- Temps écoulé sur les IRQ matériel en millisecondessystem
- Temps écoulé en espace noyau en millisecondesuser
- Temps écoulé en espace utilisateur en millisecondes
interrupts
- Nombre d’interruptions depuis le démarrageprocesses_blocked
- Nombre de processus bloqués ou deathprocesses_running
- Nombre de processus en cours d’exécution
Exemple :
"cpu_stats": { "cpus": { "cpu": { "idle": 961816208, "iowait": 11419, "irq": 0, "nice": 0, "softirq": 397899, "system": 21788203, "user": 50806194 }, "cpu0": { "idle": 79960857, "iowait": 985, "irq": 0, "nice": 0, "softirq": 234748, "system": 1795880, "user": 4357374 }, "cpu1": { "idle": 80166571, "iowait": 951, "irq": 0, "nice": 0, "softirq": 88078, "system": 1830370, "user": 4138182 } }, "interrupts": 12942835029, "processes_blocked": 0, "processes_running": 1 }
6.2.1.10.4.3. Détails des compteurs disks
- Statistiques d’occupation des points de montage
/mountpoint/path
- Chemin du point de montageblock_free
- Nombre de blocks disponiblesblock_total
- Nombre total de blocksinode_free
- Nombre d’inodes restantsinode_total
- Nombre totale d’inodes
Exemple :
"disks": { "/": { "block_free": 247909, "block_total": 249830, "inode_free": 64258, "inode_total": 65536 }, "/data": { "block_free": 7150076, "block_total": 7161801, "inode_free": 1827417, "inode_total": 1827840 }, }
6.2.1.10.4.4. Détails des compteurs emergency
- Informations sur l'emergency mode du GCap
emergency_active
- État actif ou inactif de l’emergency modeExemple :
"emergency": { "emergency_active": false },
6.2.1.10.4.5. Détails des compteurs gcenter
- Informations sur le GCenter appairé
chronyc_sync
- État de la synchronisation NTP avec le GCenterreachable
- GCenter joignable ou non (false)Exemple :
"gcenter": { "chronyc_sync": false, "reachable": false },
6.2.1.10.4.6. Détails des compteurs high_availability
- Informations sur la haute disponibilité (HA)
Cette fonctionnalité est obsolète.
Ces compteurs ne sont pas importants.
healthy
- État de santé de la HAlast_status
- Dernier état connu de la HAlast_transition
- Date du dernier changement d’état de la HA au format ISO8601leader
- Vrai pour un GCap leader, faux pour un GCap followerstatus
- État actif ou inactif (false) de la HA
Exemple :"high_availability": { "healthy": false, "last_status": -1, "last_transition": "0001-01-01T00:00:00Z", "leader": false, "status": false },
6.2.1.10.4.7. Détails des compteurs interfaces
- Statistiques sur les interfaces réseaux
bond0
- Nom de l’interface réseaurx_bytes
- Nombre d’octets reçusrx_drop
- Nombre d’octets perdus en réceptionrx_errs
- Nombre d’octets invalides en réceptionrx_packets
- Nombre total de paquets reçus depuis cette interfacetx_bytes
- Nombre d’octets envoyéstx_drop
- Nombre d’octets perdus en envoitx_errs
- Nombre d’octets invalides en envoitx_packets
- Nombre total de paquets envoyés depuis cette interface
Exemple :
"interfaces": { "bond0": { "rx_bytes": 0, "rx_drops": 0, "rx_errs": 0, "rx_packets": 0, "tx_bytes": 0, "tx_drops": 0, "tx_errs": 0, "tx_packets": 0 }, "gcp0": { "rx_bytes": 138433006, "rx_drops": 82901, "rx_errs": 0, "rx_packets": 2143236, "tx_bytes": 796294, "tx_drops": 0, "tx_errs": 0, "tx_packets": 3635 }, "gcp1": { "rx_bytes": 137642525, "rx_drops": 82902, "rx_errs": 0, "rx_packets": 2135060, "tx_bytes": 0, "tx_drops": 0, "tx_errs": 0, "tx_packets": 0 } },
6.2.1.10.4.8. Détails des compteurs loadavg
- Statistiques sur la charge moyenne du GCap
active_processes
- Nombres de processus lancésload_average_15_mins
- Charge moyenne sur les quinze dernières minutesload_average_1_min
- Charge moyenne sur la dernière minuteload_average_5_mins
- Charge moyenne sur les cinq dernières minutesrunning_processes
- Nombre de processus en cours d’exécutionExemple :
"loadavg": { "active_processes": 561, "load_average_15_mins": 0.99, "load_average_1_min": 0.67, "load_average_5_mins": 1, "running_processes": 2 },
6.2.1.10.4.9. Détails des compteurs meminfo
- Statistiques sur la mémoire vive
available
- Mémoire physique totale en kilo-octetsbuffers
- Mémoire utilisée par des opérations disques en kilo-octetscached
- Mémoire utilisée par le cache en kilo-octetsdirty
- Mémoire utilisée par des opérations d’écritures en attente en kilo-octetsfree
- Mémoire inutilisée en kilo-octetshugepages_anonymous
- Nombre de huge pages transparentes anonymes utiliséeshugepages_free
- Nombre de huge pages transparentes disponibleshugepages_reserved
- Nombre de huge pages transparentes réservéeshugepages_shmem
- Nombre de huge pages transparentes partagéeshugepages_surplus
- Nombre de huge pages transparentes en surplushugepages_total
- Nombre total de huge pageskernel_stack
- Mémoire utilisée par les allocations de la pile du noyau en kilo-octetspage_tables
- Mémoire utilisée pour la gestion des pages en kilo-octetss_reclaimable
- Mémoire de cache qui peut-être ré-alloué en cas de manque de mémoire en kilo-octetsshmem
- Mémoire utilisée par les pages partagées en kilo-octetsslab
- Mémoire utilisée par les structures de données du noyau en kilo-octetsswap_cached
- Mémoire utilisée par le cache du swap en kilo-octetsswap_free
- Mémoire disponible dans le swap en kilo-octetsswap_total
- Mémoire totale du swap en kilo-octets.total
- Mémoire totale en kilo-octetsv_malloc_used
- Mémoire utilisée par les grandes zones de mémoire allouées par le noyau
Pour plus d’informations, se référer à cette documentationmeminfo
.Exemple :
"meminfo": { "available": 13608896, "buffers": 380932, "cached": 1155824, "dirty": 28, "free": 13128080, "hugepages_anonymous": 423936, "hugepages_free": 0, "hugepages_reserved": 0, "hugepages_shmem": 0, "hugepages_surplus": 0, "hugepages_total": 0, "kernel_stack": 9152, "page_tables": 8400, "s_reclaimable": 43168, "shmem": 794564, "slab": 210008, "swap_cached": 0, "swap_free": 16777212, "swap_total": 16777212, "total": 15977468, "v_malloc_used": 66592 },
6.2.1.10.4.10. Détails des compteurs numastat
- Statistiques sur les nœud NUMA
nodes
- Liste des nœuds NUMAnodeX
- Statistiques du nœud NUMA Xinterleave_hit
- Mémoire entrelacée allouée avec succès dans ce nœudlocal_node
- Mémoire allouée dans ce nœud alors qu'un processus fonctionnait dessusnuma_foreign
- Mémoire prévu pour ce nœud, mais actuellement allouée dans un nœud différentnuma_hit
- Mémoire allouée avec succès dans ce nœud comme prévunuma_miss
- Mémoire allouée dans ce nœud en dépit des préférences de processus.
Chaque numa_miss a un numa_foreign dans un autre nœudother_node
- Mémoire allouée dans ce nœud alors qu'un processus fonctionnait dans un autre nœud
Exemple :
"numastat": {
"nodes": {
"node0": {
"interleave_hit": 3871,
"local_node": 4410557829,
"numa_foreign": 0,
"numa_hit": 4410454203,
"numa_miss": 0,
"other_node": 14170
},
"node1": {
"interleave_hit": 3869,
"local_node": 4224990850,
"numa_foreign": 0,
"numa_hit": 4224964539,
"numa_miss": 0,
"other_node": 21531
}
}
},
6.2.1.10.4.11. Détails des compteurs quotas
- Statistiques sur les quotas par catégorie
quotas
- Liste des quotasby_gid
- Statistiques triés par groupe (identifiant gid)by_prj
- Statistiques triés par projet (identifiant prj)by_uid
- Statistiques triés par utilisateur (identifiant uid)
Dans chaque catégorie, les compteurs suivant sont affichés:
block_grace
- Temps de grâce pour les blocksblock_hard_limit
- Limite matérielle des blocks.
Définit une limite absolue pour l'utilisation de l'espace.
L'utilisateur ne peut pas dépasser cette limite.
Passée cette limite, l'écriture sur ce système de fichiers lui est interdite.block_soft_limit
- Limite logicielle des blocks
Indique la quantité maximale d'espace qu'un utilisateur peut occuper sur le système de fichiers.
Si cette limite est atteinte, l'utilisateur reçoit des messages d'avertissement quant au dépassement du quota qui lui a été attribué.
Si son utilisation est combinée avec les délais (ou grace period), lorsque l'utilisateur continue à dépasser la limite logicielle après que se soit écoulé le délai de grâce, alors il se retrouve dans le même cas que dans l'atteinte d'une limite dure.block_used
- Nombre de blocks utilisésfile_grace
- Temps de grâce pour les fichiersfile_hard_limit
- Limite matérielle des fichiers
Définit une limite absolue pour l'utilisation de l'espace.
L'utilisateur ne peut pas dépasser cette limite.
Passée cette limite, l'écriture sur ce système de fichiers lui est interdite.file_soft_limit
- Limite logicielle des fichiers
Indique la quantité maximale d'espace qu'un utilisateur peut occuper sur le système de fichiers.
Si cette limite est atteinte, l'utilisateur reçoit des messages d'avertissement quant au dépassement du quota qui lui a été attribué.
Si son utilisation est combinée avec les délais (ou grace period), lorsque l'utilisateur continue à dépasser la limite logicielle après que se soit écoulé le délai de grâce, alors il se retrouve dans le même cas que dans l'atteinte d'une limite dure.file_used
- Nombre de fichiers utilisés
Exemple :
"quotas": {
"by_gid": {
"0": {
"block_grace": "0",
"block_hard_limit": "0",
"block_soft_limit": "0",
"block_used": "2148952",
"file_grace": "0",
"file_hard_limit": "0",
"file_soft_limit": "0",
"file_used": "177"
},
"10012": {
"block_grace": "0",
"block_hard_limit": "0",
"block_soft_limit": "0",
"block_used": "5216",
"file_grace": "0",
"file_hard_limit": "0",
"file_soft_limit": "0",
"file_used": "295"
},
}
},
"by_prj": {
"0": {
"block_grace": "0",
"block_hard_limit": "0",
"block_soft_limit": "0",
"block_used": "51600",
"file_grace": "0",
"file_hard_limit": "0",
"file_soft_limit": "0",
"file_used": "225"
},
"1": {
"block_grace": "0",
"block_hard_limit": "7980499",
"block_soft_limit": "7980499",
"block_used": "2101904",
"file_grace": "0",
"file_hard_limit": "1000",
"file_soft_limit": "1000",
"file_used": "43"
},
}
},
"by_uid": {
"0": {
"block_grace": "0",
"block_hard_limit": "0",
"block_soft_limit": "0",
"block_used": "2153356",
"file_grace": "0",
"file_hard_limit": "0",
"file_soft_limit": "0",
"file_used": "269"
},
"10012": {
"block_grace": "0",
"block_hard_limit": "0",
"block_soft_limit": "0",
"block_used": "1032",
"file_grace": "0",
"file_hard_limit": "0",
"file_soft_limit": "0",
"file_used": "258"
},
}
}
L'exemple ci après est sans limite définie : la valeur "0" indique qu'il n'y a pas de valeur définie pour les limites et les temps de grâce.
"10012": {
"block_grace": "0",
"block_hard_limit": "0",
"block_soft_limit": "0",
"block_used": "1032",
"file_grace": "0",
"file_hard_limit": "0",
"file_soft_limit": "0",
"file_used": "258"
},
6.2.1.10.4.12. Détails des compteurs sofnet
- Statistiques sur les paquets reçus en fonction des cœurs de processeurs
cpus
- Statistiques d’utilisation par CPUcpuX
- Statistiques du cœur CPU Xbacklog_len
-dropped
- Nombre de paquets perdusflow_limit_count
- Nombre de fois où la limite de débit a été atteinteprocessed
- Nombre de paquets traitésreceived_rps
- Nombre de fois où le CPU a été réveillétime_squeeze
- Nombre de fois où le thread n'a pas pu traiter tous les paquets de son backlog dans le budget imparti
summed
- Statistiques d’utilisation globales des cœursbacklog_len
-dropped
- Nombre de paquets perdusflow_limit_count
- Nombre de fois où la limite de débit a été atteinteprocessed
- Nombre de paquets traitésreceived_rps
- Nombre de fois où le CPU a été réveillétime_squeeze
- Nombre de fois où le thread n'a pas pu traiter tous les paquets de son backlog dans le budget imparti
Exemple :
"softnet": {
"cpus": {
"cpu0": {
"backlog_len": 0,
"dropped": 0,
"flow_limit_count": 0,
"processed": 448550,
"received_rps": 0,
"time_squeeze": 2
},
"cpu1": {
"backlog_len": 0,
"dropped": 0,
"flow_limit_count": 0,
"processed": 36250,
"received_rps": 0,
"time_squeeze": 0
}
},
"summed": {
"backlog_len": 0,
"dropped": 0,
"flow_limit_count": 0,
"processed": 5239450,
"received_rps": 0,
"time_squeeze": 27
}
},
6.2.1.10.4.13. Détails des compteurs Sigflow
- Informations sur Sigflow (monitoring-engine)
detailed_status
- Statut du container Sigflow
up
- État de Sigflow et du moteur de détection
detailed_status + état "up" |
signification |
---|---|
état "Container down" + "up" false |
état moteur arrêté |
état "Container down" + "up" true |
état impossible: appli ne peut pas tourner dans un container éteint |
état "Container UP" + "up" false |
état instable : appeler le support de GATEWATCHER |
état "Container UP" + "up" true |
état moteur démarré |
Exemple :
"suricata": {
"detailed_status": "Container down",
"up": false
},
6.2.1.10.4.14. Détails des compteurs systemd
- Informations du système d’initialisation
failed_services
- Liste des services échoués rapportée parsystemctl --failed
.
Exemple :
"systemd": {
"failed_services": [ "netdata.service" ]
},
6.2.1.10.4.15. Détails des compteurs uptime
- Temps de disponibilité
up_seconds
- Nombre de secondes écoulées depuis le démarrage.
Exemple :
"uptime": {
"up_seconds": 874179.8
},
6.2.1.10.4.16. Détails des compteurs virtualmemory
- Information sur l’espace d’échange (swap)
disk_in
: Nombre de pages sauvées sur le disque depuis le démarrage.disk_out
- Nombre de pages sortantes du disque depuis le démarrage.pagefaults_major
- Nombre de page faults par seconde.pagefaults_minor
- Nombre de page faults par seconde pour charger une page mémoire du disque vers la RAM.swap_in
- Nombre de kilo-octets que le système a échangé depuis le disque vers la RAM par seconde.swap_out
- Nombre de kilo-octets que le système a échangé depuis la RAM vers le disque par seconde.
Exemple :"virtualmemory": { "disk_in": 307828, "disk_out": 4724267, "pagefaults_major": 1210, "pagefaults_minor": 14233474300, "swap_in": 0, "swap_out": 0 }