6.2.1.11. health

6.2.1.11.1. Introduction

La commande health du sous-groupe show permet d’afficher des statistiques et des informations de santé du GCap.


6.2.1.11.2. Prérequis

  • Utilisateurs : setup, gviewadm

  • Dépendances : N/A


6.2.1.11.3. Commande

show health


6.2.1.11.4. Exemple

  • Entrer la commande suivante.

(gcap-cli) show health
  • Valider.

Le système affiche les informations suivantes:

  • les compteurs block - Statistiques sur les stockages de masse

  • les compteurs cpu_stats - Statistiques sur le processeur

  • les compteurs disks - Statistiques d’occupation des points de montage

  • les compteurs emergency - Informations sur l'emergency mode du GCap

  • les compteurs gcenter - Informations sur le GCenter appairé

  • les compteurs high_availability - Informations sur la haute disponibilité (HA)

  • les compteurs interfaces - Statistiques sur les interfaces réseaux

  • les compteurs loadavg - Statistiques sur la charge moyenne du GCap

  • les compteurs meminfo - Statistiques sur la mémoire vive

  • les compteurs numastat - Statistiques sur les nœud NUMA

  • les compteurs sofnet - Statistiques sur les paquets reçus en fonction des cœurs de processeurs

  • les compteurs suricata - Informations sur Sigflow (monitoring-engine)

  • les compteurs systemd - Informations du système d’initialisation du système

  • les compteurs uptime - Temps de disponibilité

  • les compteurs virtualmemory - Information sur l’espace d’échange (swap)


6.2.1.11.4.1. Détails des compteurs block - Statistiques sur les stockages de masse

  • sdN - Statistiques du disque N où N est une lettre de l’alphabet

    • read_bytes - Octets lus depuis le démarrage

    • written_bytes - Octets écrits depuis le démarrage

    Exemple :

    {
     "block": {
        "sda": {
            "read_bytes": 302867968,
            "written_bytes": 4837645312
        },
        "sdb": {
            "read_bytes": 3894272,
            "written_bytes": 4096
        }
    },
    ...

6.2.1.11.4.2. Détails des compteurs cpu_stats - Statistiques sur le processeur

  • cpus - Statistiques d’utilisation des CPUs

    • cpu - Statistiques d’utilisation globales des cœurs

    • cpuX - Statistique du cœur CPU X

      • idle - Temps écoulé à ne rien faire en millisecondes

      • iowait - Temps écoulé à attendre des opérations disques en millisecondes

      • irq - Temps écoulé sur les IRQ matériel

      • nice - Temps écoulé en espace utilisateur sur des processus à priorité faible en millisecondes

      • softirq - Temps écoulé sur les IRQ matériel en millisecondes

      • system - Temps écoulé en espace noyau en millisecondes

      • user - Temps écoulé en espace utilisateur en millisecondes

    • interrupts - Nombre d’interruptions depuis le démarrage

    • processes_blocked - Nombre de processus bloqués ou death

    • processes_running - Nombre de processus en cours d’exécution

    Exemple :

    ...
    "cpu_stats": {
        "cpus": {
            "cpu": {
                "idle": 961816208,
                "iowait": 11419,
                "irq": 0,
                "nice": 0,
                "softirq": 397899,
                "system": 21788203,
                "user": 50806194
            },
            "cpu0": {
                "idle": 79960857,
                "iowait": 985,
                "irq": 0,
                "nice": 0,
                "softirq": 234748,
                "system": 1795880,
                "user": 4357374
            },
            "cpu1": {
                "idle": 80166571,
                "iowait": 951,
                "irq": 0,
                "nice": 0,
                "softirq": 88078,
                "system": 1830370,
                "user": 4138182
            }
        },
        "interrupts": 12942835029,
        "processes_blocked": 0,
        "processes_running": 1
    },
    ...

6.2.1.11.4.3. Détails des compteurs disks - Statistiques d’occupation des points de montage

  • /mountpoint/path - Chemin du point de montage

    • block_free - Nombre de blocks disponibles

    • block_total - Nombre total de blocks

    • inode_free - Nombre d’inodes restants

    • inode_total - Nombre totale d’inodes

    Exemple :

    ...
    "disks": {
        "/": {
            "block_free": 247909,
            "block_total": 249830,
            "inode_free": 64258,
            "inode_total": 65536
        },
        "/data": {
            "block_free": 7150076,
            "block_total": 7161801,
            "inode_free": 1827417,
            "inode_total": 1827840
        },
    },
    ...

6.2.1.11.4.4. Détails des compteurs emergency - Informations sur l'emergency mode du GCap

  • emergency_active - État actif ou inactif de l’emergency mode

Exemple :

    ...
    "emergency": {
        "emergency_active": false
    },
    ...

6.2.1.11.4.5. Détails des compteurs gcenter - Informations sur le GCenter appairé

  • chronyc_sync - État de la synchronisation NTP avec le GCenter

  • reachable - GCenter joignable ou non (false)

Exemple :

    ...
    "gcenter": {
        "chronyc_sync": false,
        "reachable": false
    },
    ...

6.2.1.11.4.6. Détails des Compteurs high_availability - Informations sur la haute disponibilité (HA)

  • healthy - État de santé de la HA

  • last_status - Dernier état connu de la HA

  • last_transition - Date du dernier changement d’état de la HA au format ISO8601

  • leader - Vrai pour un GCap leader, faux pour un GCap follower

  • status - État actif ou inactif (false) de la HA

Exemple :

...
    "high_availability": {
        "healthy": false,
        "last_status": -1,
        "last_transition": "0001-01-01T00:00:00Z",
        "leader": false,
        "status": false
    },
...

6.2.1.11.4.7. Détails des compteurs interfaces - Statistiques sur les interfaces réseaux

  • bond0 - Nom de l’interface réseau

    • rx_bytes - Nombre d’octets reçus

    • rx_drop - Nombre d’octets perdus en réception

    • rx_errs - Nombre d’octets invalides en réception

    • rx_packets - Nombre total de paquets reçus depuis cette interface

    • tx_bytes - Nombre d’octets envoyés

    • tx_drop - Nombre d’octets perdus en envoi

    • tx_errs - Nombre d’octets invalides en envoi

    • tx_packets - Nombre total de paquets envoyés depuis cette interface

Exemple :

...
    "interfaces": {
        "bond0": {
            "rx_bytes": 0,
            "rx_drops": 0,
            "rx_errs": 0,
            "rx_packets": 0,
            "tx_bytes": 0,
            "tx_drops": 0,
            "tx_errs": 0,
            "tx_packets": 0
        },
        "gcp0": {
            "rx_bytes": 138433006,
            "rx_drops": 82901,
            "rx_errs": 0,
            "rx_packets": 2143236,
            "tx_bytes": 796294,
            "tx_drops": 0,
            "tx_errs": 0,
            "tx_packets": 3635
        },
        "gcp1": {
            "rx_bytes": 137642525,
            "rx_drops": 82902,
            "rx_errs": 0,
            "rx_packets": 2135060,
            "tx_bytes": 0,
            "tx_drops": 0,
            "tx_errs": 0,
            "tx_packets": 0
        }
    },
...

6.2.1.11.4.8. Détails des compteurs loadavg - Statistiques sur la charge moyenne du GCap

  • active_processes - Nombres de processus lancés

  • load_average_15_mins - Charge moyenne sur les quinze dernières minutes

  • load_average_1_min - Charge moyenne de la dernière minute

  • load_average_5_mins - Charge moyenne sur les cinq dernières minutes

  • running_processes - Nombre de processus en cours d’exécution

Exemple :

...
    "loadavg": {
        "active_processes": 561,
        "load_average_15_mins": 0.99,
        "load_average_1_min": 0.67,
        "load_average_5_mins": 1,
        "running_processes": 2
    },
...

6.2.1.11.4.9. Détails des compteurs meminfo - Statistiques sur la mémoire vive

  • available - Mémoire physique totale en kilo-octets

  • buffers - Mémoire utilisée par des opérations disques en kilo-octets

  • cached - Mémoire utilisée par le cache en kilo-octets

  • dirty - Mémoire utilisée par des opérations d’écritures en attente en kilo-octets

  • free - Mémoire inutilisée en kilo-octets

  • hugepages_anonymous - Nombre de huge pages transparentes anonymes utilisées

  • hugepages_free - Nombre de huge pages transparentes disponibles

  • hugepages_reserved - Nombre de huge pages transparentes réservées

  • hugepages_shmem - Nombre de huge pages transparentes partagées

  • hugepages_surplus - Nombre de huge pages transparentes en surplus

  • hugepages_total - Nombre total de huge pages

  • kernel_stack - Mémoire utilisée par les allocations de la pile du noyau en kilo-octets

  • page_tables - Mémoire utilisée pour la gestion des pages en kilo-octets

  • s_reclaimable - Mémoire de cache qui peut-être ré-alloué en cas de manque de mémoire en kilo-octets

  • shmem - Mémoire utilisée par les pages partagées en kilo-octets

  • slab - Mémoire utilisée par les structures de données du noyau en kilo-octets

  • swap_cached - Mémoire utilisée par le cache du swap en kilo-octets

  • swap_free - Mémoire disponible dans le swap en kilo-octets

  • swap_total - Mémoire totale du swap en kilo-octets.

  • total - Mémoire totale en kilo-octets

  • v_malloc_used - Mémoire utilisée par les grandes zones de mémoire allouées par le noyau

Pour plus d’informations, se référer à cette documentation meminfo.

Exemple :

...
    "meminfo": {
        "available": 13608896,
        "buffers": 380932,
        "cached": 1155824,
        "dirty": 28,
        "free": 13128080,
        "hugepages_anonymous": 423936,
        "hugepages_free": 0,
        "hugepages_reserved": 0,
        "hugepages_shmem": 0,
        "hugepages_surplus": 0,
        "hugepages_total": 0,
        "kernel_stack": 9152,
        "page_tables": 8400,
        "s_reclaimable": 43168,
        "shmem": 794564,
        "slab": 210008,
        "swap_cached": 0,
        "swap_free": 16777212,
        "swap_total": 16777212,
        "total": 15977468,
        "v_malloc_used": 66592
    },
...

6.2.1.11.4.10. Détails des compteurs numastat - Statistiques sur les nœud NUMA

  • nodes - Liste des nodes NUMA

    • nodeX - Statistiques du nœud NUMA X

      • interleave_hit - Mémoire entrelacée allouée avec succès dans ce nœud

      • local_node - Mémoire allouée dans ce nœud alors qu'un processus fonctionnait dessus

      • numa_foreign - Mémoire prévu pour ce nœud, mais actuellement allouée dans un nœud différent

      • numa_hit - Mémoire allouée avec succès dans ce nœud comme prévu

      • numa_miss - Mémoire allouée dans ce nœud en dépit des préférences de processus. Chaque numa_miss a un numa_foreign dans un autre nœud

      • other_node - Mémoire allouée dans ce nœud alors qu'un processus fonctionnait dans un autre nœud

Exemple :

...
    "numastat": {
        "nodes": {
            "node0": {
                "interleave_hit": 3871,
                "local_node": 4410557829,
                "numa_foreign": 0,
                "numa_hit": 4410454203,
                "numa_miss": 0,
                "other_node": 14170
            },
            "node1": {
                "interleave_hit": 3869,
                "local_node": 4224990850,
                "numa_foreign": 0,
                "numa_hit": 4224964539,
                "numa_miss": 0,
                "other_node": 21531
            }
        }
    },
...

6.2.1.11.4.11. Détails des compteurs sofnet - Statistiques sur les paquets reçus en fonction des cœurs de processeurs

  • cpus - Statistiques d’utilisation par CPU

    • cpuX - Statistiques du cœur CPU X

      • backlog_len -

      • dropped - Nombre de paquets perdus

      • flow_limit_count - Nombre de fois où la limite de débit a été atteinte

      • processed - Nombre de paquets traités

      • received_rps - Nombre de fois où le CPU a été réveillé

      • time_squeeze - Nombre de fois où le thread n'a pas pu traiter tous les paquets de son backlog dans le budget imparti

    • summed - Statistiques d’utilisation globales des cœurs

      • backlog_len -

      • dropped - Nombre de paquets perdus

      • flow_limit_count - Nombre de fois où la limite de débit a été atteinte

      • processed - Nombre de paquets traités

      • received_rps - Nombre de fois où le CPU a été réveillé

      • time_squeeze - Nombre de fois où le thread n'a pas pu traiter tous les paquets de son backlog dans le budget imparti

Exemple :

...
    "softnet": {
        "cpus": {
            "cpu0": {
                "backlog_len": 0,
                "dropped": 0,
                "flow_limit_count": 0,
                "processed": 448550,
                "received_rps": 0,
                "time_squeeze": 2
            },
            "cpu1": {
                "backlog_len": 0,
                "dropped": 0,
                "flow_limit_count": 0,
                "processed": 36250,
                "received_rps": 0,
                "time_squeeze": 0
            }
        },
        "summed": {
            "backlog_len": 0,
            "dropped": 0,
            "flow_limit_count": 0,
            "processed": 5239450,
            "received_rps": 0,
            "time_squeeze": 27
        }
    },
...

6.2.1.11.4.12. Détails des compteurs Sigflow - Informations sur Sigflow (monitoring-engine)

detailed_status - Statut du container Sigflow

  • up - État de Sigflow et du moteur de détection

detailed_status + etat "up"

signification

état "Container down" + "up" false

état moteur arrêté

état "Container down" + "up" true

état impossible: appli ne peut pas tourné dans un container éteint

état "Container UP" + "up" false

état instable : appeler le support de GATEWATCHER

état "Container UP" + "up" true

état moteur démarré

Exemple :

...
    "suricata": {
        "detailed_status": "Container down",
        "up": false
    },
...

6.2.1.11.4.13. Détails des compteurs systemd - Informations du système d’initialisation du système

  • failed_services - Liste des services échoués rapportÉ par systemctl --failed.

Exemple :

...
    "systemd": {
        "failed_services": [ "netdata.service" ]
    },
...

6.2.1.11.4.14. Détails des compteurs uptime - Temps de disponibilité

  • up_seconds - Nombre de secondes écoulées depuis le démarrage.

Exemple :

...
    "uptime": {
        "up_seconds": 874179.8
    },
...

6.2.1.11.4.15. Détails des compteurs virtualmemory - Information sur l’espace d’échange (swap)

  • disk_in: Nombre de pages sauvées sur le disque depuis le démarrage.

  • disk_out - Nombre de pages sortantes du disque depuis le démarrage.

  • pagefaults_major - Nombre de page faults par seconde.

  • pagefaults_minor - Nombre de page faults par seconde pour charger une page mémoire du disque vers la RAM.

  • swap_in - Nombre de kilo-octets que le système a échangé depuis le disque vers la RAM par seconde.

  • swap_out - Nombre de kilo-octets que le système a échangé depuis la RAM vers le disque par seconde.

Exemple :

...
    "virtualmemory": {
        "disk_in": 307828,
        "disk_out": 4724267,
        "pagefaults_major": 1210,
        "pagefaults_minor": 14233474300,
        "swap_in": 0,
        "swap_out": 0
    }
}
...