6.2.1.10. health

6.2.1.10.1. Introduction

La commande health du sous-groupe show permet d’afficher des statistiques et des informations de santé du GCap.


6.2.1.10.2. Prérequis

  • Utilisateurs : setup, gviewadm

  • Dépendances : N/A


6.2.1.10.3. Commande

show health


6.2.1.10.4. Exemple

  • Entrer la commande suivante.

(gcap-cli) show health
  • Valider.
    Le système affiche les informations suivantes :

  • les compteurs block - Statistiques sur les stockages de masse

  • les compteurs cpu_stats - Statistiques sur le processeur

  • les compteurs disks - Statistiques d’occupation des points de montage

  • les compteurs emergency - Informations sur l'emergency mode du GCap

  • les compteurs gcenter - Informations sur le GCenter appairé

  • les compteurs high_availability - Informations sur la haute disponibilité (HA)

  • les compteurs interfaces - Statistiques sur les interfaces réseaux

  • les compteurs loadavg - Statistiques sur la charge moyenne du GCap

  • les compteurs meminfo - Statistiques sur la mémoire vive

  • les compteurs numastat - Statistiques sur les nœud NUMA

  • les compteurs quotas- Informations sur les quotas

  • les compteurs sofnet - Statistiques sur les paquets reçus en fonction des cœurs de processeurs

  • les compteurs suricata - Informations sur Sigflow (monitoring-engine)

  • les compteurs systemd - Informations du système d’initialisation du système

  • les compteurs uptime - Temps de disponibilité

  • les compteurs virtualmemory - Information sur l’espace d’échange (swap)


6.2.1.10.4.1. Détails des compteurs block - Statistiques sur les stockages de masse

  • sdN - Statistiques du disque N où N est une lettre de l’alphabet

    • read_bytes - Octets lus depuis le démarrage

    • written_bytes - Octets écrits depuis le démarrage

Exemple :

  {
   "block": {
      "sda": {
          "read_bytes": 302867968,
          "written_bytes": 4837645312
      },
      "sdb": {
          "read_bytes": 3894272,
          "written_bytes": 4096
      }
  }

6.2.1.10.4.2. Détails des compteurs cpu_stats - Statistiques sur le processeur

  • cpus - Statistiques d’utilisation des CPUs

    • cpu - Statistiques d’utilisation globales des cœurs

    • cpuX - Statistique du cœur CPU X

      • idle - Temps écoulé à ne rien faire en millisecondes

      • iowait - Temps écoulé à attendre des opérations disques en millisecondes

      • irq - Temps écoulé sur les IRQ matériel

      • nice - Temps écoulé en espace utilisateur sur des processus à priorité faible en millisecondes

      • softirq - Temps écoulé sur les IRQ matériel en millisecondes

      • system - Temps écoulé en espace noyau en millisecondes

      • user - Temps écoulé en espace utilisateur en millisecondes

    • interrupts - Nombre d’interruptions depuis le démarrage

    • processes_blocked - Nombre de processus bloqués ou death

    • processes_running - Nombre de processus en cours d’exécution

    Exemple :

    "cpu_stats": {
       "cpus": {
           "cpu": {
               "idle": 961816208,
               "iowait": 11419,
               "irq": 0,
               "nice": 0,
               "softirq": 397899,
               "system": 21788203,
               "user": 50806194
           },
           "cpu0": {
               "idle": 79960857,
               "iowait": 985,
               "irq": 0,
               "nice": 0,
               "softirq": 234748,
               "system": 1795880,
               "user": 4357374
           },
           "cpu1": {
               "idle": 80166571,
               "iowait": 951,
               "irq": 0,
               "nice": 0,
               "softirq": 88078,
               "system": 1830370,
               "user": 4138182
           }
       },
       "interrupts": 12942835029,
       "processes_blocked": 0,
       "processes_running": 1
    }
    

6.2.1.10.4.3. Détails des compteurs disks - Statistiques d’occupation des points de montage

  • /mountpoint/path - Chemin du point de montage

    • block_free - Nombre de blocks disponibles

    • block_total - Nombre total de blocks

    • inode_free - Nombre d’inodes restants

    • inode_total - Nombre totale d’inodes

    Exemple :

      "disks": {
          "/": {
              "block_free": 247909,
              "block_total": 249830,
              "inode_free": 64258,
              "inode_total": 65536
          },
          "/data": {
              "block_free": 7150076,
              "block_total": 7161801,
              "inode_free": 1827417,
              "inode_total": 1827840
          },
      }
    

6.2.1.10.4.4. Détails des compteurs emergency - Informations sur l'emergency mode du GCap

  • emergency_active - État actif ou inactif de l’emergency mode

    Exemple :

      "emergency": {
          "emergency_active": false
      },
    

6.2.1.10.4.5. Détails des compteurs gcenter - Informations sur le GCenter appairé

  • chronyc_sync - État de la synchronisation NTP avec le GCenter

  • reachable - GCenter joignable ou non (false)

    Exemple :

      "gcenter": {
          "chronyc_sync": false,
          "reachable": false
      },
    

6.2.1.10.4.6. Détails des compteurs high_availability - Informations sur la haute disponibilité (HA)

Cette fonctionnalité est obsolète.
Ces compteurs ne sont pas importants.

  • healthy - État de santé de la HA

  • last_status - Dernier état connu de la HA

  • last_transition - Date du dernier changement d’état de la HA au format ISO8601

  • leader - Vrai pour un GCap leader, faux pour un GCap follower

  • status - État actif ou inactif (false) de la HA
    Exemple :

      "high_availability": {
          "healthy": false,
          "last_status": -1,
          "last_transition": "0001-01-01T00:00:00Z",
          "leader": false,
          "status": false
      },
    

6.2.1.10.4.7. Détails des compteurs interfaces - Statistiques sur les interfaces réseaux

  • bond0 - Nom de l’interface réseau

    • rx_bytes - Nombre d’octets reçus

    • rx_drop - Nombre d’octets perdus en réception

    • rx_errs - Nombre d’octets invalides en réception

    • rx_packets - Nombre total de paquets reçus depuis cette interface

    • tx_bytes - Nombre d’octets envoyés

    • tx_drop - Nombre d’octets perdus en envoi

    • tx_errs - Nombre d’octets invalides en envoi

    • tx_packets - Nombre total de paquets envoyés depuis cette interface

    Exemple :

      "interfaces": {
          "bond0": {
              "rx_bytes": 0,
              "rx_drops": 0,
              "rx_errs": 0,
              "rx_packets": 0,
              "tx_bytes": 0,
              "tx_drops": 0,
              "tx_errs": 0,
              "tx_packets": 0
          },
          "gcp0": {
              "rx_bytes": 138433006,
              "rx_drops": 82901,
              "rx_errs": 0,
              "rx_packets": 2143236,
              "tx_bytes": 796294,
              "tx_drops": 0,
              "tx_errs": 0,
              "tx_packets": 3635
          },
          "gcp1": {
              "rx_bytes": 137642525,
              "rx_drops": 82902,
              "rx_errs": 0,
              "rx_packets": 2135060,
              "tx_bytes": 0,
              "tx_drops": 0,
              "tx_errs": 0,
              "tx_packets": 0
          }
      },
    

6.2.1.10.4.8. Détails des compteurs loadavg - Statistiques sur la charge moyenne du GCap

  • active_processes - Nombres de processus lancés

  • load_average_15_mins - Charge moyenne sur les quinze dernières minutes

  • load_average_1_min - Charge moyenne sur la dernière minute

  • load_average_5_mins - Charge moyenne sur les cinq dernières minutes

  • running_processes - Nombre de processus en cours d’exécution

    Exemple :

      "loadavg": {
          "active_processes": 561,
          "load_average_15_mins": 0.99,
          "load_average_1_min": 0.67,
          "load_average_5_mins": 1,
          "running_processes": 2
      },
    

6.2.1.10.4.9. Détails des compteurs meminfo - Statistiques sur la mémoire vive

  • available - Mémoire physique totale en kilo-octets

  • buffers - Mémoire utilisée par des opérations disques en kilo-octets

  • cached - Mémoire utilisée par le cache en kilo-octets

  • dirty - Mémoire utilisée par des opérations d’écritures en attente en kilo-octets

  • free - Mémoire inutilisée en kilo-octets

  • hugepages_anonymous - Nombre de huge pages transparentes anonymes utilisées

  • hugepages_free - Nombre de huge pages transparentes disponibles

  • hugepages_reserved - Nombre de huge pages transparentes réservées

  • hugepages_shmem - Nombre de huge pages transparentes partagées

  • hugepages_surplus - Nombre de huge pages transparentes en surplus

  • hugepages_total - Nombre total de huge pages

  • kernel_stack - Mémoire utilisée par les allocations de la pile du noyau en kilo-octets

  • page_tables - Mémoire utilisée pour la gestion des pages en kilo-octets

  • s_reclaimable - Mémoire de cache qui peut-être ré-alloué en cas de manque de mémoire en kilo-octets

  • shmem - Mémoire utilisée par les pages partagées en kilo-octets

  • slab - Mémoire utilisée par les structures de données du noyau en kilo-octets

  • swap_cached - Mémoire utilisée par le cache du swap en kilo-octets

  • swap_free - Mémoire disponible dans le swap en kilo-octets

  • swap_total - Mémoire totale du swap en kilo-octets.

  • total - Mémoire totale en kilo-octets

  • v_malloc_used - Mémoire utilisée par les grandes zones de mémoire allouées par le noyau
    Pour plus d’informations, se référer à cette documentation meminfo.

    Exemple :

      "meminfo": {
          "available": 13608896,
          "buffers": 380932,
          "cached": 1155824,
          "dirty": 28,
          "free": 13128080,
          "hugepages_anonymous": 423936,
          "hugepages_free": 0,
          "hugepages_reserved": 0,
          "hugepages_shmem": 0,
          "hugepages_surplus": 0,
          "hugepages_total": 0,
          "kernel_stack": 9152,
          "page_tables": 8400,
          "s_reclaimable": 43168,
          "shmem": 794564,
          "slab": 210008,
          "swap_cached": 0,
          "swap_free": 16777212,
          "swap_total": 16777212,
          "total": 15977468,
          "v_malloc_used": 66592
      },
    

6.2.1.10.4.10. Détails des compteurs numastat - Statistiques sur les nœud NUMA

  • nodes - Liste des nœuds NUMA

    • nodeX - Statistiques du nœud NUMA X

      • interleave_hit - Mémoire entrelacée allouée avec succès dans ce nœud

      • local_node - Mémoire allouée dans ce nœud alors qu'un processus fonctionnait dessus

      • numa_foreign - Mémoire prévu pour ce nœud, mais actuellement allouée dans un nœud différent

      • numa_hit - Mémoire allouée avec succès dans ce nœud comme prévu

      • numa_miss - Mémoire allouée dans ce nœud en dépit des préférences de processus.
        Chaque numa_miss a un numa_foreign dans un autre nœud

      • other_node - Mémoire allouée dans ce nœud alors qu'un processus fonctionnait dans un autre nœud

Exemple :

  "numastat": {
      "nodes": {
          "node0": {
              "interleave_hit": 3871,
              "local_node": 4410557829,
              "numa_foreign": 0,
              "numa_hit": 4410454203,
              "numa_miss": 0,
              "other_node": 14170
          },
          "node1": {
              "interleave_hit": 3869,
              "local_node": 4224990850,
              "numa_foreign": 0,
              "numa_hit": 4224964539,
              "numa_miss": 0,
              "other_node": 21531
          }
      }
  },

6.2.1.10.4.11. Détails des compteurs quotas - Statistiques sur les quotas par catégorie

  • quotas - Liste des quotas

    • by_gid - Statistiques triés par groupe (identifiant gid)

    • by_prj - Statistiques triés par projet (identifiant prj)

    • by_uid - Statistiques triés par utilisateur (identifiant uid)

Dans chaque catégorie, les compteurs suivant sont affichés:

  • block_grace - Temps de grâce pour les blocks

  • block_hard_limit - Limite matérielle des blocks.
    Définit une limite absolue pour l'utilisation de l'espace.
    L'utilisateur ne peut pas dépasser cette limite.
    Passée cette limite, l'écriture sur ce système de fichiers lui est interdite.

  • block_soft_limit - Limite logicielle des blocks
    Indique la quantité maximale d'espace qu'un utilisateur peut occuper sur le système de fichiers.
    Si cette limite est atteinte, l'utilisateur reçoit des messages d'avertissement quant au dépassement du quota qui lui a été attribué.
    Si son utilisation est combinée avec les délais (ou grace period), lorsque l'utilisateur continue à dépasser la limite logicielle après que se soit écoulé le délai de grâce, alors il se retrouve dans le même cas que dans l'atteinte d'une limite dure.

  • block_used - Nombre de blocks utilisés

  • file_grace - Temps de grâce pour les fichiers

  • file_hard_limit - Limite matérielle des fichiers
    Définit une limite absolue pour l'utilisation de l'espace.
    L'utilisateur ne peut pas dépasser cette limite.
    Passée cette limite, l'écriture sur ce système de fichiers lui est interdite.

  • file_soft_limit - Limite logicielle des fichiers
    Indique la quantité maximale d'espace qu'un utilisateur peut occuper sur le système de fichiers.
    Si cette limite est atteinte, l'utilisateur reçoit des messages d'avertissement quant au dépassement du quota qui lui a été attribué.
    Si son utilisation est combinée avec les délais (ou grace period), lorsque l'utilisateur continue à dépasser la limite logicielle après que se soit écoulé le délai de grâce, alors il se retrouve dans le même cas que dans l'atteinte d'une limite dure.

  • file_used - Nombre de fichiers utilisés

Exemple :

   "quotas": {
        "by_gid": {
            "0": {
                "block_grace": "0",
                "block_hard_limit": "0",
                "block_soft_limit": "0",
                "block_used": "2148952",
                "file_grace": "0",
                "file_hard_limit": "0",
                "file_soft_limit": "0",
                "file_used": "177"
            },
            "10012": {
                "block_grace": "0",
                "block_hard_limit": "0",
                "block_soft_limit": "0",
                "block_used": "5216",
                "file_grace": "0",
                "file_hard_limit": "0",
                "file_soft_limit": "0",
                "file_used": "295"
            },
            }
        },
        "by_prj": {
            "0": {
                "block_grace": "0",
                "block_hard_limit": "0",
                "block_soft_limit": "0",
                "block_used": "51600",
                "file_grace": "0",
                "file_hard_limit": "0",
                "file_soft_limit": "0",
                "file_used": "225"
            },
            "1": {
                "block_grace": "0",
                "block_hard_limit": "7980499",
                "block_soft_limit": "7980499",
                "block_used": "2101904",
                "file_grace": "0",
                "file_hard_limit": "1000",
                "file_soft_limit": "1000",
                "file_used": "43"
            },
            }
        },
        "by_uid": {
            "0": {
                "block_grace": "0",
                "block_hard_limit": "0",
                "block_soft_limit": "0",
                "block_used": "2153356",
                "file_grace": "0",
                "file_hard_limit": "0",
                "file_soft_limit": "0",
                "file_used": "269"
            },
            "10012": {
                "block_grace": "0",
                "block_hard_limit": "0",
                "block_soft_limit": "0",
                "block_used": "1032",
                "file_grace": "0",
                "file_hard_limit": "0",
                "file_soft_limit": "0",
                "file_used": "258"
            },
        }
     }

L'exemple ci après est sans limite définie : la valeur "0" indique qu'il n'y a pas de valeur définie pour les limites et les temps de grâce.

    "10012": {
         "block_grace": "0",
         "block_hard_limit": "0",
         "block_soft_limit": "0",
         "block_used": "1032",
         "file_grace": "0",
         "file_hard_limit": "0",
         "file_soft_limit": "0",
         "file_used": "258"
    },

6.2.1.10.4.12. Détails des compteurs sofnet - Statistiques sur les paquets reçus en fonction des cœurs de processeurs

  • cpus - Statistiques d’utilisation par CPU

    • cpuX - Statistiques du cœur CPU X

      • backlog_len -

      • dropped - Nombre de paquets perdus

      • flow_limit_count - Nombre de fois où la limite de débit a été atteinte

      • processed - Nombre de paquets traités

      • received_rps - Nombre de fois où le CPU a été réveillé

      • time_squeeze - Nombre de fois où le thread n'a pas pu traiter tous les paquets de son backlog dans le budget imparti

    • summed - Statistiques d’utilisation globales des cœurs

      • backlog_len -

      • dropped - Nombre de paquets perdus

      • flow_limit_count - Nombre de fois où la limite de débit a été atteinte

      • processed - Nombre de paquets traités

      • received_rps - Nombre de fois où le CPU a été réveillé

      • time_squeeze - Nombre de fois où le thread n'a pas pu traiter tous les paquets de son backlog dans le budget imparti

Exemple :

   "softnet": {
       "cpus": {
           "cpu0": {
               "backlog_len": 0,
               "dropped": 0,
               "flow_limit_count": 0,
               "processed": 448550,
               "received_rps": 0,
               "time_squeeze": 2
           },
           "cpu1": {
               "backlog_len": 0,
               "dropped": 0,
               "flow_limit_count": 0,
               "processed": 36250,
               "received_rps": 0,
               "time_squeeze": 0
           }
       },
       "summed": {
           "backlog_len": 0,
           "dropped": 0,
           "flow_limit_count": 0,
           "processed": 5239450,
           "received_rps": 0,
           "time_squeeze": 27
       }
   },

6.2.1.10.4.13. Détails des compteurs Sigflow - Informations sur Sigflow (monitoring-engine)

detailed_status - Statut du container Sigflow

  • up - État de Sigflow et du moteur de détection

detailed_status + état "up"

signification

état "Container down" + "up" false

état moteur arrêté

état "Container down" + "up" true

état impossible: appli ne peut pas tourner dans un container éteint

état "Container UP" + "up" false

état instable : appeler le support de GATEWATCHER

état "Container UP" + "up" true

état moteur démarré

Exemple :

    "suricata": {
        "detailed_status": "Container down",
        "up": false
    },

6.2.1.10.4.14. Détails des compteurs systemd - Informations du système d’initialisation

  • failed_services - Liste des services échoués rapportée par systemctl --failed.

Exemple :

    "systemd": {
        "failed_services": [ "netdata.service" ]
    },

6.2.1.10.4.15. Détails des compteurs uptime - Temps de disponibilité

  • up_seconds - Nombre de secondes écoulées depuis le démarrage.

Exemple :

    "uptime": {
        "up_seconds": 874179.8
    },

6.2.1.10.4.16. Détails des compteurs virtualmemory - Information sur l’espace d’échange (swap)

  • disk_in: Nombre de pages sauvées sur le disque depuis le démarrage.

  • disk_out - Nombre de pages sortantes du disque depuis le démarrage.

  • pagefaults_major - Nombre de page faults par seconde.

  • pagefaults_minor - Nombre de page faults par seconde pour charger une page mémoire du disque vers la RAM.

  • swap_in - Nombre de kilo-octets que le système a échangé depuis le disque vers la RAM par seconde.

  • swap_out - Nombre de kilo-octets que le système a échangé depuis la RAM vers le disque par seconde.
    Exemple :

      "virtualmemory": {
          "disk_in": 307828,
          "disk_out": 4724267,
          "pagefaults_major": 1210,
          "pagefaults_minor": 14233474300,
          "swap_in": 0,
          "swap_out": 0
      }