Utilisation de l'outil Nagiostats


Introduction

Un outil appelé nagiostats est inclus dans la distribution de Nagios. Il est compilé et installé avec le démon principal de Nagios.

L'outil nagiostat vous permet d'obtenir diverses informations sur le processus Nagios. Vous pouvez obtenir les informations soit dans un format compatible avec MRTG soit dans un format intelligible.

Instructions d'utilisation

Vous pouvez lancer l'outil nagiostats avec l'option --help pour avoir les informations d'utilisation :

[nagios@lanman ~]# /usr/local/nagios/bin/nagiostats --help

Nagios Stats 2.0a1
Copyright (c) 2003 Ethan Galstad (nagios@nagios.org)
Last Modified: 11-18-2003
License: GPL

Usage: /usr/local/nagios/bin/nagiostats [options]

Startup:
 -V, --version      display program version information and exit.
 -L, --license      display license information and exit.
 -h, --help         display usage information and exit.

Input file:
 -c, --config=FILE  specifies location of main Nagios config file.

Output:
 -m, --mrtg         display output in MRTG compatible format.
 -d, --data=VARS    comma-seperated list of variables to output in MRTG
                    (or compatible) format.  See possible values below.
                    Percentages are rounded, times are in milliseconds.

MRTG DATA VARIABLES (-d option):
 NUMSERVICES        total number of services.
 NUMHOSTS           total number of services.
 NUMSVCOK           number of services OK.
 NUMSVCWARN         number of services WARNING.
 NUMSVCUNKN         number of services UNKNOWN.
 NUMSVCCRIT         number of services CRITICAL.
 NUMSVCPROB         number of service problems (WARNING, UNKNOWN or CRITIAL).
 NUMHSTUP           number of hosts UP.
 NUMHSTDOWN         number of hosts DOWN.
 NUMHSTUNR          number of hosts UNREACHABLE.
 NUMHSTPROB         number of host problems (DOWN or UNREACHABLE).
 xxxACTSVCLAT       MIN/MAX/AVG active service check latency (ms).
 xxxACTSVCEXT       MIN/MAX/AVG active service check execution time (ms).
 xxxACTSVCPSC       MIN/MAX/AVG active service check % state change.
 xxxPSVSVCPSC       MIN/MAX/AVG passive service check % state change.
 xxxSVCPSC          MIN/MAX/AVG service check % state change.
 xxxACTHSTLAT       MIN/MAX/AVG active host check latency (ms).
 xxxACTHSTEXT       MIN/MAX/AVG active host check execution time (ms).
 xxxACTHSTPSC       MIN/MAX/AVG active host check % state change.
 xxxPSVHSTPSC       MIN/MAX/AVG passive host check % state change.
 xxxHSTPSC          MIN/MAX/AVG host check % state change.
 NUMACTHSTCHKxM    number of active host checks in last 1/5/15/60 minutes.
 NUMPSVHSTCHKxM    number of passive host checks in last 1/5/15/60 minutes.
 NUMACTSVCCHKxM    number of active service checks in last 1/5/15/60 minutes.
 NUMPSVSVCCHKxM    number of passive service checks in last 1/5/15/60 minutes.

 Note: Replace x's in MRTG variable names with 'MIN', 'MAX', 'AVG', or the
       the appropriate number (i.e. '1', '5', '15', or '60').

[nagios@lanman ~]# 

Affichage intelligible

Pour une utilisation normale, lancez l'outil nagiostat, en spécifiant uniquement le chemin du fichier de configuration en argument, comme suit :

[nagios@lanman ~]# /usr/local/nagios/bin/nagiostats -c /usr/local/nagios/etc/nagios.cfg

Nagios Stats 2.0a1
Copyright (c) 2003 Ethan Galstad (nagios@nagios.org)
Last Modified: 11-18-2003
License: GPL

CURRENT STATUS DATA
----------------------------------------------------
Status File:                          /usr/local/nagios/var/status.dat
Status File Age:                      0d 0h 0m 13s
Status File Version:                  2.0-very-pre-alpha

Program Running Time:                 14d 17h 19m 13s

Total Services:                       32
Services Checked:                     32
Services Scheduled:                   29
Active Service Checks:                29
Passive Service Checks:               3
Total Service State Change:           0.000 / 65.530 / 2.930 %
Active Service Latency:               0.048 / 14.837 / 1.035 %
Active Service Execution Time:        0.076 / 60.006 / 4.301 sec
Active Service State Change:          0.000 / 10.530 / 0.762 %
Active Services Last 1/5/15/60 min:   1 / 13 / 29 / 29
Passive Service State Change:         0.000 / 65.530 / 23.883 %
Passive Services Last 1/5/15/60 min:  0 / 0 / 0 / 0
Services Ok/Warn/Unk/Crit:            23 / 5 / 1 / 3
Services Flapping:                    1
Services In Downtime:                 0

Total Hosts:                          9
Hosts Checked:                        9
Hosts Scheduled:                      9
Active Host Checks:                   9
Passive Host Checks:                  0
Total Host State Change:              0.000 / 28.420 / 4.034 %
Active Host Latency:                  0.000 / 15.741 / 5.443 %
Active Host Execution Time:           1.022 / 10.032 / 3.047 sec
Active Host State Change:             0.000 / 28.420 / 4.034 %
Active Hosts Last 1/5/15/60 min:      0 / 8 / 9 / 9
Passive Host State Change:            0.000 / 0.000 / 0.000 %
Passive Hosts Last 1/5/15/60 min:     0 / 0 / 0 / 0
Hosts Up/Down/Unreach:                7 / 1 / 1
Hosts Flapping:                       0
Hosts In Downtime:                    0


[nagios@lanman ~]# 

Comme vous pouvez le constater, l'outil affiche un bon nombre de mesures concernant le processus Nagios. Les mesures qui ont des valeurs multiples sont (sauf mention contraire) les valeurs min, max et moyenne pour cette mesure particulière.

Intégration à MRTG

Vous pouvez utiliser l'outil nagiostat pour afficher diverses mesures de Nagios avec MRTG (ou tout autre programme compatible). Pour cela, lancez nagiostat en utilisant les arguments --mrtg et --data. L'option --data est utilisée pour spécifier que les statistiques sont destinées à être représentées graphiquement. Les valeurs possibles pour l'option --data sont listées en lançant l'outil nagiostat avec l'option--help.

Voici un extrait de fichier de configuration MRTG utilisé par l'outil nagiostat pour représenter graphiquement le temps moyen de latence et d'exécution d'un service.

# Service Latency and Execution Time
Target[nagios-a]: `/usr/local/nagios/bin/nagiostats --mrtg --data=AVGACTSVCLAT,AVGACTSVCEXT`
MaxBytes[nagios-a]: 100000
Title[nagios-a]: Average Service Check Latency and Execution Time
PageTop[nagios-a]: <H1>Average Service Check Latency and Execution Time</H1>
Options[nagios-a]: growright,gauge,nopercent
YLegend[nagios-a]: Milliseconds
ShortLegend[nagios-a]: &nbsp;
LegendI[nagios-a]: &nbsp;Latency:
LegendO[nagios-a]: &nbsp;Execution Time:
Legend1[nagios-a]: Latency
Legend2[nagios-a]: Execution Time
Legend3[nagios-a]: Maximal 5 Minute Latency
Legend4[nagios-a]: Maximal 5 Minute Execution Time

Les graphes MRTG générés par l'extrait de configuration ci-dessus ressemblent à ceci :

MRTG Stats