Munin S3 krātuves pārraudzības spraudnis

Šajā lapā ir aprakstīts, kā izveidot Munin S3 krātuves satura pārraudzības spraudni.

Spraudņa sagatavošana

  1. Uz Munin mezgla, kurā tiek veikta pārraudzība, kā root lietotājs, piemēram, mapē /home/bin izveido izveido failu, backup_ ar sekojošu saturu:

    #!/bin/bash
    #set -x
    bucket="mybucket"
    item=$(basename $0 | sed 's/^backup_//g')
    logdir="/tmp"
    prefix="backup_size"
    day=$(date +%Y-%m-%d -d "yesterday")

    case $1 in
       config)
       echo "graph_title Last backup size for $item"
       echo "graph_info The size of the $item backup for the last day."
       echo "graph_args --base 1000 -l 0"
       echo "graph_scale yes"
       echo "graph_category other"
       echo "graph_vlabel size"
       echo "size.label backup size"
       echo "size.warning 1:"
       echo "size.info Size of the last backup."
       exit 0;;
    esac

    cd $logdir
    echo "size.value $(cat ${prefix}_$item 2>/dev/null || echo 0)"

    logfile=$(find ${logdir} -maxdepth 1 -name ${prefix}_$item -type f -mtime -1 2>/dev/null)
    if [ "$logfile" == "" ]; then
      sizes=$(aws s3 ls s3://${bucket}/${item}/ | egrep "^${day}" | awk '{print $3}')
      sum=0
      for size in $sizes; do
        sum=$(($sum + $size))
      done
      echo $sum > ${prefix}_$item
    fi
    1. Uzliek failam izpildes tiesības:

      chmod +x backup_
    2. Mapē /etc/munin/plugins izveido simboliskās saites, kuru nosaukuma beigās iekļauj pārbaudāmo apakšmapju saturu, piem.:

      ln -s /home/bin/backup_ /etc/munin/plugins/backup_server1
      ln -s /home/bin/backup_ /etc/munin/plugins/backup_server2
      ...
    3. Pārliecinās, ka palaižot skriptu no simboliskās saites, tas atgriež aptuveni sekojošu rindu:

      size.value 1234
    4. Failā /etc/munin/plugin-conf.d/munin-node pievieno rindas:

      [backup_*]
      user root
      timeout 240
    5. Pārstartē Munin mezglu:

      /etc/init.d/munin-node restart

    Brīdinājumu iestatīšana

    1. Failā /etc/munin/munin.conf pievieno rindas:

      ...
      [backup_node]
          backup_server1.size.critical  100000:
          backup_server1.size.critical  0:
          backup_server1.size.warning   0:
      ...
      kur
      • backup_node ir pārraugāmais rezerves kopiju serveris,
      • backup_server1.size.critical  100000: ir izmainīto baitu skaits, zem kura kopija tiks uzskatīta par neizdevušos (iestata vadoties no faktiskā rezerves kopiju apjoma),
      • backup_server1.size.critical  0: trauksmes ziņojums ir atslēgts (jo atgrieztā vērtība nekad nav mazāka par 0)
      • Ja nepieciešams, līdzīgi katrai mapei var izmainīt arī ...warning  vērtību.
    2. Uzgaida 5-10 minūtes, lai pārliecinātos, ka ar jaunizveidotajiem spraudņiem tiek savāktas vērtības.

    Saites

Izveidojis Valdis Vītoliņš 2017-09-02 15:57
Pēdējais mainījis Valdis Vītoliņš 2017-09-21 16:49
 
Xwiki Powered
Creative Commons Attribution 3.0 Unported License