メインコンテンツに移動
Blogger
ブロガー紹介
Share :

SeishiOuchi

NTT Communications マネジメントサービス部

大内 聖紫

2010年から現在の部署(マネジメントサービス部)に所属し、主に法人のお客様のシステム監視・運用を担当しています。
お客様システムに合わせて個別に監視・運用設計を行うことも多く、多種多様なシステム構成やツールに触れています。
普段は開発とはほとんど縁がなく、お客様やパートナー企業様とのコミュニケーションが主たる業務となっています。

Zabbix APIで監視データを取得して異常値分析をやってみる

事例紹介2017/4/24SeishiOuchi

はじめに

私の所属している部署では、主に法人のお客様のシステム監視・運用を24H365Dの体制で実施しています。
運用部隊にとっては、日々の運用業務を高度かつシンプルにしていくことが永遠の課題です。常にチームの業務を振り返り、どこか効率化できることはないかと模索しています。

数ある業務の中で今回は「監視データの異常分析」に注目します。
ある程度大きなシステムを運用していると、キャパシティ管理や障害の予兆キャッチの観点から、「ある期間の監視情報を調査してトピックを抜き出す」という作業が定期的に必要になります。
基本は人が監視データとにらめっこしながら変化点がないか調査するのですが、対象も多く、かなりの手間を要する作業です。
これをもっと手軽に実行できないかと思い、軽い検証をやってみました。

検証内容

検証には監視ツールと分析ツールが必要です。今回の道具としては、これらを使います。

zabbix

SeishiOuchi を購読