この日記は https://yapud.hatenablog.com/ に引っ越し中
2013-09-26
_ [Zabbix] OSS運用管理勉強会で勉強になった
第2回 OSS運用管理勉強会 で話を聞いてきました。テーマが「Zabbixのトラブル事例のあるある」ということでトラブルの可能性は知っておいて損無いですから。
ひとつめ、宮下氏の話はサポート業務でよくある問い合わせ「ログについて」というところ。
・log[] か logrt[] か
/var/log/messages はローテートするから log[] じゃなくて logrt[] を使え、とのこと。ただし logrt はファイルの更新を mtime で判断するから同一 mtime のファイルがあれば全部読んでしまうよという点が注意点。うまく条件を組み合わせるなどして一つに絞り込めれば大丈夫。
ふたつめ、米田氏の話は運用全般の中でどの辺でZabbixが使えるのかというところ。
開発する人、運用する人、ビジネスのオーナー、みんなが状況共有できてないと良い関係で継続的な改善はできないよと。運用監視ツールなどはみんなで状況を共有するのに使えるんだよと。
・ITサービス
ITサービスの機能は使ったことがありませんでした。いくつかのアイテムを監視していてどのアイテムとどのアイテムがダメになったらサービスとしてダメになるのかという複数の条件を組み合わせてアラートを出せます。
各要素を見ている運用担当は細かい単位でアラートが欲しいですが、ビジネスオーナーは「結局それでサービスは継続できてるの?」というところなので、欲しい情報が違うわけです。立場によって出すアラートの意味を変えれるのは便利。
・グラフにプロットする値のタイムシフト
グラフに現在のデータと例えば一週間前のデータを重ねて表示できる、タイムシフトした値を使うことができるようになっていますよと。
例えばここ一週間の平均値と本日のとグラフを重ねて表示することができて、そうすると傾向の差異が可視化されて異常値も見つけやすくなるんじゃないですかという。これは後で設定してみたい。
等々の話を聞くことができました。知らなかった話が聞けて試したいことが増えました。
前 | 2013年 9月 |
次 | ||||
日 | 月 | 火 | 水 | 木 | 金 | 土 |
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |