はじめに
オライリーの入門 監視を読みましたので感想文です。
入門 監視
https://www.oreilly.co.jp/books/9784873118642/
監視の考え方
一番、印象的だったのがシステムの監視をする際にCPU使用率だったりメモリ使用率だったりを取得するわけですが、それ自体はそれほど役に立たないという趣旨の記載の部分でした。
実際、CPU使用率高騰でアラートメールを受信することは多いのですが、理由がバッチ処理で一時的に負荷がかかっているだけで、システムとしては正常というケースが多いので、疑問を感じていました。ユーザから観て、正常に動作しているのかどうかという視点でアラートを考えるべき、というのが腹にストンと落ちる感じがしました。
メトリクスの重要性
また、ちょうど業務で不審な通信の有無を探すということをやって、ログからそうした傾向を調査しようとしていろいろ試行錯誤をしていたところ、メトリクスの重要性を感じるきっかけにもなりました。
ログそのものではなくて、メトリクス(ゲージやカウンタ)という形で普段から取得しておくことで、いざそういう調査をする際に速やかな調査が可能になるな、というのを感じました。
これまでGrafanaやKibanaをうまく活用しきれていないと感じていたので、それらをどう活用するかの方向性が見えたような気がしました。
まとめ
ちょうど読んだタイミングが良かったのだと思いますが、この本に書かれている内容を実感するような実例を業務で携わることもできて、まさに自分が求めていることが書かれている!という感想を持ちました。
オススメです!