ryouma-nagareのブログ

IT関連をメインに書いていきます。

Zabbix Conference Japan 2016 に行ってきました

www.zabbix.com

f:id:ryouma-nagare:20161119223234p:plain 今年で3回目の参加

オープニングスピーチ: Welcome to Zabbix Conference Japan 2016!

まずはウラジシェフのお話。

  • 3.2は初めて予定通りにリリースした。
    • わずか3週間遅れです!w
  • 現在は低レイヤーのモニタリングに向いているが、今後はアプリの監視なども強化していく。
  • 3.2のタグは障害をホストではなくサービスの視点にできる
  • オープンソースではないバージョンを作るつもりはない。 * Zabbixはオープンソースであり続ける。と強い言葉。
  • ラトビアの銀行の8割がZabbixを採用している。
  • 昨年、ソースコードアーカイブは200万回以上ダウンロードされた。
  • 3.4/4.0では
    • 可視化とダッシュボード
    • よく使われている機能やアプリケーションの簡易設定監視
    • ビジネスレベルのKPI提示
    • エンタープライズ環境の包括監視ができる統合コンソール
    • 標準化

を目指していく。

zabbixを最も効率的に活用する為の統合運用監視サービスのご紹介

https://www.siterock.co.jp/service/ 日本初のMSPだそうです。

  • 自社開発していたT-BOXにお客様のZABBIXから接続する仕組みを開発。

Fluentd + Zabbix + Grafana で監視システムを構築してみよう、ほか

3回目ぐらいのお話なので聞き流し。

商用IaaSクラウド基盤ソフトウェアへのZabbix組み込みと今後に望むこと

あくしゅの山崎さん登壇。 WakameにはVMを立ち上げたときに、Zabbixにホスト登録する機能がありますよという紹介とデモ。

Zabbix 3.2新機能紹介

@ike_dai さんの発表。

  • よりナチュラルに
    • 今までは条件式を満たす=障害発生、満たさなくなった=復旧だったが、障害発生と復旧の条件式が別に扱えるようになった。
  • タグの名前に、イベントに含まれる値(IPなど)を動的に設定できる。
  • ホストグループの階層化が可能になった。
  • 今までのログ監視は1秒に1000行しか送れず、いつまでたっても処理が追いつかないことがあった。
    • maxdelayで読み飛ばすこともできるようになったが、通常は許されないと思います。
    • 素早く最新の状況を知る、が用途です。

会社で3.2を使用しているが、新機能はほとんど使用していないので参考になった。

まるごとおまかせZabbixのご紹介

http://www2.arksystems.co.jp/zabbix/moZ/

軽く聞いたが、いろいろと参考になることは多かったので、あとから詳しく見る。

zabbixから見たオープンソースの開発とビジネスの裏側

寺島代表のお話。 今年は技術ではない話をしますとの前置き。

  • 新卒で入社した会社で運用監視基盤を作るときにZabbixを知った。
  • 日本語の情報が無かったので、ZABBIXーJPのサイトを作ったり、GUIの日本語化をしていた。
  • 会社をやめる、とアレクセイに言ったら、ラトビア来ない?と言われたので即決。

  • ZABBIX社で働いてみての感想。

    • 対応が大人。ZABBIXに何かあったらそれは自分達の責任。会社のせいにしない。
    • 無駄な会議はしない。会議のための資料は作らない。
    • ZABBIXのサポートをしていて、他の知識(IPMI,SNMP,JMXとか)がいろいろ必要だったので覚えた。
  • 3.0の事例で最大98000nvpsぐらいのものがある。
  • 問題解決のために支援するという姿勢がとてもオープンソース
    • 可能な限り調べて答える。知ってることはZABBIXに限らずなんでも答える。
    • コミュニティには負けられない、という意識も。
  • ユーザから提供されるパッチの99%はそのまま使えない。
    • 社内で修正意図、コーディング規約にのっとった修正、パフォーマンス確認などを行う。
    • 最後にドキュメントを書いてリリース。
    • なので、「パッチが取り込まれた」という表現はあまり正しくない。
  • OSSマーケティングをするわけではなく、エンジニアの口コミで広がっていく。
  • なぜオープンソースなのか

    • 個人で始める開発としてベストな形態。
    • ユーザの声がモチベーションにつながる。
  • 3.2で実装された、LLDアイテムの設定変更、ホストグループの階層化は去年の懇親会で出た要望。

  • 1Uのアプライアンス(ZS-7300)を出します。監視ノード1000台程度に対応。

今まで聞いたことがなかった、ラトビアで働いていたときの話だったので非常に興味深かった。

大規模クラウド環境におけるZabbix利用事例

KCPS(KDDI クラウドプラットフォームサービス)の監視事例。

  • ZABBIXもフルACT構成。
  • インターネットはインアウトとも無料
  • イントラとの接続も無料

CloudStackのログとZabbixのログで障害箇所/影響範囲を判定する話はアイデアとしてメモしておく。

OpenBlocks IoTファミリをZabbixの現場で使い倒す

ほぼZABBIX関係ないw

趣味でOpenBlocksにインストールしただけの模様。

レスポンスが遅い?そのイライラ時間を見える化 -従来のシステム監視手法では不可能だったユーザ体感測定を実現-

これもほぼZABBIX関係なかった。

監視システムの高度化に向けたZabbixの活用について

去年の懇親会でLTされた方が今年はメインセッションに登壇。

光回線、光電話などの監視をZABBIXにした話。

この方も個人的にZABBIXが好きで仕事に持ち込んでしまった感じ。

  • ZABBIX2.2のGUIがイケてないので、既存の監視システムに似せた画面を実装しました。
    • 機能を盛り込みすぎて遅くなってしまった…
  • ACT-ACT構成冗長化なので、ホスト登録などはラッパーの画面を実装して、裏でAPIを叩くようにしています。

Interop Tokyo 2016におけるShowNet運用監視について

Interopの裏側の話。

世界初の機器を持ち込むのでMIBがないなど、色々な苦労話が面白い。

  • ZABBIXのアラーム→slackへ通知→解析→ライブでファームのデバッグ

とか、なにこのライブDevOpsという感じ。

Interop Tokyo 2016 ShowNetでのZabbix活用

ネタがかぶるので、Interopの話はほぼスルーでお話されていました。

  • チェック項目1つで、/24のディスカバリは15分弱かかる。
  • チェックルールのIDで担当するDiscovererのプロセスは決まってしまう。
    • 担当Discovererプロセス=ID%プロセス総数+1
    • ということでIDが歯抜けになると、担当するプロセスが偏ることになる。

ディスカバリルールの問題は勉強になった!

Zabbixによるクラウド監視の勘所 -AWS監視テンプレートのご紹介-

CloudWatchではAWSが提供するリソース監視しかできないので、MWなども含めてテンプレートを作成。 テンプレート自体はOSSとして公開。

●6つの機能

  • メトリクス監視
  • 稼働状況監視
  • イベント情報監視
  • 課金情報監視
  • AutoScaling自動監視
  • Lambda連携

一日あっという間に終わりました。

懇親会

LTが濃いです。

zabirepo素晴らしいので、使わせていただこう。

ノベルティなど

Tシャツとストレスキューブを買いました。 f:id:ryouma-nagare:20161119223239p:plain