はじめまして。ChatWork SREチームの坂本です。先日の東京マラソンで無事にサブ3.5を達成しました。サブ3.5は1QのOKRの1つだったので、無事に達成できて何よりです。
さてさて、先日、弊社の冨田が下記のブログを公開したところ、ユーザベース様より、SRE Loungeへのお誘いを頂き、その取り組みに共感し、参加させて頂きました。
SRE Loungeについては、下記のユーザベース様のブログをご参照ください。
場所は、弊社シアタールームにて、ユーザベース様のお声がけにより参加したのは下記の企業となります(敬称略)。
- 株式会社クラウドワークス
- 株式会社スタディスト
- 株式会社ユーザベース
- ChatWork株式会社
以降、会社名の敬称は略させて頂きます。
準備
飲み食いしながら、ゆるふわでやりましょう、という感じで、今回は弊社で飲み物と軽食(食べ物はユーザベース様)を用意させて頂きました。 買い出しの様子。近くの成城石井でクラフトビール(自分たちが飲みたかった)を買ってきました。 来客用の冷蔵庫を占領、っと。
発表
ピザなどをもぐもぐしながら聞きました(シアタールーム、遮断性が高いので臭いこもっちゃうw)。 以降、発表順に記載していきます。
ChatWork
ChatWorkでは、id:cw-tomitaが発表しました。
マイクロサービス、近年話題ではありますが、弊社ではうまくできている感じはなく、なんとかenvoyをいれたいねーという話をちょくちょくしていて、その文脈で、この発表内容となっております。 istioについては、ChatWork技術顧問こと@mumoshuも下記のように言っており、二の足を踏んでいる状態です。
こういうことをGoogleの人がちゃんと言ってくれるのがありがたい(僕も事あるごとに言ってるけど、重みが違いますよね https://t.co/6zDJ9yyXGY
— Yusuke KUOKA (@mumoshu) 2018年2月23日
名言も飛び出しました。
クラウドワークス
クラウドワークスは森田さんが発表してくださいました。
Redshiftの悩みなどは、各社共通でありそうな気がしたので、使ってみたいですねー。
また/var/log/secure
からsshの監視をしているなど、fluentdもうまく利用されているなーと思いました。
そのほか各ツールを自作、OSS公開されていて、同じような悩みを持つところが多いので、試してみたいと思います。
森田さんがTerraformおたく、ということで、ちょいちょいtfstateを直に触っちゃう坂本としてはだいぶ共感を持ちました。 私はTerraformおたくではないです。
スタディスト
スタディストの唯一無二のSREエンジニア、北野さんが発表してくださいました。
SRE本を読み込まれていて、自分たちの環境への落とし込みがうまいなーと感じました。 全サーバのAnsible化もやりきられた、ということで今後のサーバ管理コストがぐっと減りそう。 Performance Working Groupという取り組みも見習いたい。特にアウトプットを出す、というは重要ですね。 こういう取り組みって、"よしやるぞ"から、"あれ、なんで集まっているんだっけ"に変わることが多く...。
Performance Working Groupについては、北野さんが下記のブログに記載してくださっています。
ユーザベース
ユーザベースは阿南さんが発表してくださいました。
SRE側で把握するのが難しいエラーをどうやって検出するか、の試みが興味深いものでした。 "SRE"という側面で見ると、まさにそれはサイトの信頼性に関わるものなので、今後の取り組みも継続して伺いたい内容でした。
まとめ
SREって、ビジネスドメインから少し離れていることが多いためか、悩みが似ている(むしろ同じ)な、と改めて思いました。 だからこそこういう場で、フランクに内容を共有できると、"あ、それはうちと同じ問題だし、そういう解決策もあるのか"という学びに繋がることを実感しました。
SRE Lounge、すばらしいですね。このような企画に誘っていただき、改めてありがとうございました。 1回だけの参加ではないですよね...?
ということで、他社の事例もバンバン取り込んで、ChatWorkを盛り上げたい!というSREエンジニア、大募集しております!