2017-01-30 SRE Tech Talks #2
SRE Tech Talks #2
https://eventdots.jp/event/609456
参加しました。
雑だけど個人memo。
■株式会社メルカリ - SRE 久保達彦 @cubicdaiya
On-call Engineering
https://speakerdeck.com/cubicdaiya/on-call-engineering
SRE 当番制のもろもろの仕組みをエンジニアリングで解決
Slack botにて。勤怠、緊急連絡
PagerDuty APIとGoogle Apps Script(スプレッドシート)を活用
質疑応答
・だいたい4,5人で回している
・頻度は1ヶ月に1回も無いくらい(直近は2、3ヶ月前)
■サイボウズ株式会社 運用本部・サービス運用部・SRE 深谷敏邦 @toshi_pp
cybozu.com のデータバックアップとリストア、それを活用したリハーサル
SREとバックアップ
できるだけ安全にやるために
事前レビュー
ペアオペレーション
(第6感で「危ない」と気づく人がいるw)
バックアップ。あると「安心感」
DM Thin Provisioning(dm-thinp)を活用
バックアップを実際に使うことは99%使わない
アップデートのリハーサルで利用
■クックパッド株式会社 インフラストラクチャー部 SRE グループ長 星 北斗 @kani_b
cookpad.com 全 HTTPS 化の軌跡
SRE/情シス/セキュリティ がグループ別れている
SREグループは9名
動機
セキュリティ、非SSLなログインフォーム(ポップアップダイアログなど)
暗号化の必要性
保護したい情報は利用者が決められるべき
前提として通信は暗号化する
外圧:ATS、Chrome、検索エンジンなど
新技術:HTTP2、ServiceWorker、使い分けの煩雑化→使い分けは事故の元
懸念
広告・・・HTTPS対応してないものもあった
対応
とにかくmixedコンテンツへの対応がほぼんど
CSP使うとエレガントに対応できる
protocol-relative なURL(//から始まるやつ)に変更
全社への説明重要 色んな人をまきこむので、コミュニケーション重要
httpd.confのURL rewriteへの対応
集計系に影響する可能性あり
セキュアクッキーとHSTS対応が残ってる
■株式会社ミクシィ XFLAG™スタジオ ゲーム開発室 SREグループ 清水 勲 @isaoshimizu
SREグループができてこの半年間やってきたこと
https://speakerdeck.com/isaoshimizu/sregurupugadekitekofalseban-nian-jian-yatutekitakoto
PagerDuty使っている
MySQLチューニング
innodb_io_capacity
innodb_spin_wait_delay
OSアップデート
THP と NUMAの設定要注意
■さくらインターネット株式会社 技術本部エンジニア 山田修司 @uzyexe
Arukasの運用事例と、末永くインフラ運用していくためのTips
Arukas:Docker Hostingサービス
利益と信頼関係の両立
「Hope is not a storategy」(SRE本)
PagerDutyを利用
「インフラに強いエンジニアが少ない」「アプリエンジニアの方が多い」
品質のために「入場制限」をかける
可用性における問題:ヒューマンエラー