第3回勉強会「Data Engineering Study #3」では「データ分析基盤を組織に浸透させる方法」について学びました。
データ分析基盤の構築については、第1回から第3回で一通り網羅的に学ぶことが出来たと思います。
そこで今回は、実際に基盤運用フェーズで向き合わなければならない「障害対応
」を題材に取り上げることにしました。
今回は基調講演と事例講演は無く、全て10分のLTで構成されています。10分の中に非常に濃い情報が詰まっていますので、是非皆様もご参考になさって下さい。
当日の発表内容は上記YouTubeでご確認頂けます。
LT1「正確な意思決定を阻む問題・障害との向き合い方」

株式会社はてな Mackerelチーム Customer Reliability Engineerに所属されている、吉田康久 氏(@syou6162)。
データ分析ではよくある問題・障害とその対策についてお話しいただきました。
LT2「データ分析基盤の障害を未然に防ぐためのチェックリスト」

ユビー株式会社に所属し、データエンジニアをされている、田中 聡太郎 氏(@__sotaron__)。
https://twitter.com/__sotaron__
障害対応をどうするかではなく、未然に防ぐためにどうすべきかをお話しいただきました。
▼登壇資料はこちら
https://speakerdeck.com/tanakarian/checklist-for-preventing-incidents-of-data-management-system
LT3「IoTデバイスデータ収集の難しい点」

株式会社Mobility Technologiesに所属し、データエンジニアをされている渡部 徹太郎 氏(@fetarodc)。https://twitter.com/fetarodc
障害対応の中でも、IoT分野に特化したコアなお話をして頂きました。
▼登壇資料はこちら
https://www.slideshare.net/tetsutarowatanabe/iot-239080886
LT4「障害、解決、その先に」

フリーランスでデータ分析基盤構築を主業務とされている岩崎晃 氏(@sista05)。https://twitter.com/sista05
データ分析基盤で岩崎氏がよく使う構成と、そこで遭遇した障害対応についてお話しいただきました。
LT5「障害はチャンスだ! 障害を前向きに捉える」

株式会社リクルートでデータエンジニアをされている山田 雄氏(@nii_yan)。https://twitter.com/nii_yan
発生してしまった障害に対し、どのような対応を行うか。また、障害対応というものをどう捉えるかをお話しいただきました。
▼登壇資料はこちら
https://speakerdeck.com/yuyamada/zhang-hai-hatiyansuda-zhang-hai-woqian-xiang-kinizhuo-eru
LT6「バッチとストリーミング、それぞれの障害に立ち向かう」

株式会社メルカリでデータエンジニアをされている大久保諒氏(@syu_cream)。
大久保氏がメルペイで実際に運用していたバッチ・ストリーミングについて、実際に起こった障害と対応についてお話しいただきました。
▼登壇資料はこちら
https://speakerdeck.com/syucream/batutitosutorimingu-sorezorefalsezhang-hai-nili-tixiang-kau
<次回のData Engineering Studyのお知らせ>
次回のData Engineering Study(第5回)は、最近話題のDWH「Snowflake」についての勉強会を予定しています。開催日は12/2(水)を予定しています。下記のURLから、ぜひご予約ください!
https://forkwell.connpass.com/event/194269/
▼アーカイブ動画
https://www.youtube.com/watch?v=IC44rPbYA4s&ab_channel=DataEngineeringStudy