ポジション概要
大量のデータと高いトラフィックのもとでの分散データベースの管理、運用、そしてトラブルシューティングを通して高い信頼性目標を達成するStorageのDevOpsを担当
業務詳細
「LINE」のMessaging PlatformやDeveloper Product Platformの専任のStorage Operations Engineerとして大量のデータと高いトラフィックのもとでの分散データベースの管理、運用、そしてトラブルシューティングを通じて高い信頼性目標の達成に貢献する業務を担当いただきます
また、ツール、自動化、ワークフローの開発を通じて、運用プロセス、コストおよびパフォーマンスの最適化も担っていただきます。
主な業務内容
・データベースインスタンスのデプロイ、再起動、更新などの運用や管理
・ツール、自動化、infrastructure as a code, pipelinesの開発により、運用プロセス、コスト、パフォーマンスを最適化
・オンコール業務、監視、トラブルシューティング、インシデントや障害を支援
・SRE/DBREチームと一緒に高可用性目標の達成に貢献
・必要に応じて、CSやQA、その他の開発チームと協力して問題を解決
必要な経験/スキル
・DevOpsの経験
・インフラとネットワークの基礎知識
・分散システムまたは分散データベースの基礎知識
Shell、Python、Rubyなどのスクリプト言語や、AnsibleやChefなどのオーケストレーションツールを使用したサーバーインスタンスの構築自動化および保守作楽の経験
・Experience with observability (monitoring) tools and best practices.
トラブルシューティング、根本原因の評価スキル、クリティカルインシデント対応および事後分析の経験
・システムオンコールの経験
言語:
・日本語でのビジネス会話スキル(中級または上級程度必須)
・英語力(社内外の開発者に対する文書コミュニケーションや報告のスキル)
あると望ましい経験/スキル
・大規模インフラや高トラフィックを扱うサービスに発生するハードウェアおよびソフトウェアの問題を操作し、解決し、改善する経験
・SRE(Site Reliability Engineering)の概念とベストプラクティス
・システムのパフォーマンス最適化に関する経験
・BCP/DR対策に関する経験
求める人物像
・業務の流れを改善し、コストと性能を最適化することが得意な方
・現在の問題に対処するだけでなく、組織全体の運用効率を向上させるソリューションを提供することで、発生しうる問題を積極的に予防するソリューション設計ができる方。
・大規模インフラや多くのトラフィックを扱うサービスにおける、ハードウェアおよびソフトウェアの問題を運用し、解決し、改善するための深い知識と経験を持つ方
・問題の根本原因を適切に評価し、効果的な解決に取り組める方
・自身の提案、観察、結果を正確に説明し、チームが手順を理解し、フォロー可能な状態にできる方
・システムの監視、問題の検出、即時の対応を通じて、高い信頼性基準を確保し、定義されたSLOを調整するために、SRE/DBREと共に貢献できる方
【東証プライム上場 純水製造装置に強みを持つ水処理エンジニアリング企業】 情報システム部 社内SE(管理職)
株式会社エリートネットワーク 情報管理部 社内SE
世界最大級の発電規模と燃料取扱量を誇るグローバルエネルギー企業 ICT統括推進部 アプリケーション開発担当
日本企業の長期的な成長を支える、新しい金融の仕組み作りに挑戦中です
オルタナティブ市場成長の担い手として。個が経験を活かし、チームワークで価値を生み出す運用会社です。
大企業から中堅中小企業まで。 サステナビリティの視点で ビジネスの成長ストーリーを描く。
「成長の果実」を従業員の手に。 世界と日本で多くの企業が待ち望む、 新たな報酬制度の運用を支えたい。
世界のスタートアップに投資し、 中長期的な成長に伴走していく。 日本の農林水産業と、食料が育むいのち、 そして地域を元気にするために。
世界No.1の実績を持つM&A総合企業として、地方創生から日本の新たな成長を支え続けたい。未経験者も3年で高い成長実感が得られます。