채용개발

상시 채용 경력(1년 이상)

SRE, 클라우드 엔지니어 (8년 이상)

스윗코리아 · 서울 강남구

이직시200만원

🚀팀 소개
Cloud팀은 Swit 서비스의 기반이 되는 클라우드 환경을 설계/프로비저닝하고, SRE 체계를 기반으로 글로벌 사용자들이 항상 신뢰도 높은 서비스 경험을 하실 수 있도록 서비스 엔지니어링을 수행하는 미션을 담당하고 있습니다.

저희는 소프트웨어 엔지니어링을 활용하여 모니터링, 긴급대응, 서비스 수준관리, 변화관리, 수용량 계획, 비용 최적화 등의 업무를 수행합니다. IaC 기반의 멀티 클라우드 설계, 마이크로서비스 엔지니어링, SRE 체계의 실현 등을 통하여 DT 트랜드 리딩을 열망하고, ICT 스페셜리스트로서 성장하기를 바라는 분이라면 목표를 성취하며 즐겁게 일하실 수 있는 팀입니다.

작은 실패를 두려워하지 않고, 좋은 동료들과 소통하며, Swit과 함께 성공 사례를 하나씩 만들어가기를 원하시는 예비 Switmate 여러분을 환영합니다!

🚀주요업무
▶︎ 모니터링/긴급대응
클라우드 네이티브 마이크로서비스에 대한 이해와 경험을 기반으로 모니터링 툴을 셋업하고 최적화하여, 실질적인 장애와 이슈를 빠르게 감지할 수 있게 합니다. 장애상황 발생 시에는 MTTR을 최소화하기 위해 초기 대응을 담당하며, 장애가 장기화 될 경우 장애 대응의 컨트롤 타워 역할 및 서비스 정상화를 위해 필요한 모든 조치를 수행합니다.
✓ Problem Management 대한 이해 및 실행
✓ Dynatrace, Datadog 등의 APM의 Problem Alerts에 대한 분석, 최적화
✓ 주요 CSP 모니터링 셋업 및 Metrics & Alerts 최적화 (GCP, AWS, NCP, K8s)
✓ Prometheus, Grafana 등 모니터링 툴과 Splunk, ELK 스택 등 로깅 도구 구성 및 사용
✓ 클라우드 네이티브 어플리케이션 개발/운영 경험

▶︎ 릴리즈 엔지니어/소프트웨어 엔지니어링
애플리케이션과 업데이트의 지속적인 통합, 제공 및 배포를 촉진하기 위해 배포 파이프라인, 워크플로 및 릴리즈 프로세스를 설계, 구현 및 자동화합니다. 지속적인 무중단 배포를 위해 롤링 업데이트, 카나리, 블루/그린 등과 같은 디플로이먼트 전략을 실행하기 위해서 현재의 소프트웨어, 클라우드 아키텍처를 잘 이해하여 개선안을 제시하며 배포 파이프라인을 최적화하여 릴리즈를 실행합니다.
✓ Go, Node.js, Java 등 프로그래밍 언어 사용경험, Terraform, Ansible 등 IaC 기반 클라우드 운영
✓ Repository 관리, 컴파일을 위한 빌드 규칙 정의, 테스트 및 패키징 실행
✓ 단계별 변경 적용 전략, 서비스 중단 없이 새로운 릴리즈 배포, 롤백 방법

▶︎ 클라우드 엔지니어링/시스템 성능테스트
클라우드 기반 시스템과 인프라를 설계, 구현, 유지 관리합니다. IaC 기반으로 클라우드 프로비저닝 및 관리를 자동화하고 시스템의 확장성, 보안 및 성능을 보장합니다. 모니터링 기반의 인프라 병목 구간을 식별하여 개선하며, 비즈니스 성장 계획에 대응하기 위한 클라우드 용량 관리를 하며, 적절한 인프라 용량을 확인 및 보장하기 위해 시스템 성능테스트를 수행하고, 결과에 따른 클라우드 확장 계획을 수립하고 실행합니다.
✓ GCP, AWS, NCP, On-Premise K8s 구축 운영 경험
✓ IaC(Infrastructure as Code) 기반의 인프라 프로비저닝 및 관리 자동화를 위한 Terraform, Ansible 또는 CloudFormation과 같은 도구 사용 경험
✓ 분산 시스템, 마이크로서비스 아키텍처 및 클라우드 네이티브 애플리케이션에 대한 이해
✓ 컨테이너 기반 마이크로서비스 성능테스트 시나리오 작성/실행
✓ 서비스 성장 계획에 따른 클라우드 용량 관리 및 비용 최적화 전략 실행

🚀자격요건
유관 업무 경력 8년 이상인 사람 (신입 지원 불가)
위 직무 업무/책임 설명의 최소 1개 역할을 수행할 수 있는 역량/스킬셋을 보유한 사람
대규모 엔터프라이즈 클라우드 환경에서 SRE로서 클라우드/서비스 운영 경험이 있으신 분
나이/성별/학력/전공 무관

🚀우대사항 (하기 내용 중 3가지 항목 이상의 경험과 역량을 갖추신 분)
클라우드 기술 백그라운드 기반의 SRE 역할 수행
고가용성, 확장성, 안정성 기반의 글로벌 시스템 설계, 구축, 운영
GCP, AWS, Azure, NCP 등의 CSP, 혹은 On premise에서 엔터프라이즈 서비스 프로비저닝/운영/최적화 경험
Terraform 등 코드 기반 클라우드 매니지먼트 자동화 수행
APM 기반 모니터링 및 긴급 대응 프로세스
마이크로서비스 아키텍처로 구현된 서비스의 최적화


🚀Swit News
https://zrr.kr/1ILh

지원마감