프로젝트 개요
삼성게임즈는 글로벌 이용자 대상의 게임 다운로드 및 패치 배포에서 CDN 단일 장애 지점(SPOF) 문제를 겪고 있었습니다. 이를 해결하기 위해 샤이닝스타코리아는 AWS, Cloudflare, Fastly 간의 CDN 상태를 실시간으로 점검하고 자동 전환하는 인프라 최적화 시스템을 설계하였습니다.
단순한 장애 감지와 전환을 넘어서, 지역별 응답 속도, 패킷 손실률, 트래픽 혼잡도 등을 기준으로 CDN 우선순위를 실시간 재조정할 수 있도록 구성되었습니다. 결과적으로 게임 업데이트/패치 실패율이 획기적으로 감소하였고, 인프라 운영의 자동화 수준도 크게 향상되었습니다.
🧭 주요 기능
- CDN 장애 탐지 (3초 간격 ping + HTTP 체크 + TTL 비교)
- SLA 기준 이탈 시 자동 DNS Failover 실행 (Route53 → Cloudflare)
- 관리자 대시보드에서 현재 CDN 상태 모니터링 + 수동 전환 지원
- 다운로드 실패율/응답속도/TTL 지표 기반 CDN 우선순위 조정
- AWS Lambda + Slack Webhook 기반 장애 알림 자동화
- 사용자 위치 기반 Edge 우선 라우팅 (Geo DNS + NGINX Map 설정)
시스템 구성도 (예시 이미지 필요)
[사용자 접속 (전 세계)]
↓
[Route53 + Geo DNS]
↓
[Cloudflare CDN / Fastly CDN / AWS S3 + CloudFront]
↓
[CDN 상태 감시 서버 (Go + Redis)]
↓
[Failover API + 관리자 대시보드 (Vue.js)]
↓
[Slack 알림 + 수동 제어 기능]
프로젝트 성과
- 글로벌 다운로드 실패율 7.2% → 0.6%로 감소
- 평균 응답 속도 480ms → 290ms로 단축
- CDN 장애 자동 탐지 및 우선순위 재조정 성공률 97%
- 인프라 관리 자동화로 운영시간 주간 14시간 이상 절감
- SLA 기준 미달 지점 알림 자동화로 대응 시간 평균 3분 이내


