httpswstatic-prod.pubg_.comweblivestaticogimg-og-pubg.jpg

클라우드플레어 장애로 주요 온라인 서비스 접속 오류 확산…일부 구간 복구 진행 중입니다

웹 인프라 핵심 사업자 클라우드플레어(Cloudflare)의 글로벌 네트워크 장애가 발생해 다수 서비스에서 500 Internal Server Error와 인증 챌린지 오류가 관찰되었습니다.

클라우드플레어 대규모 장애 보도 이미지
출처: 전남일보

18일 밤(한국시간) 클라우드플레어의 글로벌 네트워크에서 광범위한 오류가 발생해 웹사이트와 앱 접속이 일시적으로 어려워졌습니다.

사용자 화면에는 500 오류, Browser Working / Host Error 메시지, 또는 challenges.cloudflare.com 관련 검증 창 실패가 노출되었다는 제보가 이어졌습니다.


클라우드플레어는 CDN, DNS, WAF, DDoS 방어 등 핵심 웹 인프라를 제공하는 사업자입니다.

이 때문에 단일 사업자 장애가 발생하면 오픈AI·챗GPT, X(트위터), 게임, 암호화폐 서비스 등 다양한 분야에서 동시다발적 영향이 나타나기 쉽습니다.

챗GPT 접속 오류 관련 기사 이미지
출처: 머니투데이

상태 페이지와 커뮤니티 모니터링에 따르면 대시보드·API 장애와 함께 다수 지역에서 에지 응답 오류가 증가했다는 관측이 있었습니다1.

일부 구간은 순차 복구되는 중이라는 업데이트가 전해졌으며, 복구 과정에서 일시적으로 오류율이 평소보다 높을 수 있다는 안내가 공유되었습니다1.

“다수의 고객에게 영향을 미치는 광범위한 500 에러 및 대시보드/API 장애를 인지하고 조사 중입니다. 복구가 진행되는 동안 오류율이 평소보다 높을 수 있습니다.”
— Cloudflare Status 업데이트 요지(커뮤니티 요약 인용)1

이번 클라우드플레어 장애CDN·보안 프록시를 통한 트래픽 경로에 직접적인 영향을 준 것으로 보입니다.

DNS만 이용하는 일부 서비스는 상대적으로 영향이 적었을 수 있으나, WAF·봇 차단·챌린지 페이지가 활성화된 서비스는 인증 단계에서 막히는 사례가 보고되었습니다.

암호화폐 사이트 영향 관련 이미지
출처: CoinDesk Korea

IT·AI 서비스에서는 오픈AI 챗GPT퍼플렉시티가 동시간대 접속 지연 또는 중단을 겪었다는 보도가 확인되었습니다2.

게임 부문에서도 리그 오브 레전드발로란트의 로그인과 매칭 대기에서 오류를 체감했다는 이용자들이 있었으며, 커뮤니티 게시판에도 관련 사례가 공유되었습니다3.

또한 일부 암호화폐(크립토) 프런트엔드가 표시 지연·오류를 보였다는 보도도 이어졌습니다4.

이 과정에서 “is twitter down“, “is cloudflare down“, “cloudflare server status” 같은 검색어와, challenges.cloudflare.com to proceed 관련 안내를 묻는 문의가 급증했습니다.

클라우드플레어 글로벌 네트워크 장애 공지 스크린샷
출처: 루리웹

사용자 체크리스트 ✅

첫째, Cloudflare Status와 서비스사 공지 채널을 확인해 현재 복구 진행 상황을 확인합니다.

둘째, 동일 네트워크에서만 오류가 날 경우 모바일 핫스팟 등 다른 회선으로 재시도하거나 잠시 후 접속을 권장합니다.

셋째, 반복 새로고침이나 무분별한 재로그인은 추가적인 차단을 유발할 수 있어 주의가 필요합니다.

운영자(개발·보안·SRE) 실무 팁 🛠️

1) 오리진 직접 우회: 긴급 시 일부 트래픽에 한해 DNS를 프록시 해제(회색 구름)하여 오리진으로 직접 유도하는 절차를 준비합니다재가동 후 원복 필수.

2) 캐시로 버티기: stale-if-error, stale-while-revalidate 등 정책을 활용해 읽기 트래픽을 견딥니다.

3) 멀티-CDN 전략: 주요 경로에 페일오버를 구성하고 헬스체크를 강화합니다.

4) 챌린지 도메인 허용: 방화벽·보안 게이트웨이에 challenges.cloudflare.com 관련 엔드포인트 허용 규칙을 점검합니다.

5) Zero Trust·API 보호: 인증·토큰 만료 이슈가 동반될 수 있어 유효성 검사 폭을 일시적으로 늘리고, 감사 로그로 오탐을 분리합니다.

6) 보안 유의: 일시적으로 규칙을 낮춘 경우, 복구 직후 WAF·레이트리밋 재적용과 취약 구간 점검을 즉시 수행합니다.


현재로서는 정확한 근본 원인(RCA)이 공식화되지 않았으며, 네트워크·설정·코드 배포 등 다양한 시나리오가 가능성으로 거론됩니다.

클라우드플레어는 통상적인 절차에 따라 사건 종료 후 인시던트 보고서를 공개하고, 재발 방지 대책과 타임라인을 공유하는 것으로 알려져 있습니다.

시장 측면에서는 cloudflare stock 흐름과 주요 고객사 공지가 주목되며, 대형 인터넷 인프라 사업자 의존성에 대한 리스크 관리 논의가 강화되는 양상입니다.

기업들은 런북(runbook) 정교화, 벤더 다변화, 혼잡 시나리오 리허설복원력(resilience) 강화를 병행할 필요가 있습니다.

이용자 관점에서는 서비스사 공식 채널과 상태 페이지를 주기적으로 확인하고, 중요 업무는 일시적으로 대체 경로(모바일 앱, 데스크톱 앱, 전화·이메일 지원 등)를 활용하는 것이 안전합니다.

운영자 관점에서는 오류율·지연시간·캐시 적중률을 모니터링하며, 로그 기반으로 근본 영향을 분류해 정상화 단계를 관리하는 것이 바람직합니다.


클라우드플레어는 Anycast 기반 에지로 전 세계 PoP에 트래픽을 분산합니다.

따라서 특정 지역·라우팅 경로의 작은 이상도 광범위한 체감 장애로 이어질 수 있어, 단계적 롤백과 영역별 트래픽 차단·해제가 반복될 수 있습니다.

이번 사건은 CDN·보안·DNS 등 인터넷 기반 서비스의 상호의존성을 다시 한번 보여주었습니다.

향후 RCA재발 방지 대책이 제시되면, 업계 전반의 베스트 프랙티스 갱신이 뒤따를 것으로 전망됩니다.