2019-09-17 00:32 (화)
CDN 시장 점유율 34% 이상 차지하는 ‘클라우드플레어’ 서비스 중단 사고 발생
상태바
CDN 시장 점유율 34% 이상 차지하는 ‘클라우드플레어’ 서비스 중단 사고 발생
  • 페소아 기자
  • 승인 2019.07.03 15:50
이 기사를 공유합니다

neo-urban-1808082_640.jpg
외신에 따르면, 글로벌 인터넷 서비스 제공업체 ‘클라우드플레어(Cloudflare)’ 서비스에 문제가 발생했다. 약 1시간 동안 전세계 관련 웹사이트가 502 오류 메시지를 보이며 중단되는 사고였다.

현재는 문제는 수정되었고 서비스는 정상적으로 실행되고 있는 것처럼 보이지만 왜 그런현상이 발생한 것인지는 아직 명확하지 않다.

클라우드플레어 CTO인 존 그레이엄-커밍(John Graham-Cumming)는 짧은 블로그 게시물에서 다음과 같이 해명했다.

그는 "오늘 약 30분 동안 네트워크상의 CPU 사용률이 급격히 높아져 클라우드플레어 사이트 방문객들은 502에러를 받았다. 이 CPU 스파이크는 잘못된 소프트웨어 배포로 인해 야기되었고 다시 롤백되었다. 일단 롤백을 통해 서비스는 정상 작동 상태로 돌아갔다. 현재 클라우드플레어를 사용하는 모든 도메인은 정상적인 트래픽 상태로 돌아왔다."고 밝혔다.

클라우드플레어의 CEO 매튜 프린스(Matthew Prince)는 이 문제의 발생에 대해 이렇게 설명했다.

"우리 측의 버그로 방화벽 프로세스가 과도한 CPU를 소비하게 만들었다. 처음에는 공격처럼 보였다. 우리는 프로세스를 종료하고 시스템을 정상상태로 복원했다."고 설명했다.

프린스는 이번 문제가 이제까지 가장 큰 내부 문제라고 트위터를 통해 언급했다.

그는 "이것은 이전에는 보지 못했던 방식으로 주요 시스템 및 장애 극복 시스템에 영향을 미쳤다는 점에서 독특했다. 앞으로 더 업그레이드된 격리 및 백스톱을 보장할 것이다."라고 덧붙였다.

이 문제는 클라우드플레어의 DNS 서비스 및 해당 CDN에도 영향을 미쳤다.

그레이엄-커밍과 프린스는 이 서비스 중단이 공격에 의한 것이 아니라고 강조했다. 프린스는 트위터를 통해 이것이 지난주 클라우드플레어와 인터넷에 문제를 발생시켰던 버라이즌 보더 게이트웨이 프로토콜(Verizon Border Gateway Protocol) 네트워크 문제의 반복이라고 말했다.

클라우드플레어는 매우 인기있는 콘텐츠 전달 네트워크(CDN)를 운영한다. 올바르게 작동할 때 서비스는 웹사이트 소유자들을 최대로드, 주석 스팸 공격 및 DDoS 공격으로부터 보호한다. 그러나 제대로 동작하지 않을 때 이와 같은 문제를 겪게 된다.

또한 클라우드플레어 CDN은 웹사이트 리소스를 방문자들에게 최적화해 제공하는 방식으로 동작한다. 이를 위해 클라우드플레어는 클로벌 데이터 센터로부터 웹사이트의 정적인 부분을 방문자에게 전달한다. 또한 클라우드플레어의 글로벌 네트워크는 사이트로 직접 방문자가 가는 것보다 더 빠른 경로를 제공한다.

클라우드플레어의 CDN은 시장 점유율 34.55%의 가장 대중적인 서비스이다. 두번째는 아마존 클라우트프론트(CloudFront)가 28.84%이다. 클라우드 플레어에 문제가 발생하면 BuzzFeed, Sling TV, Pinterest 및 Dropbox 등 1,600만 개 이상의 클라우드플레어 보호 사이트에 문제가 발생하게 된다.

이번 사고는 얼마나 많은 인터넷이 P2P 기업이나 기관 대신 몇몇 중요 회사에게 의존하고 있는지를 보여주는 사례라고 할 수 있다.

★정보보안 대표 미디어 데일리시큐!★