저희도 지금 iwinv 클라우드를 이용하고 있습니다만 다행이 이번에 발생한 블록스토리지 장애의 피해를 입지 않았습니다. 운이 좋았네요. 아마 특정 zone의 ssd 스토리지 쪽 장애 일 겁니다.
그런데 이게 네트워크 접속 오류 수준이 아닌 데이터가 완전히 유실되어 복구가 안되는 상황이 포함된 장애입니다. 일부 사용자들은 데이터 복구 불가가 되는 것이 게시판에서 모니터링이 됩니다.
저희는 매일 새벽 본서버 호스팅이 아닌 다른 곳 aws 라이트세일 쪽으로 백업을 하고 있습니다. 여러차례 언급해 알고 계신분이 많겠지만 데이터는 하루 변경된 부분만 전송되어 아주 빠르게 전송이 끝납니다. 그리고 db는 전체백업을 해서 전송합니다.
이렇게 하면 서버가 폭발을 하던 뭘하던 1일전 상황으로 복구는 가능합니다.
백업을 하지 않는 운영자는 용서받지 못한다는 유명한 말이 있죠. 백업은 다른 무엇보다 우선해서 완벽하게 스케줄링에 따라 잘 운영되어야 합니다.