클라우드가 관리가 편한 측면도 있긴 하지만...

 

이 백업의 문제는 정말 지겹도록 사이트 속도 저하를 발생시킵니다. 이전에 사용하던 호스팅 사에서도 백업을 진행하는 시간이 과다해서 그 시간 동안 디스크 성능이 나빠져 속도가 저하가 발생하는 문제가 제일 심각한 문제였습니다. 

그때는 디스크가 HDD라 더 치명적이었죠.

 

 

 

새로운 호스팅으로 이전하고 SSD로 바꾸고 나서 그래도 영향을 덜 받긴 하지만 그래도 백업시간에 지속적으로 디스크를 읽고 쓰고 하는 시간 동안은 디스크 성능이 떨어집니다.

 

제가 어떻게 아냐면 모니터링 툴에 정확히 03:00 부터 성능이 떨어지는게 매일 찍히기 때문에 호스팅사의 백업시간을 말해주지 않아도 알고 있습니다.

 

그런데 문제는 새벽시간이라 문제가 되지 않아 그냥 그려러니 하고 있었는데.

 

최근부터 백업할 용량이 많이 늘었는지 새벽이 아닌 정오를 지나 서 마무리가 되네요.

 

 

 

 

disk_latency.png

 

 

이정도가 사용자들에게는 어떠한 체감을 줄까요? 일단 응답 자체가 느려집니다. 기본적으로 +알파 정도의 시간이 더 추가됩니다.  페이지가 빠르게 1초 정도에 로딩이 되었다면 이 때는 기본적으로 2-3 초까지도 걸립니다.

 

특히 php로 인해 캐시되지 않은 것이 요청될때는 정말 체감 정도가 아니고 한참 기다려야 하는 상황도 발생합니다. 

 

이런 문제를 제기하면 호스팅사에서는 느리지 않다 뭐 정상적인 속도다 라고 이야기 하면 뭐 이용자로서 할말은 없겠죠.

 

저는 이러한 문제를 발생시키기 싫어서 저희 사이트는 풀백업을 아예 하지도 않고 하루 사이 변경된 파일만 백업해서 아주 빠른시간에 백업 및 외부 전송까지 마무리 합니다.

 

현존하는 기술로는 이러한 disk 성능저하를 발생시키는 백업 말고 다른 백업을 할 수 없는 건가요? 도대체 호스팅사들은 왜 이렇게 그냥 성능을 확 떨어뜨린채 백업을 그것도 장시간 하는 방법을 사용하는지 이해하기 좀 어렵습니다.

  • Lv37

    저건 웹지기님의 외부 증분백업 때문이 아니라 그냥 호스팅사에서 제공하는 디스크가 느려지는 거죠?

     

    iwinv에서 블록스토리지를 매일 백업하지는 않을 겁니다. 자체적으로 4중화가 되어 있고, 그 밖의 백업은 어디까지나 고객의 책임이니까요. 호스팅사 차원에서 백업을 돌린다 해도 매일 10시간씩 걸리는 방식을 취할 것 같지는 않고요.

     

    새벽 시간대에 블록스토리지를 백업 용도로 사용하는 다른 고객의 영향을 받고 있을 가능성이 더 높습니다. 자체 백업을 엉터리로 세팅하면 10시간은 약과입니다. 수백기가를 매일 압축하는 무대뽀 같은 사람 은근히 많습니다. 이게 24시간 넘게 걸려서 다음날 백업과 겹치고, 백업이 동시에 2개 돌아가니까 기하급수적으로 느려져서 그 다음날 백업까지 3개가 겹치는 황당한 사례도 본 적이 있습니다 ㄷㄷㄷ

  • Lv37 Lv30

    저희 작업 영향은 절대 아니고 일부러 증분백업 시간도 다르게 해 놓아서 그리고 워낙 짧은 시간이라 파악이 됩니다.

    그런데 저게 백업이 거의 확실합니다. 매일 03:00 분에 시작합니다. 스케줄링이 되어 있다는 것이죠.
    다른 사이트에서 그 시간에 스케줄링이 되어 뭔가 작업을 한다면 모르겠지만요.

     

    03:00 ~ 06:00 가 패턴이었는데 몇일 전부터 03:00 ~ 13:00 로 시간이 늘어나서 실 사용시간에 저희가 피해를 보게 되어서 지금 상황이 달라졌습니다.

     

    이전 호스팅사에서 백업 스케줄링이 꼬여서 2중으로 돌다가 저한테 클레임 받고 중지한 적이 있습니다.

  • Lv37 Lv30

    문의를 해 놓았는데 지금도 계속 되고 있으니 범인이 호스팅사가 아니라면 다른 고객이 범인이라고 밝혀주겠죠.

     

    호스팅사이던 다른 사이트이던 영향을 받을 수 밖에 없는 상황에 처한다면 물리서버 자체를 저희만 써야겠다는 생각이 더 절실해져서 글을 쓰게 되었네요. 

  • Lv30 Lv37
    네, 정확히 새벽 3시에 시작하는 것을 보면 백업이나 그 밖의 정기적인 유지보수 작업 때문인 것은 확실합니다. 호스팅사에서 자체적으로 백업을 돌리는 건지, RAID check 등의 유지보수 작업을 하는 건지, 그것도 아니면 윗글에서 제가 의심했듯이 다른 고객이 무식하게 하루에 10시간씩 백업을 돌리는 건지는 문의를 해보셔야 알 수 있을 듯 합니다. 어떤 경우든 iwinv 플랫폼의 문제인 것은 마찬가지이니, 컴플레인하는 데 돈이 들지는 않을 거예요.
  • Lv30 Lv37
    물리적 장비를 혼자 쓰지 않더라도 정상적인 클라우드라면 저런 문제가 생기지 않습니다. iwinv가 좀 주먹구구식으로 운영하는 면이 있죠 ㅎㅎ
  • Lv37 Lv30

    end.png

     

    어제와 같이 작업이 다 끝나서 마무리 된건지 아니면 제 문의 글을 보고 뭔가 스톱을 시키거나 조치를 한건지 모르겠지만 오늘 역시 비슷한 시간에 다시 디스크 성능이 돌아온 것 같습니다. 물론 진폭이  지금보다 높은 위치에 있었긴 하지만..... 뭐 아래까지 다 내려온걸 보니....

  • Lv37 Lv30
    답변이 달렸네요.

    예상대로 iwinv 에서는 백업을 하지 않는다고 합니다.
    내가 말하는 건 모니터링을 해봐야 알겠지만, 문의를 준 사람은 저 단 한사람이라고 하네요.

    내가 말하는게 사실인지 확인을 하겠다는건지(모니터링을 해봐야 알겠다니... 하겠다는 것도 아닌것 같고..)
  • Lv37 Lv30
    저 이 댓글이 살짝 이해가 부족한게..
    디스크를 여러 사이트에서 공유해서 쓸경우 혹은 특정사이트에서 디스크에 읽고 쓰기를 과도하게 하면 디스크의 성능이 저하되어 다른 사이트에도 같은 디스크의 성능저하의 영향을 받는게 아닌가요?

    특정 사이트가 아니라 호스팅사에서 해당 디스크에 작업을 한다고 했을때도 마찬가지 일 것이고..

    정상적인 클라우드라면 이런식의 디스크공유가 아닌 완전 독립된 디스크 사용을 하나요?
  • Lv30 Lv7
    디스크 성능에 영향은 받지만, 캐싱 등으로 어느정도 완화할 수 있고, 저정도로 다른 사용자들에게 피해가 심하게 갈 정도면 다스크 성능을 강제로 제한해버리죠
  • Lv7 Lv30
    네. 강제로 제한하는 방식으로 우회 한다면 뭐 이해가 가구요. 영향을 안받을 수가 없을 것 같아서 댓글로 질문을 드린 것 입니다. 저희 케이스가 지금 피해 정도가 심하다는 주관적 판단이 되겠지만 피해를 받고 있는 상황으로 다른 사이트 영향으로 추정이 됩니다. 호스팅사에서는 별도 백업 같은 것을 하지 않아 자신들은 아니라고 하니까요.
  • Lv30 Lv7
    그런데 저 그래프는 좀 심한 것 같네요. 혹시 사용하시는게 SATA 서비스인가요, SSD인가요?
  • Lv7 Lv30

    SSD 입니다. 그동안은 새벽시간에만 그래서 참고 있었는데 최근 정오 까지 그러다가 정상화 되고 해서 호스팅사에 문의를 하게 된 것입니다. 저는 호스팅사에서 백업하는 줄 알았죠. 일단 지금까지 확인된 사항으로는 물리서버 내 다른 곳에서 새벽시간에 압축백업을 진행하는데 이게 다른 사용자들에게 함께 성능저하가 영향을 받고 있지 않나 하는 생각입니다.

  • Lv30 Lv7
    SSD가 저러면 좀 심각한 수준인것 같은데요? iwinv 홈페이지에도 SSD 즐록 스토리지는 고성능 I/O 서비스에 사용하라고 나와 있고, 가격도 다른데보다 저렴해 보이지도 않고요... 차라리 Lightsail 이나 vultr을 고려해보시는게 어떠신지요?
  • Lv7 Lv30
    차트 보시면 사용자가 거의 없는 새벽시간에 저렇고 사용자가 굉장히 많은 낮시간에는 이상이 없는 것으로 보아 백업의 영향으로 추정하고 있습니다. 오늘은 오전 9시 이전에 정상화가 되었는데 해결이 되지 않고 이 상황이 계속 된다면 모르겠습니다. 이후 어떤 결정을 해야 할지는요...
  • Lv30 Lv7
    속도도 문제지만 저걸 관리하지 못하는 시스템, 그리고 고객지원도 문제라고 봅니다.
  • Lv7 Lv30
    이런 문제가 발생될 수 있다는 것 자체를 모르고 있는 것 같고 알고 있다고 해도 문제로 인식하지 않고 있을 가능성도 있습니다.

    어제 새벽에 02:57분에 테스트한 결과만 일단 적어 놓고 이후 코멘트가 없는데 03시 이후에 점검시 이상이 발견되어 추가적인 조사가 필요한건지 기술지원 내역에 아직 제가 판단할 만한 답변이 없어 현재 추가적인 답변을 기다리는 상태입니다.
    당연히 03:00 즈음에 테스트하면 이상 없는 결과만 나옵니다.
  • Lv30 Lv37
    SSD 아닙니다. 성능 저하가 발생하고 있는 쪽은 SATA 블록스토리지입니다.
  • Lv37 Lv30

    네? 저희 OS 설치된 SSD 아니었나요???? 아 제가 거꾸로 봤군요.

  • Lv30 Lv37
    "정상적인" 클라우드라면 다른 고객에게 눈에 띄는 영향이 가지 않도록 I/O 사용량을 엄격하게 제한하거나, 기반이 되는 하드웨어의 성능이 워낙 좋아서 웬만해서는 성능 저하가 발생하지 않습니다. 저렴한 SATA HDD가 아닌 SSD 블록스토리지를 선택하기만 해도 사실 이런 문제는 상당히 해소되고요... SATA HDD를 사용하더라도 업체에서 SSD cache를 잘 세팅해 놓았다면 자주 읽는 php 파일의 실행 속도가 떨어질 일은 거의 없습니다.

    내가 시간당 n원씩 내고 구입한 서버 자원을 마음껏 사용하는 것이 다른 사람에게 영향을 주거나 받는 것을 신경써야 한다면 클라우드를 쓰는 의미가 퇴색되지요.
  • Lv37 Lv30
    이게 SATA 블록스토리지 쪽이라 그나마 덜 느려진 거였네요. 저희 db는 SSD에 설치되어 있어서요..
    불행중 다행인건가요
  • Lv37 Lv30
    일단 제가 영향받는 스토리지를 거꾸로 판단했었네요.
    이게 HDD쪽 영향이라면 불행 중 다행이긴 합니다 ㅋ

    php가 약간 느려지는 증상은 제가 체감할 정도인 듯 하니 영향은 있어 보입니다.
    해결을 해주지 못한다면 흠..........
  • Lv7 Lv30
    제가 반대로 파악했습니다. 지금 문제가 되는 곳이 SATA HDD 이네요. 저희 XE가 거기에 설치되어 있습니다.
  • iwinv 가 어떤 서비스를 제공하는지 모르겠지만 정상적인 클라우드 서비스라면 저런 부분에 대해서 질문했을때 기술적으로 확인해주는게 정상일꺼 같습니다.

    저런 문제가 벌어진다고 해서 그게 클라우드 탓은 아닌거같구요.
    물러서버 구매하시면 아마 귀찮은 일이 더 많지 않을까 싶습니다.

    문제가 해결이 안되면 iwinv 보다 더 좋은 클라우드 서비스를 찾아보심이 더 좋은 선택이 아닐까 싶네요.
  • Lv30
    저희 서버를 접속해서 봐야 한다고 접속정보를 요구해서 접수를 한 상태입니다.
    저희 서버에서 발생시키는 문제가 아닌데 저희 서버에서 원인을 찾으려 하는게 좀 이상하긴 하지만 1차적으로 저희서버를 검토 후 문제가 없다면 다른 원인을 찾겠다면 그렇게라도 하게 둬야죠.

    뭐 추후에 물리서버를 직접 구매해서 운영한다면 서버관리에 좀 더 투자를 해야겠죠.
  • Lv30
    서버 내부 확인 시 서버 부하 및 블록스토리지 저하는 확인되고 있지 않습니다.
    요청 주신 시간대인 새벽 3시~6시 사이에 다시 한번 더 확인하여 답변드리도록 하겠습니다.
    감사합니다.


    >> 190611 14:45 확인
    # hdparm -tT /dev/vdb

    /dev/vdb:
    Timing cached reads: 7950 MB in 2.00 seconds = 3978.43 MB/sec
    Timing buffered disk reads: 266 MB in 3.03 seconds = 87.66 MB/sec


    설마 실제 디스크 속도가 정상인지 아니면 정말 제가 말한대로 느려지는 현상이 있는지만 확인하려고 하는건 아니겠죠 ㅋ

    03시 이후에는 느려짐이 확인될텐데.. 그때 다시 보고 느려지는게 확인되면 그때 뭘 확인하시겠다는건지 저답으로는 잘 모르겠네요.
  • Lv30 Lv37
    특정 시간대에 느려진다고 컴플레인하면 전혀 상관없는 시간대에 한 번 접속해 보고 "아무 문제 없는데?" 라고 하는 호스팅 업체가 전체의 90%는 될 겁니다. ㅋㅋㅋ
  • Lv37 Lv30

    뭐 특정시간대에 스케줄링이 있는지 검토해보고 정상상태일때 속도를 체크해 보고 싶어 접속해서 확인해봤다고 믿고 싶습니다. 이후 새벽에 다시 확인해보겠다는 답변이니 새벽에 정말 느려졌네? 라는 답변을 주고 끝내려는 건 아닐 거라 믿고 있습니다.

    새벽에 실제 느려지는 상황인지 확인 후 뭔가 추가적인 조사를 한다는 일 처리 과정이 뭔가 좀 하기 싫은 일을 진행하고 있는 것 같은 느낌을 받는건 저만의 오해겠죠 ㅋ

     

    실제 느려질때 원인을 파악해서 원인을 해결하겠다는 굳은 의지라고 믿습니다.

  • Lv7
    어디 클라우드를 사용하시는지는 모르겠습니다만, 다른 클라우드 서비스를 이용해보세요.

    요즘에 저는 구글 클라우드 스타트업 지원해서 1000$ 크레딧 받은걸로 서버 돌리고 있습니다.

    의외로 심사과정이 까다롭지 않아서 신청하시면 받으실 수 있을것 같습니다.

    https://cloud.google.com/developers/startups/?hl=ko
  • Lv7 Lv7
    이건 사업자 등록이 되어 있어야지만 받을 수 있나요?
  • Lv7 Lv7
    사업자등록 여부를 확인 하는 절차는 없습니다