하도 찝찝해가지고 몇시간전에 파일 로그 깔아났습니다 지금 12시 지나고 트래픽 확인해서 또 이상하게 올라가는거 같아 파일로그 확인하니 몇분이 사진을 30번을 다운 받았는데 이거 공격이라도 봐도 되는건가요? 왠만해서는 사진 1장을 다운받는게 정상인데 이상하게 30개를 다운받는게 너무 이상하게 느껴지네요
이제는 트래픽 올라가는것도 무서워서 확인을 계속하게 만드네요
하도 찝찝해가지고 몇시간전에 파일 로그 깔아났습니다 지금 12시 지나고 트래픽 확인해서 또 이상하게 올라가는거 같아 파일로그 확인하니 몇분이 사진을 30번을 다운 받았는데 이거 공격이라도 봐도 되는건가요? 왠만해서는 사진 1장을 다운받는게 정상인데 이상하게 30개를 다운받는게 너무 이상하게 느껴지네요
이제는 트래픽 올라가는것도 무서워서 확인을 계속하게 만드네요
구글봇이 계속 들어옵니다... 물론 robot.txt 로봇 못오게 막긴했지만 계속 들어오네요 벌써 4기가 긁어먹었네요 ㅠㅠ
구글이 하루에 50 ~ 100G 씩 발생시킨다는게 황당하네요. 지금 robots.txt 에서 막은거는 풀어 놓으면 확실해 질 수도 있겠네요.
robots.txt 다 막은거는 타격이 너무 큽니다. 우리나라 유입 대부분인 네이버도 막히나까요
짧은 주소 애드온 쓰면 주소가 전부 다 바뀔겁니다... 그게 원인인거 같은데요.
그리고 짧은 주소 애드온말고도... 주소가 심각하게 꼬인 부분이 있는 것 같습니다. 지금 구글 검색해보면 dami0409.com에 페이지 갯수가 29만개라고 나와요... 말도 안되는 숫자입니다. 실제 님 사이트의 페이지 갯수는 거기에 훨 못미칠테니 아마 같은 페이지가 뭔가 다른 주소 형태로 노출되는게 가능하다는겁니다. 그것도 매우 다양한 주소 형태로 말이죠... 그래서 구글이 어마어마한 숫자로 크롤링을 해댄겁니다. 이런 경우라면 주소에 시간정보가 포함되던가.. 아니면 뭔가 랜덤한 숫자라던가.. 아니면 search 필드에 뭔가가 들어가던가.. 그런 식으로 생각해볼 수 있습니다.
예를 들어
이런 주소가 어떤 경로로 생성되었는지 한번 확인해보세요...
구글에서 검색한 페이지중의 하나인데... 어떻게 저런 주소가 크롤링 대상이 되었는지 알 수가 없습니다.
전에는 안그러다가 갑자기 그런거면 최근에 설치한 뭔가의 애드온의 부작용일겁니다 아마
확인해보니 진짜 29만개로 말도 안되는 숫자가 나오기는하네요 보여주신 링크를 확인해보니 사이트에 적용되있는
인기검색어 모듈인거 같기도 합니다 실시간 검색어 누르면 저런 링크로 나오기는하더라고요 이 애드온일 가능성이 있을까요?
그렇군요 인기검색어 모듈에서 뭔가 마구 URL을 내보내니까 그게 전부 다 구글 입장에선 새로운 URL이라서 전부 크롤링의 대상이 되었나봅니다. 뭐 인기검색어만이 원인인지 아닌지는 모르겠습니다만...
적용한지도 꽤 됬는데 예전에는 아무일 없다가 갑자기 최근에 이러는게 이상하기는 하네요...
구글이 모든 사이트를 매일 새로 검사하는건 아니라서... 우선순위가 떨어지는 작은 사이트들은 사이트의 변화가 구글에 자동으로 반영되기까지 상당한 시간이 걸립니다.
인기 검색어 모듈 로그 확인해보니 구글 봇 아이피가 주르르륵 나오네요 시간도 보니 엄청 짧은 시간에 몇초에 한번씩 검색한거 같구요 아마도 이 모듈 + 애드온 문제일수도 있을거 같네요
referer 체크 등을 통해서 막는 방법이 있겟네요 ..