저희사이트가 네이버에서 사이트주소로  검색을 해 보면 MID가 포함되지 않은 문서로 보여지고 있어 질문을 했는데요.

 

이후 제가 분석을 해 보니 흥미로운 것을 발견했습니다.

 

 

오늘 XE로 운영되는 회원분의 사이트도 함께 분석을 해 보았습니다. 마찬가지로 저희 사이트와 같이 MID가 빠진 채로 보여지고 있었습니다.

 

 

그런데 이것이 네이버 봇에 노출을 위해 색인된 결과가 아니란 것을 발견하게 되었습니다.

우연히 저희 사이트와 여기 회원분의 사이트에서 초극소수의 게시물이 MID가 포함된 것을 발견하게 되었습니다.

 

 

 

aaa.png

 

 

저희 사이트도 그렇고 위 회원분의 사이트도 그렇고 MID가 포함된 경우는 "저장된 페이지" 라는 것이 하나 더 있는 것을 발견하게 되었습니다.

 

 

그래서 저 저장된 페이지가 무엇인지 보기 위해 눌러보면 

 

bbb.png

이렇게 네이버 봇에 의해 수집해서 저장까지 된 페이지라고 상단에 이렇게 설명을 해주면서 실제 저장되었던 시점의 페이지 모습을 보여줍니다. 

 

결국 이렇게 수집,저장된 것만 키워드로 매칭되는 것에 실제 노출되는 곳에 노출이 되는 것으로 추측이 가능합니다. 

 

XE공홈 것을 캡쳐하게 된 이유는 XE공홈은 전체 게시물에 "저장된페이지" 가 달려있습니다. 전 게시물 다 노출을 위한 저장까지 되어 있다고 보면 맞을 것 같습니다.

 

 

 

그럼 많은 XE와 라이믹스와 같은 CMS로 만들어진 사이트들은 ??? 저장된페이지가 안달려있습니다. XE타운이요? 마찬가지입니다. MID가 달려있긴해도 저장된페이지가 없습니다. 결국 노출을 위한 네이버 서버 어떤 곳에 저장된 문서가 아니라는 이야기죠.

 

그래서 실제 XE타운이나 저희 사이트나 네이버를 통한 검색유입이 없습니다.

 

이 문제는 네이버에서 선별적으로 노출을 위한 로직을 사용하고 있어 저희가 어떻게 할 수는 없지만 이렇게 눈으로 확인할 수 있는 확연한 차이를 볼 수 있게 한다는게 놀랍군요. 차별을 쉽게 확인할 수 있으니까요..

 

https://search.naver.com/search.naver?where=webkr&sm=tab_srt&query=site%3Ahttps%3A%2F%2Fwww.xetown.com&r=&filetype=none&option=off&fd=2&st=d&docid=0&dfrom=&dto=&f=&srcharea=all&dtype=all&sbni=&domain=&fqr=0&research_url=&sbni_rootid=&nso=so%3Add%2Ca%3Aall%2Cp%3Aall&ie=utf8&mson=0

 

 

https://search.naver.com/search.naver?where=webkr&sm=tab_srt&query=site%3Ahttps%3A%2F%2Fwww.xpressengine.com&r=&filetype=none&option=off&fd=2&st=d&docid=0&dfrom=&dto=&f=&srcharea=all&dtype=all&sbni=&domain=&fqr=-1&research_url=&sbni_rootid=&nso=so%3Add%2Ca%3Aall%2Cp%3Aall&ie=utf8&mson=0

 

 

사실 예전에 저희 사이트도 네이버노출이 왠만큼 되던 시절에는 "저장된페이지"가 달려있었습니다.

 

 

 

 

위 내용으로 분석해 보니 "저장된페이지"가 달리지 않은 문서들은 실제 문서들을 크롤링 한게 아니라는 결론이 나왔습니다. 실제 노출이 아닌 뭔가 형식적인 면피용으로 사이트주소로 검색했을때 뭔가 보여줘야 하니 이때 필요해서 긁어간 것은 각 사이트의 rss를 긁어 간 것 같습니다.

https://xe1.xpressengine.com/rss

 

XE의 모든 사이트들는 rss에는  여전히 MID가 생략되어 있습니다.

---> 공홈의 주소가 MID가 붙어서 노출되는 것은 형식적으로 rss를 긁어간게 아닌 정식으로 저장하기 위한 문서 자체를 크롤링해가서 모든 문서주소에  MID가 포함되며 "저장된페이지" 가 함께 태그되어 있습니다.

 

 

 

*진짜 질문*

제 분석으로는 이제 rss 발행 주소에 MID 주소가 검색노출에 큰 의미는 없는 것으로 확인 되었지만 그래도 MID가 포함되어 보여질 수 있도록 rss 발행때 MID가 포함된 주소로 발행되게 고치고 싶습니다. 

 

  • profile
    지난번 위젯 수정했던 것 처럼 코어에서 수정되기 까지는 그냥 스킨에서 처리하는 것과 같은 방식으로 처리했습니다. $module_info->mid
  • profile
    홈페이지소개에 올라온 XE사이트(rss 발행때 MID 없이 발행) 를 전수 분석해 보니 제가 예상한게 맞네요.

    사이트주소로 검색했을때 저장된페이지가 함께 안뜬다면 그건 헛빵인거구요...

    rss피드 잠궈 놓은 사이트는 헛빵인 것 조차 긁어가지 않는군요.


    노출과 전혀 상관없는 rss를 긁어가는 것이 아닌 사이트문서를 크롤링해서 저장해 놓은 문서들이 검색노출자에게 제공되고 있는 것으로 합리적 추정이 가능합니다.
  • profile

    오오오.... 흥미롭습니다. 질문 내용에는 도움이 못되어드리지만 ㅠㅠ
    저도 한번 제 사이트 주소로 검색해봤는데  저장된 페이지가 있네요? ㅎㄷㄷ 그렇다면 네이버 유입이 있다는거인가요? 호오에... 한번 확인해보러 가야겠습니다 ㅋㅋ

  • profile

    그런데 웹지기님이 운영하시는 커뮤니티를 네이버에 저 방식으로 검색해봤는데 저장된 페이지가 많이 달려있는데요?

  • profile profile
    최신순로 정렬 해 보세요. 요즘 문서는 없습니다.
  • profile
    rss 주소에 MID 달리게 한 후 네이버에서 MID가 포함된 주소로 보여지네요.
  • ?
    이런 글 참 좋습니다. 네이버가 마음에 들지 않고 폐쇄성도 문제이지만, 욕하며 .. 손 놓고만 있을 수 없구요.

    네이버 검색 노출에 대해서는 머리를 맞대고 최선의 방법을 찾았으면 합니다.
  • ?
    이 부분 코어나 라이믹스 상에서 고쳐진 듯한데 맞나요..?

    rss에 들어가보면 mid값도 입력이 되어있는데.
  • ? profile
    네~
  • ?
    특정문서에서는 저장된페이지가 노출되고, 여전히 최신순으로 보면 근 몇달동안 올라온 글들이 저장된페이지가 보이지 않습니다.. 네이버 웹마스터 도구에 등록하였고, 페이지수집은 원활히 되고있는데 혹시 해결책 찾으셨다면 공유 가능할까요?
  • ? profile
    이건 mid 관련 내용 이었구요. 저희는 잘 되고 있습니다. 여러가지 이유등으로 색인이 진행이 안되는 사이트들이 꽤 많습니다. 그건 모두 케바케 원인이 달라서 스킨의 문제라던지 혹은 사용중인 자료가 영향을 준다던지..