문서 제목에만 사용해 주세요.

 

새로운 사이트 검색 노출에 이런 저런 문제를 해결해 가고 있습니다.

 

새로 구입한 레이아웃,게시판 스킨을 사용했는데 네이버에서 가져간 문서 요약을 자세히 볼 경황도 없어 못보다가 이제 살펴봤더니..  여지없이 h1 태그 남발의 문제가 확인 되었네요. 

 

새로 구입한 스킨에

 

h1 : 게시판설명의 게시판명

분류 나열

h1 : 문서제목

 

이렇게 코딩이 되어있더군요.

 

네이버는 h1 부근을 문서 내용으로 찾는 멍청한 방법을 사용합니다.

 

모든 문서의 내용 부분에

게시판 설명 분류 나열 문서제목 문서내용

 

이 수집되어 색인됩니다.

 

span : 게시판 설명의 게시판명 

으로 고쳐 주었습니다. 아마 다음에 크롤링하면 다시 정상적으로 수집 될 것 입니다.

 

그리고 레이아웃의 사이트명(로고)에도  h1 을 쓰지 않는게 좋습니다.

 

네이버가 멍청해서 발생되는 일이긴 하지만 그래도 피해갈 수 있는건 피해 가야죠...

 

 

 

  • 아무래도 html 소스의 경우 일반사용자에게 보여지는 부분이 아니다 보니
    제작 및 수정단계에서 편의등을 위하여 아무 태그네임이나 사용하는 경우가 많은것 같네요

    <h1><h2><h3>... 의 h가 무엇인지 용도와 저런 네이밍이 된 이유를 생각하는것 보다
    글자 사이즈가 미리 지정된 <span> 정도의 느낌으로 아무때나 쓰는 경우가 많은것 같아요

    지금의 경우 스타일등을 이용하여 원하는 대로 모양새를 바꾸는것이 가능하여
    태그네임을 별 신경쓰지 않고 마구잡이로 사용하지만 초창기 HTML의 구조를 생각한다면
    오히려 네이버가 웹 구조에 맞게끔 수집하고 있는것일수도 있겠네요
  • Lv8
    전 거이 div랑 span 만 쓰는데 h1 안쓰면 문제 될까요?
  • Lv8 Lv30

    문제될 수도 있습니다. 글 읽는 곳에 다른 자료에서 불러온 화면에 h1태그가 있는 경우(ex:에디터자동완성모듈) 그부분을 문서제목으로 착각하고 내용를 엉뚱한 곳에서 찾다가 실패합니다. 물론 문서제목에 h1을 써도 다른곳에 h1이 더 있어도 문제가 발생할 수 있다고 말씀은 드렸구요..

     

    심한 경우는 h1이 없으면 문서 분석 자체를 못할 수 았죠.

  • Lv30 Lv8
    가능하면 문서제목에는 h1 써야겠군요
  • Lv8 Lv30
    네. 거기만! 쓰는게 제일 좋습니다. 네이버를 위해서요.
    여기 타운에도 레이아웃의 로고쪽에 h1을 div 로 대체한 이유가 그것과 관련이 있을지도 모르겠습니다.
    저희도 원래 운영중인 사이트 그리고 신규사이트 레이아웃의 로고(사이트명) 부분을 div로 바꿨습니다.
  • Lv30
    저희와 같은 보드스킨을 사용하는 @에어보고 님 네이버에 모든문서가 게시판 설명(스킨설정에 넣어둔) 이 들어가고 있습니다. 게시글 요약이 못들어가고 모두 같은 내용으로 게시판 설명이 들어가는 이유는 이 글의 내용에 설명이 되어 있습니다.

    문서의 작성날자도 가져가지 못하는지 노출되지 않네요.

    아마 게시판 상단에 스킨에서 제공하는 공지글도 아마 문서 수집시 문서의 내용으로 수집되곤 합니다. 기능을 사용할때 확인 후 주의가 필요한 경우가 있습니다.

    물론 네이버에 글의 내용이 정확히 노출되어 보다 많은 분이 방문해주는 것을 목표로 하지 않는다면 별로 중요하지 않은 부분 일 수도 있겠지만요...
  • 사이트 운영자에게 가장 민감한 부분입니다
    색인에 문제 없는 스킨이 있다면 가장 우선순위가 되겠네요
  • Lv30
    운영하시는 사이트 스킨 뭔가 잘못 건드리셨는지 네이버에서 사이트로 검색해보면 저장된 페이지가 안보이네요.
    어제인가 토요일인가 제가 봤을때 스킨 구조가 뭔가 잘못 변경된 것 같더군요. 색인 결과에 위쪽에 배너가 보이고 암튼 정상적이지 못했습니다.
  • Lv30

    dd.png

     

    제목까지 크롤러 제한했다가 제목노출되게 제한 해제했는데..
    그리고 레이아웃의 문제인지 오른쪽 배너가 위쪽으로 올라가더라구요
    레이아웃에서 크롤러제한을 하기는 하는데 도저히 잘 안되서 그냥 냅두는데 웹마스터보면 색인 잘되어 가고 있더라구요 혹시 어떤페이지 보셨는지 알려주실 수 있을까요

     

    그리고 최근순으로 검색해보면 7일전 문서까지 페이지 저장이 안되네요..rss로는 잘 가지고 오는데

    이건 또 나쁜징조일지...

  • Lv30
    엇그제 보았을때는 저장된 페이지가 버튼이 있어서 봤었지만 지금은 모든 글이 저장된 페이지가 제공되지 않아 확인이 어렵네요. 네이버에서 지금 검색쪽에 또 작업중인 것 같은데 네이버쪽 영향이 아니라면 스킨에 문제가 있어 보입니다.
  • Lv30

    말씀 하신 10페이 이전 으로 가서 봤습니다.

     

    다운로드.png

     

    네이버가 이렇게 보게 해 놓으셨는데 이건 아주 큰 심각한 상황을 만들어 놓으셨네요.

     

    이런 상태로 보인다면 어뷰징으로 밖에 해석 안할 겁니다. 이렇게 보인다면 rss 정보로 수집된 1차 정보에서 1차 크롤링한 실제 화면에서 찾은 내용으로 바꿔서 색인하는 과정이 진행되지 않을 겁니다.

     

    결국 검색에서 문서가 다 사라지게 될 것이라 봅니다.

  • 네 저 상태에서 제목만 보여지게 만들었고 사실 항상 저렇게 보였습니다 몇달간 보였는데 저장 페이지도 잘 되고 색인페이지도 계속 늘었는데 요근래 색인이 많이 늦네요 ㅠ
    여러가지로 제한해보고 하는데
    생각만큼 잘 안되서 고민입니다...수정은 계속 해보고 있는데 ㅠ
  • Lv30
    지금 마지막에 하신 건 철회하셔야 합니다. 지금 상태는 실제 크롤링 해보니 rss 정보와 다르게 가져갈 내용을 찾지 못해 색인을 못하고 있는 것 입니다. 저 상태가 지속되면 rss로 수집된 수집도 금방 삭제 됩니다.

    제목이 함께 수집되는 문제 정도는 그냥 네이버의 한계려니 하고 그냥 두시는게 좋습니다. 제목을 가리는건 위험합니다.
  • Lv30

    ddd.png

     

    넵 현재는 구글 url검사로 확인한 결과 저 스샷에서 제목까지는 정확히 보여집니다
    딱 댓글까지 제대로 보일라고 노력하긴 했는데

    봇이 그래도 텍스트정도만 가져가는거 같습니다...

    제가 제목을 없앤이유가 제목이 동일한 웹페이지 항목이 많다고 해서 지웠습니다
    제목지워도 색인은 제대로 되는거 같더라구요 그런데 불안해서 이번에 제목을 다시 포함한겁니다
    h1태그를 보여주기로 했다는거죠

  • Lv30

    제목이 다 다른데 제목이 동일한 웹페이지로 체크 되는건 다른 이유 때문이죠. 그건 그냥 신경 쓰지 마시고 제목은 살리셔야 합니다. 조금 더 모니터링 해 보시고 네이버에서 계속 색인이 안된단면 다른 부분까지 건드리신게 네이버에서는 문제가 되고 있는 것 입니다.

     

    제목은 다시 살리고 정상적으로 해 놓으셨다면 아마 지금 네이버에서 뭔가 작업중인 것으로 영향 받고 있을 수 있네요.