구글에 검색하면 pdf나 hwp 파일의 내용까지 검색해서 노출시키던데요

이걸 검색 노출 안되게 막을수 있는 방법이 있을까요?

  • profile
    구글에 로봇 수집 막기 <-검색해보세요
  • profile

    관리자 화면 → 콘텐츠 → 파일 → 파일 다운로드 설정

     

    "외부 색인 허용 확장자"로 설정된 것만 색인이 허용됩니다. 보통 pdf를 허용하곤 합니다.

    그 밖의 파일 형식은 X-Robots-Tag: noindex 헤더가 자동으로 붙기 때문에

    정상적인 로봇이라면 색인하지 않습니다.

     

    만약 아무 확장자도 허용하지 않았는데도 구글이 다 긁어간다면

    라이믹스에 이 기능이 생기기 전에 긁어간 것이거나, 헤더가 제대로 붙지 않고 있거나,

    다른 경로로 파일이 노출되고 있을 수도 있습니다.

  • ?
    라이믹스에서 파일 다운로드 url에 접근은 X-Robots-Tag: noindex 로 이미 설정된것 같은데요.
    https://developers.google.com/search/docs/crawling-indexing/block-indexing?hl=ko#http-response-header
    검색 결과에 포함되면 안되는게 맞는것 같네요.
    /index.php?module=file 로 시작하는 주소인지 확인이 필요해보이네요.

    색인된 경우 삭제방법
    https://developers.google.com/search/docs/crawling-indexing/remove-information?hl=ko