게시글/댓글에 가장 많이 쓰인 키워드를 추출해 스킨으로 넘기고 싶습니다. 일정 기간마다 갱신되며, 스킨단에서 모듈 데이터에 접근하는 방식을 통해 접근하거나 또는 API로 데이터를 받고자 합니다. 이 데이터를 받아서 게시판 상단에 추천 키워드를 표시하는 것이 최종 목표입니다. (트위터의 실트처럼) 

 

PHP는 잘 몰라서

원래는 라이믹스 외부에서 커뮤니티 게시판을 크롤링 -> API를 통해 키워드 제공 -> 게시판 스킨에서 JS로 처리하려고 했으나

내부에서 구현하는 것이 가장 깔끔할 것 같아 질문드립니다. 

 

이 경우엔 모듈을 만들어서 사용해야하나요? 애드온만으로도 커버가 가능한가요?

또, 구현에 있어 기타 조언 주실 점이 있으시면 댓글로 남겨주시면 정말 감사드리겠습니다.

  • profile
    먼저 모듈을 만들어야 할 것 같습니다.

    1. 게시판 내용, 댓글 내용 중 키워드만을 분리해서(조사 등 제외) 나열해야합니다.
    2. 해당 키워드 갯수를 카운트하구요.

    기본적으로는 이렇게 프로세스가 될 거 같은데요.

    여기서 일정 기간마다라는 조건이 추가가 되니

    3. 해당 키워드가 작성된 일자별 컬럼을 디비에 추가하고,
    3.1. 기간별로 카운트가 가능해야합니다.

    그리고 게시판 상단에 출력하는 방법은 애드온으로 가능합니다.
    애드온을 만들지 않고 레이아웃이나 게시판 스킨에 그냥 바로 박아도 되구요.
  • profile
    기본적인 작업 자체가 php, mysql, xe에 대한 지식이 선행되어야겠지만,

    1번 작업이 사실 제일 어려울 듯 합니다.
    메일 내용 중에서 '단어(명사)'만을 뽑아서 추출한다는게 쉬운 작업은 아닐 듯 합니다.

    '작업','자체','php','mysql','xe','지식','선행','1번','작업','메일','내용','단어','명사','추출','작업'

    대략 이런 식으로 키워드를 뽑아야 하는데 이게 -_-;; 이런 작업이 어려울 거 같습니다..

    아니면 이건,
    문장을 나열 후에 '띄어쓰기'를 구분으로 모두 글자를 어절 단위로 분리한 다음,
    은/는/이/가/을/를/에/으로/로/에서 로 끝나는 경우에만
    해당 어절에서 명사와 조사를 분리하여, 해당 명사만을 키워드로 삼는 방법이 있을 수 있구요.
    이 경우에도 '은/이/가/을/에/로'로 끝나는 단어와 구분 짓는 방법도 필요할 수 있구요.
    예외적인 경우를 어떻게 처리할 것인지 이것에 대한 아마 다른 문서 등을 많이 참조해서 개발해야하지 않을까 싶습니다.
  • profile ?
    감사인사가 늦었습니다. 자세한 답변 너무나 감사합니다. PHP는 문외한이지만, 어떻게든 배워서 구현해보기로 했습니다. 좋은 말씀 남겨주셔서 감사합니다.