질문/조언팁/리소스 공유

https://xetown.com/thirdparties/1403614

 

"비속어 목록에 입력된 단어가 게시글 또는 댓글 내용에 입력되어 있을 경우,

원하는 문자열(○○○ 나 ■■■ 등)로 해당 단어를 마스킹합니다." 

 

위 링크에서 판매되고 있는 애드온에 대한 사용 후기 입니다. 전체 적인 기능은 위 설명으로 충분하겠지만

제가 실제로 이 애드온을 구매하게 된 동기와 이유를 운영자 관점에서 좀 더 적어 보겠습니다.

 

RXE의 기본 탑재된 스팸 필터는 말그대로 필터 입니다.

이는 스팸글이 등록되지 않는 것에 그 1차적 목적이 있고, 추가로 욕설에 대응 하기도 힘이 듭니다.

 

일단 마스킹과 필터링에서 오는 차이 입니다. 그 이유를 좀 더 자세히 적어 보겠습니다.

 

1. 스팸 글 등록 방지 기능 그 자체

유저가 글 내용중 관리자가 설정한 단어와 충돌을 하게 되는 경우 

부적절한 단어가 포함되어 있다 라는 메세지가 출력되며 글 등록이 불가능하게 처리 됩니다.

이는 사실 스팸 필터의 문제가 아닙니다. 오히려 제대로 일을 하는 거지요.


이 문제를 해결 하기 위해서는

어떤 키워드가 스팸 필터에 걸렸는지 친절히 알려주고 유저로 하여금 문제가 되는 키워드를 제거한테 다시 작성하게 해야 하는데

이는 진짜 스패머에게 좋은 먹잇감을 주는 아이러니한 현상이 벌어지게 됩니다. 아래 참고

https://github.com/rhymix/rhymix/issues/775

 

2. 스팸 필터는 한국어 구조 특성상 "선의의유저"에게 문제가 더 크게 다가 갑니다.

 

예를 들면 이런 경우이지요

 "게이"도 스팸 단어였는데. "게이머"가 문제

 

게이라는 단어를 스팸 단어로 등록된 사이트에서 게이머로 글 등록을 해야 하는 유저들은 글을 작성하기 힘들어 집니다.

게이머가 문제가 될거라는 상상도 하기 힘들죠.

 

영어권은 비슷한 사례가 있을까 싶긴한데..(완전 slang 이 아닌경우에야) 

한국어는 그 특성상 관리자가 스팸 키워드를 많이 넣으면 넣을수록 이런 문제가 비례해서 많이 생길수 밖에 없습니다.

여러분이 상상하기 힘들정도로 정말 예상하지 못한 단어의 조합이 유저들에게 글등록 불가의 문제로 발생하게 됩니다.

 

2+1. 위 2번의 문제와 확장해서 스팸 필터는 욕설에 대응이 불가능

사실 말 그대로 스팸 필터는 엄밀히 말하면 딱 정해진 스팸 키워드에 그 자체에 사용 되어야 하는게 맞습니다.

하지만 스팸의 경계가 홍보성 단어에만 딱 자르긴 힘이 드는 건 현실이지요. 예를 들면 음란한 단어와 욕설이 포함된 스팸도 있으니까요

이 경우에도 비슷한 문제가 생깁니다. 예를 들어 보자면

"아갈" 이라는 (아가리의 변종) 단어를 등록 해놓으면 "살아갈" 이라는 단어가 포함된 글을 쓰지 못합니다.

 

즉, 아갈은 욕이고, 전통적으로 스패머가 쓰는 단어는 아닙니다. 하지만 일반 웹마스터들은 욕설도 스팸 필터에 많이 포함시켜 사용들 하시죠. 이런 경우 마찬가지 스팸 필터에 등록된 단어가 늘어날수록 선의의 유저의 불편함은 계속 늘어 나게 됩니다.

 

스팸 필터의 문제도 아니고 한국어가 가지는 고유한 문제인지라 고도화된 AI가 필터링을 해주지 않는 이상 이를 쉽게 해결 할수 있는 방법은 잘 없습니다. 그리고 이 역시 외부 API와 통신이 필요 할 것이고요.

 

해서 위 3가지 문제를 가장 손쉽게 해결을 하고,

실질적으로 문제가 되는 단어를 유저에게 보여주지 않고 싶은 문제를 가장 손쉽게 해결 할수 있는 애드온 입니다.

강하게 추천 합니다.

구매전에 질문 있으시면 알려주시면 최대한 답변 드리겠습니다. 감사합니다.

글쓴이 skyo

?
XE타운 관리자 입니다.
관리자 아닌것 같지만 제이쿼리 엔지가 없는게 매력인 관리자 입니다.
  • profile
    딱 봐도 좋은 애드온 같습니다. XE에서도 트리거를 통해 접근하는 웹스택표 애드온!
    '게이'가 금지어일 때, 글/댓글 등록을 튕겨내는 게 아니라 ■■머 또는 세르■■ 처럼 나온다는 거죠?
  • profile ?
    네. 튕겨내는게 아니라 등록이 되며 마스킹~ 맞습니다. ^^
  • profile
    리뷰 감사합니다 :D

    사용자가 원할 경우, 마우스 오버 등의 액션을 통해 필터링 된 문구를 확인할 수 있는 옵션을 추가중에 있습니다.
    잘 부탁드리겠습니다 (_0_)
  • profile profile
    웹스택님의 자료 였군요.
    자주 다니는 커뮤니티중에 한곳이 비슷한 기능을 쓰는 곳이 있습니다.

    예를 들어 개X끼 를 > 댕댕이 라는 식으로 바꿔서 치환되는 것처럼 표현되더군요.
    강제로 치환되다보니 정작 의미를 파악하지 못하는 경우가 생겨 필터링 단어를 마우스 오버 액션으로 확인하는 기능 + 옵션으로 필터린된 단어는 옆에 "(필터)" 라는 식의 표식이 있었으면 합니다.

    개X끼들! 이라고 쓰면 댕댕이(필터)들! 과 같은 방식입니다.
  • profile
    좋은 글 잘 읽었습니다. 한국어의 표현이 워낙 다양성이 존재하다 보니 선의의 피해자가 생길수가 있네요. 그 가려운 부분을 처래해 주는 좋은 애드온이라 생각됩니다.
  • profile
    영어권의 전설적인 사례로 assassination(암살)이 있지요.
    학교 도서관 PC에 필터를 설치했는데 ass가 비속어라고 butt로 바꿔주는 바람에
    링컨 대통령 암살 사건이 buttbuttination이 되어 버렸다는... ㅋㅋ

    지금도 영국의 Scunthorpe에 사는 사람들은 자기 주소를 입력하기 힘들다고도 하고요.
  • profile ?
    아.. ㅋㅋㅋㅋㅋ 미치네요...
  • profile profile
    비슷한 예로 게임중에
    Assassin's Creed 라는 게임이 있는데
    ass ass in creed 로 불리고 있습니다.