1. 개요
Keyword stuffing검색 엔진에서 높은 우선순위를 얻기 위해 웹 페이지에 특정 키워드를 고의로 다량 삽입하는 행위.
검색 엔진의 색인을 조작해서 이득을 취하려는 여러 기법을 통틀어 스팸덱싱(Spamdexing)이라 하는데 키워드 스터핑도 스팸덱싱의 일종이다.
2. 상세
많은 상거래 행위가 온라인으로 이루어지는 시장환경에서 포털사이트는 많은 영향력을 행사할 수 있다. 포털사는 검색시 상위에 노출되도록 돈을 받고 광고를 걸어주지만 소비자는 제휴광고라고 명시된 컨텐츠보다 자연스럽게 노출된 기업 사이트와 실제 사용자들의 후기를 더 선호한다. 이때 소비자가 좋아할 만한 광고를 만드는 것뿐만 아니라 검색 엔진이 좋아할 만한 광고를 만들 필요성이 생긴다. 이것을 노리는 전략을 SEO(Search Engine Optimization), 검색엔진 최적화라고 한다. 보통은 정직하게 태그를 알맞게 정리하거나 보안기준을 충족하는 식이지만 포털 사이트 가이드라인을 위배해도 현행법상 문제의 소지가 없기 때문에 의뢰받은 대로 실적만 올리면 장땡인 블랙햇 SEO업자들과 양심 없는 광고주들은 편법을 동원한다.키워드 스터핑은 검색 엔진이 페이지 내용을 크롤링할 때 키워드 카운트가 높을수록 검색 정확도를 후하게 책정하는 점을 악용하는 것이다. 후술할 여러 가지 방법으로 키워드를 꽉꽉 채워넣으면 그 내용이 유익한지 아닌지에 관계 없이 각종 포털, 검색 엔진에서 상위 노출될 가능성이 높아진다. 검색 엔진도 이에 대응해서 각종 최적화 기법을 개발하여 이런 페이지들을 검색 결과에서 제외하고 있다.
키워드를 쑤셔넣는 방법은 다양하지만 2010년대부터 검색 엔진이 잘 발달되어 있어 이런 페이지들은 거의 모두 걸러진다.
- 단순히 본문에 키워드의 입력을 여러 번 반복
- 본문에 키워드를 포함하되 배경 색과 같은 폰트 색, 또는 이미지 뒤에 위치시키는 등 정상적인 페이지처럼 보이게 위장
- 메타 태그, 알트텍스트(alt-text), HTML 소스의 no frame 섹션 등 페이지 렌더링 시 출력되지 않는 부위에 키워드 다량 포함
2.1. 한국에서
한국에서도 2000년대 초중반에는 검색 엔진 로직이 정교하지 않아 키워드 스터핑된 쓰레기 페이지들이 사람을 자주 낚았다. 키워드 밀도가 비정상으로 높은 페이지를 쉽게 거르는 검색엔진을 속이기 위해서 단순히 한 단어를 반복하는 게 아니라 의미 없는 문장을 문맥에 맞지 않게 배열하고 그 사이에 광고단어를 끼워넣는 방식이 흔했다. 예시번역체로 보이는 부분도 있고 소설이나 비문학 글의 여러 문장을 토막내어 짜깁기한 흔적도 있으며 인코딩 문제였는지 한자나 각종 깨진 문자가 들어가 있기도 했다. 기만용 문장을 숨기려는 노력조차 없어서 대놓고 사기라고 알려주는 초보적인 수준이었지만 그걸 구분하지 못하는 봇을 속여 광고실적 쌓기엔 충분했고 사기인 걸 구분하지 못하는 사람들까지 속이는 효과도 있었다. 첨부된 파일은 별도로 첨부하기도 하지만 텍스트에 하이퍼링크가 포함되는 경우도 많은데 보통 다운로드 매니저라는 이름으로 설치를 유도해 애드웨어를 감염시켰고 링크는 쇼핑몰이나 웹하드에 연결되는 일이 흔했다.
당시를 추억하는 사람들은 낚시 당했던 그 때의 기억을 살려 이를 재현한 드립글을 인터넷 커뮤니티에 가끔 올리곤 한다. 제목은 같은 커뮤니티 유저들이 솔깃할 만한 파일이나 토렌트 링크 등을 나눠주겠다는 식으로 적절히 짓고 본문은 어디서 많이 본 사진 한 장과 키워드 스터핑으로 메우는 것이다. 키워드 스터핑을 기억하는 유저들은 "제가 찾던 ○○○ 여기 있었네요 ^^ 감사합니다~" 또는 "잘 받아가요" 등의 댓글로 동조해 준다. #1 #2
간첩 블로그, 라조육이사이 괴담이 이와 연관되어 있다.
블로그를 통한 바이럴 마케팅이 횡행하던 00년대 말 10년대 초에 뒷광고를 받은 파워블로거들이 홍보 포스팅을 올리면서 네이버 검색 첫페이지에 올라오기 위한 팁으로 반복적인 키워드를 포스팅에 삽입했는데 역시 키워드 스터핑의 원리와 동일하다.