① 검색노출 그리고 유사문서가 뭔가요?
블로그의 방문자수의 80%이상은 검색을 통해서 유입되게 됩니다. 따라서 검색 노출이 안되면 아무리 많은 컨텐츠가 있더라도 방문자수 증가는 이뤄지지 않습니다. 그런데 가장 흔하게 실수하는 경우가 컨텐츠를 블로그에 많이 넣으면 방문자가 늘겠지 하며 유사문서를 대량양산하는 경우가 되겠습니다. 실제로 포스트 갯수가 4000개가 넘는데도 일일 방문객은 2~300명이 고작인 블로그도 흔하게 보입니다.
또 자신은 유사문서를 만들지 않았다고 스스로가 오해하는 경우도 다반사입니다. 이러한 유사문서의 실사례를 통해서 애써 작성한 포스트를 유사문서로 만들어 검색 노출기회조차 주어지지 않는 블로그 포스팅 요령에 대해서 설명드립니다.
만약 유사문서의 개념과 문제점을 잘 모르시는 경우라면 다음의 관련링크 포스트를 먼저 확인해 주시면 되겠습니다.
② 유사문서로 분류된 실 사례들
유사문서 실사례를 소개하기 위해서 전체 포스트량이 적은 키워드 그리고 유사문서가 다량 생성되었을 것으로 짐작되는 “갤럭시노트3 블러쉬 핑크” 라는 키워드를 기준으로 네이버 검색노출을 점검해 보았습니다.
예상대로 유사문서가 다량 생성되어 있었습니다.
[pe2-image src=”http://lh3.ggpht.com/-lve1XHS7UO8/UtpC-eGPtJI/AAAAAAAAAoE/2WPNOk6PM2I/s144-c-o/search_result.jpg” href=”https://picasaweb.google.com/102394476629197694908/201402#5970157897031595154″ caption=”” type=”image” alt=”search_result.jpg” ]
왼쪽은 그냥 검색하면 나오는 검색화면입니다. 오른쪽은 유사문서 포함 검색을 누른 상태에서의 검색결과입니다. 기본검색은 321건의 포스트가 검색되었으며 유사문서를 포함했을경우는 2배가 넘는 660건의 포스트가 검색되었습니다. 약 340개의 포스트는 유사문서로 분류되어 검색기회조차 제공되지 않는 것입니다.
[pe2-image src=”http://lh5.ggpht.com/-MorKUPULEMo/UtpC-Ig2TGI/AAAAAAAAAoA/aVqgz7GnPrE/s144-c-o/example_01.jpg” href=”https://picasaweb.google.com/102394476629197694908/201402#5970157891237596258″ caption=”” type=”image” alt=”example_01.jpg” ]
가장 먼저 3번째 페이지에서 유사문서(*적색박스)가 발견되었습니다. 만약 유사문서로 분류되지 않았다면 적어도 3번째 페이지에는 노출되었을 포스트입니다. 왜 유사문서로 분류되었을까요? 가장 흔한 경우입니다.
삼성전자에서 내보낸 신제품 홍보 보도자료를 그대로 복사해서 붙여넣은 후 포스팅을 했습니다. 당연히 유사문서 분류대상이며 검색기회는 박탈당합니다. 지속적으로 양산할 경우 블로그 지수도 대폭 낮아져 정상적인 포스팅을 해도 상위노출은 거의 어렵다고 보시면 되겠습니다.
좀 더 하단에서 또 하나의 유사문서로 분류된 포스트가 발견되었습니다. 이번에는 어떤 이유일까요?
언뜻보면 전혀 유사문서가 아닌 것 같습니다. 하지만 첫번째 유사문서(보도자료 원본)의 내용을 상하 위치 문장들을 바꾸고 재배열하여 구성했습니다. 문장의 주요 핵심 문맥들이 그대로 일치하기 때문에 유사문서로 분류되었습니다.
이외에 상위노출을 의도하고 검색노출을 희망하는 키워드들에 컬러를 넣거나 Bold등으로 강조하는 편집을 했습니다. 하지만 그냥 유사문서 분류입니다. 기본적인 컨텐츠 작성방법이나 블로그 운영방법에 대한 지식없이 인터넷상에서 쉽게 떠도는 근거가 희박한 상위노출 팁들만 적용한 경우라고 하겠습니다.
4번째 페이지에서 또 다른 유사문서 분류 포스트를 확인했습니다. 이번에는 삼성의 보도자료 원문을 사용한 경우가 아닌데도 유사문서 분류가 되어 버렸습니다.
[pe2-image src=”http://lh6.ggpht.com/-n7DSvID-QjI/UtpDnlr1yAI/AAAAAAAAAoU/Gls5G_Eongs/s144-c-o/%2525EC%252582%2525AC%2525EB%2525A1%25258003.jpg” href=”https://picasaweb.google.com/102394476629197694908/201402#5970158603442964482″ caption=”” type=”image” alt=”사례03.jpg” ]
뭐가 문제였던 것일까요? 본문을 보면 스크롤을 꽤 해야만 포스트 내용을 다 읽을 정도로 사진이 다수 포함되어 있습니다. 그리고 그 중간 중간에 텍스트가 있는 포스트였습니다. 하지만 텍스트 부분만 메모장에 정리하여 보면 위와 같은 내용입니다.
충분하지 못한 텍스트분량에 이미지를 잔뜩 넣고 링크 주소를 넣는 케이스는 전형적으로 스패머들이 상위노출을 위해 작성되는 포스트의 패턴입니다. 검색엔진이 기본적으로 분류하는 유사문서 포함기준에 딱 ~ 부합되는 작성방식이라고 하겠습니다.
충분한 텍스트 없이 다수의 이미지를 중심으로 작성된 포스트는 유사문서로 분류되기 쉽고 설령 그렇지 않더라도 퀄리티가 낮은 컨텐츠로 분리되어 상위 노출이 되지 않습니다.
어떤 포스트들이 유사문서가 되는지 확인해 보시고 유사문서가 된 포스트들의 컨텐츠 작성방식을 피하시면 되겠습니다.
- 워드프레스 테마 오픈마켓 테마포레스트- Theme forest
- 워드프레스 추천테마 관련 포스트 - AVADA / JARIDA / SAHIFA / GOODNEWS
2 Comments
구리
음 유사문서에 걸리지 않도록 조심해야겠네요!!
Giantt
몇가지 원칙만 지키셔도 충분하리라 판단됩니다.
충분한 량의 텍스트와 적당한 이미지삽입 그리고 직접 작성한 글로 포스팅.
이정도만 지키시면 큰 문제는 없으실 것입니다.