사실상 유명무실한 역할만 하던 네이버 웹마스터도구를 구글 웹마스터도구 의 역할수준까지 끌어올리면서 자동화 웹문서 노출 시스템을 만들어가던 네이버의 다음 수순은 무엇일까요?
이제 사이트 등록이나 컨텐츠 색인, 등록의 과정을 사용자의 몫으로 넘겨준 네이버가 취할 다음의 행동은 당연히 양질의 문서를 제대로 노출시켜줄 노출 시스템의 개선이라고 하겠습니다.
이러한 웹문서 노출시스템 개선을 위한 프로젝트가 바로 네이버 그리핀(Griffin) 프로젝트입니다. 네이버 블로그나 카페처럼 자체 서비스 내부 시스템에 편입된 경우는 일정한 패턴이 있기 때문에 고유한 노출시스템의 적용이 비교적 쉬운 반면 웹문서는 고정된 형식을 취하지 않기 때문에 고도의 기술이 필요한 부분이라고 하겠습니다.
물론 빠르게 문서를 수집하고 분류하기 위한 대용량 서버 시스템에 대한 하드웨어적인 투자도 필요합니다. 최근 네이버는 그리핀 프로젝트 버전 1.0 정책을 발표했다고 할수 있습니다.
가장 먼저 취한 정책은 그동안 분류되어 노출되던 웹사이트 정보와 웹문서 영역을 통합하여 보여준다는 정책입니다. 구글 처럼 사이트 메인주소와 웹문서가 혼재되어 검색노출 되는 방식이 된다는 의미입니다.
특정한 과도기간을 거쳐 네이버의 웹문서 노출영역과 웹사이트 노출이 통합되어 보여주는 모습이 될 것으로 보여집니다.
그리핀 프로젝트는 크게 3가지 방향으로 추진되고 있습니다.
1.수집시스템 개선
수집시스템의 경우 수집시스템의 하드웨어적인 서버 양과 사양을 높여주면 일단 물리적으로 대응이 가능합니다. 물론 SW적인 개선이 필요하지만 HW적으로 빠른시간내 대응이 가능할 것입니다.
2.스팸시스템 개선
스팸시스템의 개선의 경우 HW적인 부분보다는 SW적인 부분의 개선이 필요한 상황으로 최근 도입하기 시작한 딥러닝 기술이 적용된다고 합니다. 즉 AI를 통한 학습적인 스팸필터링 시스템이라고 하겠습니다.
이러한 경우 일정시간의 학습시간이 필요하므로 초반에는 오류도 잦을 것으로 보여지지만 시간이 갈수록 안정화가 이뤄지고 자동으로 새로운 스팸 시스템 돌파 시도를 차단하는 개념이 만들어질 것으로 보여집니다.
3.검색랭킹 시스템 개선
공신력이 있는 출처 – 높은 신뢰도 사이트로 부터의 링크등
작성자와 게시물 평판 – 해당 게시물 또는 글 작성자가 작성한 게시물의 전체 체류시간 계산을 통한 평판 계산등
화제성 – 얼마나 많은 사람들이 해당 게시물을 보고 있는지 등
기존에 이미 평가되고 있는 일반적인 요소들이 반영되는 단계로 보여집니다. 향후 이러한 간단한 항목들에 대한 디테일한 분석요소가 증가되면서 좀 더 신뢰성이 있는 검색 랭킹 시스템이 될 것으로 보여집니다.
네이버가 웹문서 검색 서비스에 대해서 진행중인 그리폰 프로젝트와 관련된 보다 상세한 사양은 이곳 링크를 참조하시면 되겠습니다.
그리폰 프로젝트가 만약 성공적으로 진행된다면 그동안 구글에 비해서 절대적으로 취약했던 웹문서 검색영역도 크게 개선될 것으로 생각됩니다.