블로그 키워드분석을 할 수 있는 툴을 만들다
2016.10.14. 17:54

블로그 키워드분석을 할 수 있는 툴을 만들다

2016.10.14. 17:54

URL 복사 http://windy7812.blog.me/220836300401

2년 넘게 손뗐던 블로그를 다시 시작했습니다.
몇 개의 글을 포스트 했는데 영 반응이 오지 않아 발만 동동 굴렀습니다.

문제점을 찾고자 구글 등에 관련 글을 찾아봤으나 해당 글들은 대체로 각 사가 제공하는 통계 툴 등을 활용하는 방법에 그치는 등 유용한 정보를 얻을 수 없었습니다.

우리는 4년 넘게 어플을 제작하고 스토어에 런칭하면서 느끼고 배웠던 키워드 선정 요령을 떠올리며 블로드 키워드 분석 툴을 만들기로 했습니다.

앱서비스의 경우는 신규 어플을 런칭하기 위해서 키워드 간의 자리잡기가 필수입니다. 
경쟁 어플이 점해놓은 키워드 내에서 연관으로 뜰 수 있게 키워드 작업을 해야만 합니다.
상세 페이지에 있는 제목뿐 아니라 상세내용에 있는 키워드를 모두 분석하여 연관 어플로 이어질 수 있게 상당한 공을 들여야 합니다.

블로그도 이와 유사한 문제가 발생됐습니다. 글을 써도 전혀 검색에 노출되지 않고 하루 방문자 수가 극히 적어 블로깅 의욕이 꺽이는 것이었습니다. 우리 팀은 장시간 회의 끝에 제대로 문제를 풀어보자 다짐을 하고 블로그 키워드 분석 툴을 만드는 작업을 시작했습니다.

실제 개발한 사항이 거창하거나 새로운 것은 아닙니다. 다만 그동안 앱을 개발하며 배웠던 노하우를 접목했고 블로깅을 새로 시작하며 좌절했던 실무사항들 만을 정리하여 기존 시중에 나와있는 시스템을 개량하는 수준으로 작업이 진행되었습니다. 







내가 쓴 포스팅 글의 빅데이터를 확인하다

하나의 글을 정성스럽게 써내려가면 천 자 정도는 손쉽게 넘어갑니다 .
단어들의 중복 빈도수는 얼마이고 어떻게 조합이 되어 검색에 노출되는 지 쉽게 알기가 통 어렵습니다. 
이럴 때 흔히 구세주로 등장하는 모형이 있습니다. 바로 네이버 빅데이터 캠페인에서 사용한 텍스트 모형입니다.
객관적인 데이터를 바탕으로 텍스트 들이 모형으로 나타나고 키워드들 간 연결고리를 파악하기가 유용한 모델입니다. 

우리도 유사하게 텍스트 추출 알고리즘을 이용하여 빅데이터 모형을 만들었습니다.
10월 12일에 쓴 "시장을 분석하여 데이터 분석 사이트를 만들다 2편"을 분석한 데이터 모형입니다.







많은 빈도수를 가진 키워드는 굵고 크게, 적은 빈도수는 적고 얇게 보이게끔 제작되었습니다.







분석이 34회의 빈도수를 보여 가장 많고 그 뒤로 키워드 데이터 등이 뒤를 따르고 있습니다. 





키워드 빈도수를 토대로 빅데이터 모형으로 글이 나타내주는 의도와 목표를 알 수 있습니다. 
다양하게 키워드 들을 조합하여 의미있는 검색 키워드를 추출할 수도 있습니다. 

이번엔 다양하게 조합하여 만든 키워드들을 생성하는 방법과 결과가 어떻게 나오는지를 
검색해 본 키워드 순위와 함께 보여주도록 하겠습니다.







포스팅 한 글의 키워드 순위를 한 눈에 파악할 수 있다

일반적으로 글을 쓰고 30분이 지나면 네이버 검색엔진이 해당 글을 긁어갑니다. 
긁어간 내용을 토대로 키워드를 분류하여 검색 엔진에 노출시켜줍니다

키워드 분석 6위를 차지한 '요구분석'이라는 키워드를 클릭하여 순위를 확인해 보겠습니다.




실제 네이버 블로그 검색 창에서 21위에 랭크되었는지 확인합니다(2016년 10월 14일 기준)






이번에는 궁금한 키워드를 실제 검색하여 순위를 알아보도록 하겠습니다.
글제목에 들어있는 데이터분석이라는 키워드로 검색해 보겠습니다. 


60위에 랭크되는 걸로 확인됩니다.

 실제 네이버 검색 창에도 60위로 나옵니다.




우리가 제작한 데이터 분석기로 추출한 순위와 네이버에서 보여주는 순위가 일치하는 것을 알 수 있습니다.
위 도구는 작성한 키워드가 몇 위에 랭크되었는 지 즉시 확인이 가능하기 때문에 키워드 관리에 매우 유용합니다. 
정성들여 쓴 글을 허투루 날려 버릴 위험을 줄여줄 수 있을 것입니다. 






향후 보완할 사항은?

만든 지 막 하루가 지났습니다. 이제부터 우리는 수많은 테스트를 할 예정입니다.
다양한 방법으로 테스트를 해보고 여러차례의 QA를 통해서 성능을 최대한 높일 예정입니다. 
값을 산출하는 시간을 단축시키고 여러 단계에서 나올 버그들을 수정할 것입니다. 

1단계 완료로 자동으로 키워드를 분석하고 빅데이터 모형까지 산출하는데 성공했습니다. 물론 키워드 순위까지 쉽게 뽑았습니다.
향후 2단계로 10권 내지는 30위 권을 유효키워드로 보고 자신의 글에 얼마나 유효키워드가 생성되었으며 시간 순으로
등락을 확인할 수 있게 차트모형을 개발할 생각입니다.

1단계가 막 끝난 상태입니다.
2단계 기획이 시작되었습니다. 기획이 완료되는 시점에 다시 한번 진심 포스팅으로 유용한 정보를 드리도록 하겠습니다.

개발의뢰