기타/팁

C-Rank / D.I.A : 검색 최적화를 위해 알아야할 두가지 알고리즘

코드아키택트 2022. 7. 31. 01:23
반응형

네이버 검색이 잘되려면 네이버 검색 알고리즘을 알아야 한다. 자료를 찾던 중 C-Rank알고리즘과 D.I.A 알고리즘이 궁금해 정리해본다. 비록 네이버 블로그 알고리즘이지만, 블로그를 운영하는 여러 사람들에게 도움이 되는 내용이 되지 않을까 싶다.

 

C-Rank와 D.I.A 

 

  C-Rank와 D.I.A, 블로그 지수 결정요인을 정리해보면 아래와 같다. 

블로그 지수 결정요인 얼마나 오래 / 자주 / 상호작용(댓글 공감 등) / 주목도 지수(각 글의 품질)
C-RANK 집중도(Context), 정보의품질(Context), 소비 및 생산의 연쇄반응(Creator)를 이용 블로그가 얼마나 믿을 수 있는지
D.I.A(Deep Intent Analysis) 데이터 기반, 키워드 별로 사용자들이 선호하는 문서에 대한 점수를 랭킹에 반영한 모델

 

결국 C-RANK와 D.I.A가 높으면 좋다(가로축 C-Rank, 세로축 D.I.A)

  위의 그래프를 다시 해석해보면 C-Rank가 상위노출에 있어선 좀 더 지배적인 역할을 하는 것을 볼 수 있다. 먼저 C-Rank를 알아보자

 

C-Rank : 블로그의 신뢰도를 평가하는 알고리즘

 네이버 검색 블로그에 의하면 "주제별 관심사의 집중도는 얼마나 되고(Context), 생산되는 정보의 품질은 얼마나 좋으며(Content), 생산된 콘텐츠는 어떤 연쇄반응을 보이며 소비/생산되는지(Chain)를 파악해 이를 바탕으로 해당 블로그가 얼마나 믿을 수 있고 인기 있는 블로그인지(Creator)를 계산" 한다고 되어 있다. 

 위의 단어 중 "주제별 관심사의 집중도(Context)"라는 말이 바로 와닫지는 않았는데, 글을 좀 더 읽어보니 다음과 같은 말을 하고 싶었던 듯하다.

김치 예시

<검색 모델이 적용된 '관련도순' 검색 결과와 '최신순' 검색 결과>

  "김치"라는 키워드를 검색한다면 관련도가 가장 높은 글이 제일 위로 올라와야 할 것이다. 위의 예시를 보면 왼쪽에는 관련도순, 오른쪽은 최신순으로 정렬된 것을 볼 수 있다. 문서 안의 내용들을 파악해서 가장 관련이 높은 문서를 제일 위에 보여주는 것이 핵심이다. 만약 이런 과정이 없다면 글이 올라온 순서대로 내 눈앞에 펼쳐질 것이다.

 

만약 김치에서 대장균 검출 소식이 현재 이슈라면?

 위와 같은 경우에는 평소와 다르게 김치에서 대장균 검출된 내용 중 가장 적합한 문서가 위로 올라와야 할 것이다. 아래는 그 예시다.

<시의성에 따른 '관련도순' 검색 결과>

 이렇게 현재의 상황을 반영한다는 것을 "주제별 관심사의 집중도(Context)"라는 말로 한 것으로 보인다. 

블로그 검색을 위한 C-Rank

특정 주제에 대해 이 블로그가 얼마나 진심인가

 앞의 C-Rank를 보면 이런 생각이 들 수도 있다. "그냥 요즘 핫한 주제만 다루면 되는 거 아닌가?" 사실 그것도 틀린 말은 아닌 것으로 보인다. 근데 네이버에서는 일반 검색(원문에선 Live검색)과 블로그 검색용 C-Rank알고리즘을 약간 다르게 만들어 놓았다. 만약 Context만 고려한다면 그때그때 핫한 주제를 다루는 블로그만 상위 노출될 것이기 때문이다.

 전문적인 글 하나가 아무렇게 쓴 글 100개보다 낫다

 산후 다이어트 예시

<C-Rank 적용 전후 블로그 검색 결과의 차이> 왼쪽은 광고성이 짙어 보인다

 위와 같이 C-Rank를 이용하면 광고성과 그렇지 않은 글을 어느 정도 판별해 낼 수 있다. 그 이유는 00피트니스의 경우 다이어트와 관련한 전문적인 글을, xxx출산상담센터에선 산모와 관련된 전문적인 내용지속적으로 포스팅했기 때문이다. 이를 통해 블로그의 신뢰성과 인기도가 계산되어 검색 결과에 반영되는 것이다.

 

C-Rank에 반영되는 정보

 이렇게 쓰여있으면 어느 정도는 참고할 수 있지만 정확히 알 수는 없다. 사실 기업 입장에서도 그럴만하다. 알고리즘을 완전히 공개하면 누군가는 그것을 악용할 것이다. 이 항목 뒤에 감춰진 네이버 블로그의 철학을 내 언어로 쓰면 다음과 같다.

 

내가 대상으로 하는 독자들이 원하는 전문적인 내용을 꾸준히 그리고 그들이 읽고 싶게 쓴다

  여기서 중요한 것은 내가 대상으로 하는 독자와 특정 분야를 최대한 오래 끌고 가는 것이라고 본다. 안 그러면 글이 이것저것 중구난방이 될 것이다.

C-Rank 알고리즘의 미래

차별화된 콘텐츠가 잘 노출되도록 하는 방향성 / 좋은 문서를 모아 패턴화

 원문이 이미 6년 전에 쓰인 글이기에 여러 가지 개선이 있었을 것으로 보인다. 그렇기에 글에서 어떤 철학을 가지고 움직이는지를 파악하는 게 중요했다. 그리고 그걸 정리해보면 두 가지다. 하나는 본인의 차별화된 콘텐츠, 다른 하나는 좋은 글을 계속해서 만들어 내는 것. 

 

그렇다면 이제 네이버가 좋은 글을 어떻게 판별하는지 알아볼 차례다.

 

D.I.A(다이아)

출처가 아닌 글의 점수화

 C-Rank는 글의 점수보다는 블로그 자체가 얼마나 믿음직한가를 측정한다. 비유하면 피아노를 치는 사람이 쓰는 피아노 리뷰가 좀 더 정확할 것이다라는 생각과 비슷하다. 하지만 피아노 치는 사람이 Python에 대해 쓴 글이 때론 누구보다 훌륭할 수도 있다. 이런 경우를 위한 게 D.I.A라고 보면 되겠다.

 D.I.A에 반영되는 요인들은 다음과 같다. 주제 적합도, 경험 정보, 정보의 충실성, 문서의 의도, 상대적인 어뷰징 척도, 독창성, 적시성 등. 모든 것을 한 번에 만족하는 글을 쓰기는 어려워 보인다. 하지만 위의 키워드를 몇 가지 조합해보면 어떤 글을 써야 할지 대략 감이 잡힌다. 적합한 주제에 대한 본인의 경험을 충실하고 독창적으로 쓴다 던 지 시의에 맞는 글을 어뷰징을 하지 않고 충실히 쓴다 등의 전략을 세울 수 있겠다.

 

 C-Rank와 D.I.A

 앞에서 말한 C-Rank와 D.I.A를 그래프로 보면 위와 같다. 물론 글의 서두에서도 가져왔지만. 그래프로 보면 결국 C-Rank가 가장 중요한 것을 볼 수 있다. 이를 풀어서 말하면 다음과 같이 얘기할 수 있다. "특정 주제에 대해 글을 꾸준히 쓰며, 그 글을 기획하여 의도를 만들고 의도에 맞게 정보를 충실하게 제공한다". 이렇게 해야 적합한 주제, 문서의 의도, 정보의 충실성 등 D.I.A와 C-Rank를 위한 조건을 만족시킬 수 있을 것이다.

D.I.A Q&A

 아래는 Q&A에 있던 글을 요약해서 적어보았다.

 Q : D.I.A 기반 문서는 최신성이 떨어지지 않는지?

 A : 최신성 보다 중요한 건 신뢰할 수 있는 글(유저 피드백 기준). 최신성과 신뢰성 둘 다 잡으려 노력. 오래된 문서도 만족도가 높으면 상위 랭킹.

Q : 소소한 글쓰기로 상위 노출?

A : C-Rank, D.I.A 점수가 중요. 데이터로 보면 본인 경험기, 누구나 선호할 상세정보, 특정분야 깊이 있는 의견 선호

https://m.blog.naver.com/PostView.nhn?blogId=naver_search&logNo=221266339171&proxyReferer=

위 링크 참조

Q : 매일 쓰면 불이익?

A : X. 주기와 관련 없음. 다만 비 체험 후기는 문제 될 수 있음. 

 

끝맺으며

 오늘은 네이버 검색에 노출되기 위한 네이버 검색 알고리즘에 대해서 알아보았다. 회사 내부에선 여러 가지를 쓰겠지만 C-Rank와 D.I.A에 대한 글이 있어 이들을 정리해봤다. 현재 블로그 관련 3권의 책을 읽어봤는데, 그들과 알고리즘이 하려는 얘기는 거의 비슷해 보인다. "꼼수 부리지 말고, 특정 주제에 대해서 꾸준하고 성실하게 글을 써라". 결국 알고리즘이란 건 상황에 따라 변할 수 있다. 그렇기 때문에 그 뒤에 숨겨진 정책, 그리고 그 정책 뒤에 숨겨진 방향성과 철학을 읽고 블로그를 운영해 나가는 것이 잘되는 블로그를 만드는 비결 아닐까.

 

끝.

 

https://m.blog.naver.com/naver_search/220774795442

https://m.blog.naver.com/naver_search/221297090120

https://help.naver.com/service/30008/category/4099?lang=ko

https://m.blog.naver.com/naver_search/220774795442

반응형