경험들/etc

[SEO공부] SEO 기초 - 검색은 어떻게 이뤄지는 걸까?

detail_jy 2021. 3. 27. 17:12
728x90

 

 

검색은 어떻게 이뤄지는 걸까?

 

 

intro.

나는 디지털 마케팅 분야의 직무로 꼭 취직을 목표로 한다기보다는, 요즘 시대에 나중에 어떤 일을 하게 되던, 디지털 환경에서 퍼스널 브랜드나 내가 판매하는 제품 또는 서비스를 내가 원하는 타겟 오디언스에게 효과적으로 보여지는 것이 중요하다고 느껴서 계속 이제껏 미뤄온 마케팅 공부를 차근차근 시작해보려한다. 배울게 너무 넘쳐나 하루라도 빨리 공부를 시작하는것이 유리하다. 

 

최근 그림 유튜버 이연님의 영상을 통해 새로운 것을 배울때의 마음가짐에 대해 다시 한번 상기 시켜줘서 공부를 시작할 동기부여가 조금 된 것 같다. 


뭐든 처음 배울 때는 그 분야에 대해 아는 것이 없으니 배우고자하는 개념/키워드에 대한 정의 부터 뭔지 찾아보는 것부터 시작하라 이런 얘기였다. 너무 멀리 내다보면 시작하기도 전부터 배워야하고 알아야할 게 너무 많아 지레 겁먹고 포기할 수 있어서, 지금 내수준에서 이해 할 수 있는 기초적인 개념부터 차근차근 하는거다. 

 

디지털 마케팅은 매우 광범위해서 사실 뭐부터 공부를 해야하고 어떤 분야를 파는것이 좋을지 감이 안잡히는 상태이지만

우선은 블로그를 운영하면서도 꼭 알아야하고, 가장 배우고싶던 SEO에 대해 알아보고, 블로그에 배운 내용을 정리해보려한다. (정리 안하면 읽자마자 바로 까먹기 때문에...) 

 

온라인 상에서의 성공은 SEO(검색엔진최적화)에 달려 있다고 해도 과언이 아니다.

SEO는 그 어떤 형태의 웹사이트든(이커머스, 콘텐츠플랫폼, 블로그 등등) 검색 엔진에 특정 키워드로 검색했을 때 쉽게 찾을 수 있고, 검색결과 상위 랭킹에 올라가게끔하여 웹사이트의 트래픽을 높이고 궁극적으로는 최대한 많은 잠재 고객/오디언스가 웹사이트에 방문하도록 유도하는 작업이라고 보면된다. 

 

실제로 SEO를 실행하려면, 먼저 검색엔진이 작동하는 원리를 알면 이해에 많은 도움이 된다. 

 

이번 포스팅은 검색에 대한 원리를 알아보는 내용을 다루었다! 

<검색엔진이 우리가 원하는 정확한 정보를 찾아주는 원리>

우리는 하루에도 수십번씩 검색을 통해 실시간으로 필요한 정보를 손에 쥘 수 있다.

검색엔진은 한마디로 복잡한 컴퓨터 프로그램이다.

검색엔진은 미리 준비작업을 거쳐 누군가 어떤 단어로 검색을 했을 때 0.5초만에 가장 좋은 결과물들을 추려 검색결과창에 나타나게 해준다. 이 준비작업에는 크게 3단계로 나누어진다. 

 

 

 

'셀프인테리어' 키워드로 검색한 구글 검색결과 화면

 

 

 

Step 1. 크롤링 (Crawling)  - 정보 탐색 과정 

크롤링의 '크롤'은 기어다닌다는 뜻이다. 

 

검색엔진은 다수의 스파이더(웹크롤러)를 통해 웹상에 공개되어있는 모든 정보를 찾는다. 

크롤링을하는 검색엔진스파이더들은 방대한 인터넷을 스캔하여 웹사이트를 게재할수있도록 하는 호스팅 서버(웹서버)들을 찾는일을 한다. 

 

1. 크롤을 시작할 웹서버의 목록을 만들고, 각 웹서버가 호스팅을 하고 있는 웹사이트의 목록도 만든다. 

2.스파이더는 각 웹사이트를 다양한 방식을 통해 방문하고, 웹사이트의 정보를 스캔한다.

  -웹페이지 수, 콘텐츠의 종류가 텍스트인지, 이미지인지, 영상인지, 아니면 다른 포맷인지 파악하고 정보를 수집한다. 

 - 웹사이트내 페이지 수 뿐만 아니라 걸려 있는 모든 내부 링크 또는 외부 사이트로 가는 외부링크도 추적하여 더 많은 웹페이지를 발견해낸다. 

 - 이 작업을 한번만 하는게 아니라 지속적으로 하고, 웹사이트가 현존하는한 모든 수정사항, 추가되거나 삭제된 페이지, 업데이트된 링크 등등 모든 사항에 대해 트래킹을 한다. 

- 이 크롤링 작업을 이 세상의 웹 상 현존하는 모든 웹페이지를 대상으로 진행한다. 

3. 검색엔진 최적화를 하기 위해선, 내 웹사이트 내 정보를 스파이더가 잘 스캔하고 파악할 수 있는 환경을 만들어줘야한다. 내 웹사이트가 크롤링이 어려운 상태라면 검색엔진은 내 페이지를 검색결과에 상위랭킹은 커녕 검색결과에 노출되지도 못할 수도 있다. 

 

Step 2. 색인 (Indexing) - 정보 분류 과정 

Index란? 

인덱스는 보통 책의 맨 마지막 부분에 저자가 다룬 특정 주제/지명/이름에 대해 인용한 레퍼런스의 정보를 알파벳/가나다순으로 분류하고 독자가 쉽게 원하는 정보를 사전찾아보듯 찾을 수 있도록 정리를 해놓은 섹션이다. 

 

 

책 뒷부분에 간혹 있는 인덱스(찾아보기)

 


검색엔진의 색인과정 (Indexing)도 같은 일을 하는 것이다. 

 

크롤러들이 발견해낸 정보를 정리하고 소팅하고 검색엔진의 데이터베이스(index)에 저장하여 검색엔진 알고리즘이 필요한 정보를 쉽게 소화시킬 수 있도록 하는 과정이다. 

- 모든 정보를 저장하지는 않고, 검색엔진 알고리즘이 필요한 주요한 정보들 위주로 저장을한다 (알고리즘이 변경됨에 따라 어떤 정보를 저장할지도 바뀔 수도 있다는 뜻) 

  ㄴ웹페이지 생성/업데이트일, 제목, 상세내용, 콘텐츠 형식, 연관된 키워드, 유입링크, 외부링크 등등 

 

*색인과정이 중요한 이유! 

   - 웹사이트가 검색엔진의 index에 저장되어 있지 않는다면 검색을 해도 결과에 뜨지 않는다. 

   - 검색엔진 index에 내 웹페이지가 더 많이 저장될수록 검색결과에 나타날 확율이 더 높아진다. (그래서 블로그에 글을 최대한 자주 올릴수록 좋다고 하는 것이었군..!) 

 

*하지만 색인을 한다고 검색결과에 상위노출되는 것은 아니다.

*상위노출을 위해선 SEO작업이 필수! 

 

Step 3. 랭킹 (Ranking) - 검색결과내 정보 노출 순위 

마지막 단계는, 검색을 했을 때 검색엔진이 어떤 웹페이지들을 어떤 순서로 결과화면에 나타낼지 정하는 과정이다. 

검색엔진의 알고리즘에 의해 랭킹이 정해지는데, 이 알고리즘은 사용자가 어떤 정보를 찾고 있고, 어떤 웹페이지를 가장 우선순위로 보여줄지 분석하는 소프트웨어라고보면 된다. (구글에서는 '페이지랭크'라는 알고리즘을 사용한다고 한다.) 

 

검색엔진 알고리즘은 계속 해서 발전하고 있고 점점 더 복잡해질 수 밖에 없다.

2001년 쯤의 알고리즘은 무척 단순했다. 그만큼 분류해야하고 노출시켜야할 웹페이지가 많지도 않았기 때문. 그 시절의 알고리즘은 검색한 단어와 웹페이지의 제목이 일치하면 노출될정도로 단순했다. 

 

하지만 요즘엔 구글의 랭킹 알고리즘은 250여개의 규칙(더 많을 수도 있음)을 통해 랭킹을 정하고, 그 규칙이 무엇인지는 아무도 정확히 모른다고한다. 구글 설립자들도 모른다고한다.

 

또한 머신러닝을 통해 웹페이지 상의 정보만으로는 파악할 수 없는 부분까지 유추할 수 있도록 고도화되고 치밀한 알고리즘을 바탕으로 검색결과 랭킹에 대한 결정을 한다고한다. 

 

검색결과 랭킹이 이루어지는 과정 

 1. 쿼리 분석 _ 사용자가 검색한 쿼리(검색내용)를 키워드 단위로 쪼개 어떤 정보를 얻고자하는지 분석하여 파악한다. 

   EX) '리코타치즈 만드는 법' 이라고 검색을 했을 때, 검색엔진은 '만드는 법' 이라는 키워드를 통해 사용자가 리코타치즈를 만드는 방법을 알려주는 레시피 콘텐츠를 찾고있다는 것을 유추해 내 해당 레시피가 있는 웹페이지 결과들을 검색창에  노출시킨다.  

  EX) 어떤 제품을 검색하면 그 제품을 판매하는 이커머스 사이트를 노출시킨다던지, 가장 연관성이 높아보이는 검색결과를 나타내는 것이다. 

 

또한 알고리즘은  머신러닝을 통해 검색어의 오타를 감지하도록 하여 오타가 있어도 정상적으로 검색했을 때의 결과가 나타나게 하고, 다른 키워드지만 같은 것을 의미할 때 동일한 검색결과가 나타나게하는 등 여러가지 변수를 고려해 검색자가 필요로하는 정보를 파악해 양질의 정보를 정확히 제공하기 위한 작업을한다. 

 

2. 쿼리와 매칭되는 정보를 담고 있는 페이지 찾기

- 검색엔진은 크롤링한 정보가 잘 정리되어있는 인덱스로부터 쿼리에 대한 가장 정확한 정보를 가지고 있는 페이지들이 무엇인지 결정한다. 

- 최대한 빠르고 정확한 결과 페이지른 나타내야, 검색한 사용자도 만족하고, 웹사이트 소유자들도 트래픽과 방문을 얻을 수 있다. 

 

매칭에 영향을 주는 주요 요소 : 

- 제목과 콘텐츠 연관성 

- 콘텐츠 형식 (검색자가 이미지 형식에 대한 검색 요청을 했는데 텍스트위주의 페이지라면 매칭이 되지 않을 것이다) 

- 콘텐츠 퀄리티 (정보성 콘텐츠, 충분한 양, 중립적인 내용) 

- 웹사이트 퀄리티 (구글은 최소 기준에 충족되지 않은 웹사이트는 노출시키지 않는다. 최소기준이 뭐지 근데..?) 

- 발행일자 (이슈성 키워드나 최근 뉴스에 관련한 키워드라면 구글은 매칭할 때 발행일자를 우선순위로 볼 수 있다) 

- 웹페이지의 인기 (트래픽과는 별개인데, 이 웹페이지가 다른 사이트에서 인용이되어 백링크가 걸렸다던지 하면 백링크로 걸리지 않은 웹페이지 보다 더 인기가 많고 신뢰도가 있다는 것으로 판단된다) 

  ㄴ다른 사이트에서 내웹페이지가 인용되게끔 하는 것은 OFF-Page SEO라고도 한다(나중에 SEO에 대해 더 자세히 다룰 때 정리해봐야지) 

- 웹페이지의 언어

- 웹페이지 속도

- 디바이스 종류 

- 위치 

 

이외에도 매우 다양한 요소들이 알고리즘에 영향을 미친다고 한다. 

 

검색엔진을 통해 트래픽을 일으키고 싶다면 검색엔진 랭킹이 작용하는 원리를 이해하고 알고리즘 친화적인 SEO작업을 하는 것이 매우 중요하다. 

검색결과 상위 노출이 되기 위한 노력이 없다면 아무리 좋은 내용의 콘텐츠여도 검색엔진 알고리즘이 내 페이지를 쉽게 찾지 못해 매칭을 시켜줄 수 없기 때문이다. 

.

.

 

검색 없이 어떻게 사나 싶을 정도로 일상생활 하는데 꼭 필요한 검색이 이렇게 복잡한 과정을 거쳐 이뤄지는것이었다니.. 

 

새삼 검색의 중요성에 대해 깨닫게 된다. 

 

그리고 콘텐츠를 만들 때는 필히 검색에 대한 이런 세세한 부분까지 염두해서 만들어야겠다는 생각도 든다. 

 

내가 시간과 노력을 들여 만든 콘텐츠가 어쨌든 검색엔진에 의해 발견되지 못하고 검색결과에 매칭되지 않는다면 

소용이 없기 때문이다. (너무 당연한 얘기...) 

 

검색의 기본 원리에 대해 알게됬으니 다음 포스팅으로는 SEO 개념에 대해 다뤄보도록 해야겠다.

 

[이번 포스팅의 자료 레퍼런스: Reliablesoft.net]

728x90
반응형
LIST