Google의 BERT 알고리즘 업데이트에 대해

자연어 처리를 위한 알고리즘의 하나였던 BERT가 지난 10월 25일 주간에 구글 알고리즘에 장착되었다는 발표가 있었다.

BERT란

구글이 작년 이맘 즈음에 발표했던 Bert는 긴 본문을 가진 텍스트에서 사용될 수 있는 사전 트레이닝 방법으로 자연어 처리의 일종으로 개체 인지(Entity recognition), 스피치 태깅, 질문에 대답하기 등의 테스크에 활용된다.

구글 BERT 알고리즘이란

이런 BERT가 구글 검색의 알고리즘에 적용되면서 구글의 검색 결과에는 어떤 변화가 일어난 것일까? 한마디로 말하면 구글이 우리가 던지는 검색 질의를 놀라운 수준으로 이해하게 된 것이라고 말할 수 있다. 정확하게 말하면 우리가 일반적으로 입력하는 한두단어로 구성된 질의어까지 완벽하게 이해하게 된 것은 아니고, 알고 싶은 것을 문장으로 명확하게 질문하면 구글이 이를 알아듣고 답을 핀포인트로 찾아서 답을 해준다는 것이다.

BERT 알고리즘의 실제 예시들

실제로 구글이 어떤 질문에 어떻게 답하는지를 직접 보는 것이 어떤 변화가 있었던 것이지 알기 쉬울 것 같다. 아래의 예에서 보는 것 같이 긴질문에 대해서 구글은 검색 결과 페이지 최상단(제로 포지션)에 다이렉트 앤서박스 스니펫을 통해서 질문에 바로 답을 해버린다. 현재도 약 40% 가깝게가 무클릭 검색이라고하는데 이번 업데이트는 이런 경향을 더 강화할 것 같다. 여기에 예시로 든 1번, 2번, 3번의 3가지의 질문은 그 의도가 아주 명확하고 그 답도 사실은 명확한 편에 들어간다.

즉 답이 있는 What으로 시작하는 질문에는 거의 100점의 답을 주고 있다. 그래서 4번째 질문에서는 밴쿠버에서 커플들의 데이트 장소로 좋은 곳이 어디냐라는 추천형 질문을 해봤다. 결과는 내 의도에 부합하는 답을 해줬다. 물론 실제로 최고로 좋은 곳인지는 나도 판단할 수없지만 적어도 형식적으로는 정확히 내 의도대로 답을 핀포인트로 해주고 있었다.

그래서 한발 더 나아가 사람들은 왜 같이 있으면서도 외로움을 느끼는가?라는 Why형 질문을 던져보았다. 역시나 구글은 이런 질문에는 답을 주지 못했다.

Google BERT 샘플 1:

Q: What is the size of galaxy note 10 plus display?

Google BERT 샘플 2:

Q: What color options does galaxy note 10 plus have?

Google BERT 샘플 3:

Q: What was the reason for 2008 recession?

Google BERT 샘플 4:

Q: Where would be the best place for dating in Vancouver?

Google BERT 샘플 5:

Q: Why people feel loneliness even when they are together?

BERT 알고리즘 업데이트가 마케터들에게 시사하는 바는?

많은 글로벌 SEO 전문가들의 이야기에 따르면 이번 구글의 업데이트는 우리 마케터들이 주로 관심을 가져왔던 Bighead 키워드(검색볼륨이 큰 1~2 워드의 키워드)나 Chunky middle(3~5 워드의 키워드)의 검색 결과에는 영향이 거의 없었고 Longtail 중에서도 질의형 쿼리 결과에 영향을 준것으로 알려졌다.

그럼에도 불구하고 구글은 지난 5년간 가장 큰 영향을 준 업데이트라고 밝히고 있다. 이것은 구글이 지향하는 바가 바로 사람처럼 검색자의 의도(Intent)를 이해하고 웹페이지의 콘텐츠도 원래 작성자의 의도대로 이해해서 최적으로 매칭을 찾아내서 검색결과로 제공하는 것이라는 것을 방증하는 것이라고 생각한다.

간단히 말하자면 구글은 이번 업데이트를 통해 “당신의 소비자들이 물어보고 있는 것에 충실하게 답을 하라 “라고 말하고 있는 것이다. 적어도 구글이 지배하는 디지털 마케팅 영역에서는 “소비자 의도기반 콘텐츠 전략”이 그 어느 때 보다 중요한 시대가 온 것이라고 할 수 있겠다.