
Os documentos revelam como a Pesquisa Google está usando, ou usou, cliques, links, conteúdo, entidades, dados do Chrome e muito mais para a classificação.
Uma série de documentos vazados do Google nos deu uma visão sem precedentes da Pesquisa Google e revelou alguns dos elementos mais importantes que o Google usa para classificar conteúdo.
O que aconteceu. Milhares de documentos, que parecem vir do Content API Warehouse interno do Google, foram lançados em 13 de março no Github por um bot automatizado chamado yoshi-code-bot. Esses documentos foram compartilhados com Rand Fishkin, cofundador da SparkToro, no início deste mês.
- Continue lendo para descobrir o que aprendemos com Fishkin, bem como com Michael King, CEO da iPullRank, que também revisou e analisou os documentos (e planeja fornecer mais análises para o Search Engine Land em breve).
Por que nos importamos. Tivemos um vislumbre de como o algoritmo de classificação do Google pode funcionar, o que é inestimável para os SEOs que podem entender o que tudo isso significa.
Esse documento do Google vaza? Provavelmente será uma das maiores histórias da história do SEO e da Pesquisa Google.
O que está dentro. Aqui está o que sabemos sobre os documentos internos, graças a Fishkin e King:
- Atual: A documentação indica que essas informações são precisas a partir de março.
- Recursos de classificação: 2.596 módulos estão representados na documentação da API com 14.014 atributos.
- Ponderação: Os documentos não especificaram como qualquer um dos recursos do ranking é ponderado – apenas que eles existem.
- Twiddlers: Essas são funções de reclassificação que “podem ajustar a pontuação de recuperação de informações de um documento ou alterar a classificação de um documento”, de acordo com King.
- Demoções: O conteúdo pode ser rebaixado por vários motivos, como:
- Um link não corresponde ao site de destino.
- Sinais de SERP indicam insatisfação do usuário.
- Revisões de produtos.
- Localização.
- Domínios de correspondência exata.
- Pornografia
- Histórico de alterações: O Google aparentemente mantém uma cópia de todas as versões de todas as páginas que já indexou. Ou seja, o Google pode “lembrar” de todas as alterações já feitas em uma página. No entanto, o Google usa apenas as últimas 20 alterações de um URL ao analisar links.
Os links importam. Chocante, eu sei. A diversidade e a relevância dos links continuam sendo fundamentais, mostram os documentos. E o PageRank ainda está muito vivo dentro dos recursos de ranqueamento do Google. PageRank para a página inicial de um site é considerado para cada documento.
- Isso não prova que os porta-vozes do Google mentiram sobre os links não serem um “fator de classificação top 3” ou links que importam menos para o ranking. Duas coisas podem ser verdadeiras ao mesmo tempo. Novamente, não sabemos como qualquer um desses recursos é ponderado.
Cliques bem-sucedidos são importantes. Isso não deve ser um choque, mas se você quiser classificar bem, você precisa continuar criando ótimos conteúdos e experiências do usuário, com base nos documentos. O Google usa uma variedade de medições, incluindo badClicks, goodClicks, lastLongestClicks e unsquashedClicks.
Além disso, documentos mais longos podem ficar truncados, enquanto o conteúdo mais curto recebe uma pontuação (de 0 a 512) com base na originalidade. Também são dadas pontuações para o conteúdo Your Money Your Life, como saúde e notícias.
O que tudo isso significa? Segundo King:
- “Você precisa gerar cliques mais bem-sucedidos usando um conjunto mais amplo de consultas e ganhar mais diversidade de links se quiser continuar a classificar. Conceitualmente, faz sentido porque um conteúdo muito forte vai fazer isso. Um foco em direcionar tráfego mais qualificado para uma melhor experiência do usuário enviará sinais ao Google de que sua página merece ser classificada.”
Documentos e depoimentos do julgamento antitruste EUA x Google confirmaram que o Google usa cliques no ranking – especialmente com seu sistema Navboost, “um dos sinais importantes” que o Google usa para o ranking. Veja mais da nossa cobertura:
A marca importa. A grande lição de Fishkin? A marca é mais importante do que qualquer outra coisa:
- “Se houvesse um conselho universal que eu tivesse para os profissionais de marketing que buscam melhorar amplamente seus rankings de pesquisa orgânica e tráfego, seria: ‘Construa uma marca notável, popular e reconhecida em seu espaço, fora da pesquisa do Google’.”
As entidades importam. A autoria vive. O Google armazena informações de autor associadas ao conteúdo e tenta determinar se uma entidade é a autora do documento.
SiteAuthority: O Google usa algo chamado “siteAuthority”.
- O Google nos disse que algo assim existia em 2011, após o lançamento da atualização do Panda, afirmando publicamente que “conteúdo de baixa qualidade em parte de um site pode afetar o ranking de um site como um todo”.
- No entanto, o Google negou ter uma pontuação de autoridade do site nos anos desde então.
Dados do Chrome. Um módulo chamado ChromeInTotal indica que o Google usa dados de seu navegador Chrome para classificação.
Listas brancas. Alguns módulos indicam que o Google coloca na lista de permissões certos domínios relacionados a eleições e COVID – isElectionAuthority e isCovidLocalAuthority. Embora saibamos há muito tempo, o Google (e o Bing) têm “listas de exceções” quando “algoritmos específicos inadvertidamente afetam sites”.
Pequenos sites. Outro recurso é smallPersonalSite – para um pequeno site pessoal ou blog. King especulou que o Google poderia impulsionar ou rebaixar esses sites por meio de um Twiddler. No entanto, essa continua a ser uma questão em aberto. Novamente, não sabemos ao certo quanto esses recursos são ponderados.
Outros achados interessantes. De acordo com documentos internos do Google:
- O frescor é importante – o Google analisa as datas no byline (bylineDate), no URL (syntacticDate) e no conteúdo da página (semanticDate).
- Para determinar se um documento é ou não um tópico principal do site, o Google vetoriza páginas e sites e, em seguida, compara as incorporações de página (siteRadius) com as incorporações de site (siteFocusScore).
- O Google armazena informações de registro de domínio (RegistrationInfo).
- Os títulos das páginas ainda são importantes. O Google tem um recurso chamado titlematchScore que se acredita medir o quão bem um título de página corresponde a uma consulta.
- O Google mede o tamanho médio ponderado da fonte dos termos em documentos (avgTermWeight) e no texto âncora.
Os artigos.
- Segredos do algoritmo: documentação interna de engenharia do Google Search vazou por King no iPullRank
- Uma fonte anônima compartilhou milhares de documentos vazados da API de pesquisa do Google comigo; Todos em SEO devem vê-los por Fishkin no SparkToro
Esclarecimento rápido. Há alguma controvérsia sobre se esses documentos foram “vazados” ou “descobertos”. Foi-me dito que é provável que os documentos internos tenham sido acidentalmente incluídos em uma revisão de código e enviados ao vivo da base de código interna do Google, onde foram descobertos.
A fonte. Erfan Azimi, CEO e diretor de SEO da agência de marketing digital EA Eagle Digital, postou um vídeo, reivindicando a responsabilidade pelo compartilhamento dos documentos com Fishkin. Azimi não é empregado do Google.

Dixon Jones, CEO da Inlinks, tornou as 14.000 variáveis da Pesquisa Google pesquisáveis. Jones disse que essa ferramenta informará quais coisas o Google armazena e para que elas são usadas. Aguardemos…
Anuncie com confiança e alcance o sucesso que você merece!✓MultiClassificados.com.br A sua escolha inteligente para anúncios classificados online!