
Imagens Getty |
O Google parece ter postado acidentalmente um grande documento técnico interno no GitHub detalhando algumas das maneiras como o mecanismo de busca classifica as páginas da web. Para a maioria de nós, a questão das classificações de pesquisa é apenas “resultados bons ou ruins da web”, mas a comunidade SEO está olhando por trás da cortina porque a documentação contradiz claramente parte do conteúdo do Google. ao mesmo tempo que estou armado. Eu disse a eles no passado. A maioria dos comentários sobre o vazamento vem dos especialistas em SEO Rand Fishkin e Mike King.
O Google confirmou a autenticidade do documento ao The Verge, dizendo que “adverte contra suposições imprecisas sobre pesquisas baseadas em informações fora de contexto, desatualizadas ou incompletas”. Trabalhamos para compartilhar informações abrangentes sobre como nossas pesquisas funcionam e os tipos de fatores que nossos sistemas consideram, ao mesmo tempo que protegemos a integridade de nossos resultados contra adulterações. ”
O interessante sobre a publicação acidental do GoogleAPI no GitHub é que, embora sejam documentos internos confidenciais, o Google os publicou tecnicamente sob a licença Apache 2.0. Isso significa que qualquer pessoa que encontrar este documento receberá uma “licença de direitos autorais perpétua, mundial, não exclusiva, gratuita, isenta de royalties e irrevogável” e agora está livre para usá-lo online, como aqui.

O vazamento inclui uma grande quantidade de documentação da API do “ContentWarehouse” do Google, que é muito parecido com um índice de pesquisa. Como você pode imaginar, mesmo este estudo incompleto de como o Google classifica as páginas da web é incrivelmente complexo. King escreve: “A documentação da API possui 2.596 módulos e contém 14.014 atributos (recursos).” Todos esses são documentos escritos por programadores para programadores e contam com muitas informações básicas que você provavelmente não conheceria, a menos que trabalhasse em uma equipe de pesquisa. A comunidade SEO ainda examina documentos e os utiliza para formular hipóteses sobre como funciona a pesquisa do Google.
Fishkin e King acusaram o Google de “mentir” para especialistas em SEO no passado. Uma coisa que o documento revela é que as taxas de cliques nas listagens de resultados de pesquisa afetam as classificações, e o Google negou em diversas ocasiões que isso “se misture” nos resultados de pesquisa. O sistema de rastreamento de cliques é denominado “Navboost” e aprimora os sites pelos quais os usuários navegam. Naturalmente, muitos desses dados de cliques vêm do Chrome, mesmo quando você termina a pesquisa. Por exemplo, em alguns resultados, você verá um pequeno resultado de “mapa do site” abaixo da lista principal, mas aparentemente parte do que impulsiona esse mapa é o mapa do site mais popular, conforme determinado pelo rastreamento de cliques do Chrome. Esta é uma subpágina.
O documento também sugere que o Google tenha uma lista de permissões que aumenta artificialmente determinados sites sobre determinados tópicos. Os dois mencionados foram ‘isElectionAuthority’ e ‘isCovidLocalAuthority’.
Grande parte da documentação se comporta exatamente como os motores de busca esperam. Os sites têm um valor “SiteAuthority” que classifica os sites mais conhecidos em uma posição superior aos menos conhecidos. Os autores também têm seus próprios rankings, mas como tudo aqui, é impossível saber como tudo irá interagir com todo o resto.
Todos os comentários dos especialistas em SEO fazem parecer que o Google está zangado por enganar as pessoas, mas a empresa não precisa manter pelo menos um relacionamento levemente adversário com pessoas que tentam manipular seus resultados de pesquisa, não é? Um estudo recente descobriu que “os mecanismos de pesquisa parecem estar perdendo o jogo de gato e rato do spam de SEO” e descobriu que “há uma relação inversa entre o nível de otimização de uma página e sua experiência percebida, e descobrimos que isso indica que isso pode comprometer a qualidade subjetiva da página. ” Toda essa documentação adicional pode não ser boa para você ou para a qualidade dos resultados do Google. Por exemplo, agora que as pessoas sabem que as taxas de cliques afetam as classificações de pesquisa, você poderia usar click farms para melhorar a classificação do seu site?

