Como ser indexado pelo Google em resumo

O processo de indexação do Google é complicado, com muitas fases que se afectam umas às outras.

Para os fazer indexar rapidamente o seu sítio web, é necessário certificar-se de que não existem bloqueios que impeçam o Google de indexar em primeiro lugar.

Segundamente, faça o que puder para notificar o Google de que tem conteúdo fresco e quer que o seu sítio web seja indexado. Tenha em mente que a qualidade do seu conteúdo, e a falta de links internos pode ser um quebra de contrato no processo de indexação.

Finalmente, aumente a popularidade do seu website construindo links externos ao seu website e fazendo com que as pessoas falem do seu conteúdo nas redes sociais.

Se o seu conteúdo não está no Google, será que ele existe mesmo?

Para que o seu website seja visível no motor de pesquisa dominante, ele precisa primeiro de ser indexado. Neste artigo, vamos mostrar-lhe como fazer com que o Google indexe o seu site de forma rápida e eficiente e quais os bloqueios de estrada para evitar que seja atingido.

O processo de indexação do Google em poucas palavras

Antes de mergulhar na forma de indexar o seu site, vamos rever uma explicação simplificada de como funciona o processo de indexação do Google.

O índice do Google pode ser comparado a uma biblioteca massiva – uma que é maior do que todas as bibliotecas do mundo juntas!

O índice contém biliões e biliões de páginas, das quais o Google escolhe as mais relevantes quando os utilizadores fazem consultas de pesquisa.

Com tanto conteúdo que continua a mudar, o Google deve procurar constantemente novos conteúdos, conteúdo que foi removido, e conteúdo que foi actualizado – tudo para manter o seu índice actualizado.

Estados Descobertos, Rastreados e Indexados

Para que o Google classifique o seu site, precisa primeiro de passar por estas três fases:

  1. Discovery: Ao processar os mapas de sítios XML e ao seguir ligações noutras páginas que o Google já conhece, o motor de busca descobre páginas novas e actualizadas e coloca-as em fila para rastejar.

  2. Crawling: O Google passa então a rastrear cada página descoberta e passa toda a informação que encontra para os processos de indexação.

  3. Indexing: Entre outras coisas, os processos de indexação tratam da análise de conteúdo, renderização de páginas e determinam se devem ou não ser indexadas.

A interligação do sistema de indexação do Google

O processo de indexação do Google é altamente complexo, com muitas interdependências entre as etapas incluídas no processo. Se alguma parte do fluxo correr mal, isso afecta também outras fases.

Por exemplo, a 10 de Agosto de 2020, a comunidade SEO notou uma enxurrada de mudanças na classificação dos resultados da pesquisa. Muitos argumentaram que isto significava que o Google estava a fazer uma actualização significativa. Mas no dia seguinte, o Google anunciou que era de facto causado por um bug no seu sistema de indexação que afectava as classificações:

Para lançar alguma luz sobre como o processo de indexação é complicado e entrelaçado, Garry Illyes explicou o fluxo de trabalho da Caffeine num tópico do Twitter:

Este tweet sugere que um bug na fase de indexação pode ter um grande efeito no processo que se lhe segue – neste caso estragando o sistema de classificação.

Paralelamente a este evento, é importante notar que em Maio de 2020, o Google foi submetido a uma ampla actualização do núcleo que teve impacto no processo de indexação. Desde então, o Google tem sido mais lento a indexar novos conteúdos e é mais exigente quanto ao conteúdo que decide indexar. Parece que o seu processo de filtragem de qualidade se tornou muito mais rigoroso do que anteriormente.

Recursos úteis

Como verificar se o Google indexou o seu website?

Existem várias formas rápidas de verificar se o Google indexou o seu website, ou se ainda estão presos nas fases anteriores de descoberta e rastejamento.

Feedback da Consola de Pesquisa do Google

Utilizar o Relatório de Cobertura de Índice da Consola de Pesquisa do Google para obter uma rápida visão geral do estado de indexação do seu website. Este relatório fornece feedback sobre os detalhes mais técnicos do processo de rastreamento e indexação do seu site.

O relatório devolve quatro tipos de status:

  1. Válido: estas páginas foram indexadas com sucesso.
  2. Válido com avisos: estas páginas foram indexadas, mas há alguns problemas que poderá querer verificar.
  3. Excluído: estas páginas não foram indexadas, uma vez que o Google captou sinais claros de que não as deveriam indexar.
  4. Erro: O Google não conseguiu indexar estas páginas por alguma razão.
Verificando o relatório de cobertura do índice do seu website
  1. Log on to Google Search Console.
  2. Escolha uma propriedade.
  3. Click Coverage em Index na navegação da esquerda.

Aqui está um exemplo do aspecto de um relatório de cobertura de índice para um grande sítio web:

Tela do relatório de Cobertura do Índice da Consola de Pesquisa do Google, incluindo detalhes

O relatório de Cobertura do Índice permite-lhe verificar rapidamente o estado geral de indexação do seu site, e entretanto, pode usar a ferramenta de Inspecção URL da Consola de Pesquisa do Google para fazer zoom em páginas individuais.

Verifica o seu URL na Consola de Pesquisa do Google
  1. Log on to Google Search Console.
  2. Selecione uma propriedade.
  3. Submeta um URL do sítio web que deseja verificar.

P>Próximo, verá algo como isto:

Screenshot do relatório da página indexada da Consola de Pesquisa do Google

Se a ferramenta de Inspecção URL lhe mostrar que a URL ainda não está indexada, pode usar a mesma ferramenta para solicitar a indexação.

FAQ

Verifique a cache do URL

Verifica se o seu URL tem uma versão em cache no Google, ou digitando cache:https://example.com no Google ou na barra de endereços, ou clicando na pequena seta apontando para baixo sob o URL num SERP.

Button para o cache do URL na pesquisa do Google

Se vir um resultado, o Google indexou o seu URL. Aqui está um exemplo para um dos nossos artigos:

Detalhes da cacheURL para um dos artigos do ContentKing

A data incluída na captura de ecrã refere-se à última vez que o website foi indexado. Tenha em mente que não diz nada sobre quando foi indexado pela última vez. O website pode ter sido rastreado novamente mais tarde sem que o Google indexasse as suas actualizações, como Garry Illyes assinalou neste tweet.

Ao mesmo tempo, verificar uma cache de URLs também não é infalível – pode ver uma página em cache mesmo que – entretanto – a página tenha sido removida do índice do Google.

Se estiver em cache, é indexada

Outra forma de verificar se as suas páginas foram indexadas é verificar se estão em cache usando um rastreador de rank, ou simplesmente verificando os dados de desempenho da Consola de Pesquisa do Google para ver se está a receber cliques e impressões:

Utilizar dados de desempenho para determinar o estado do índice
  1. Logar na Consola de Pesquisa do Google.
  2. Escolha uma propriedade.
  3. li>Click Search results under Performance no lado esquerdo.li>There, filter on the page you’re looking for by clicking the filter at the top. Por defeito abre-se com a definição URLs containing. Preencha o(s) URL(s) que está à procura.

Next, verá algo como isto:

Procure os resultados de desempenho da Consola de Pesquisa

Procure o título exacto da página ou URL

Alternativamente, para ver se uma página está indexada, pode procurar o título exacto da página colocando entre aspas (”Your page’s title”), use o intitle: operador de pesquisa com o título da sua página (intitle:"Your page's title") ou simplesmente introduza o URL no Google.

Procura de uma página com o título exacto

site: consultas

P>Pode também verificar se a sua página está indexada usando o site: consulta para a página. Eis um exemplo: entrando site:https://www.contentkingapp.com/academy/control-crawl-indexing/ pode mostrar se a página está indexada.

Procura de uma página utilizando uma consulta do sítio

No entanto, esta abordagem nem sempre é fiável!

Já vimos casos em que as páginas estão classificadas, mas não aparecem para site: consultas. Portanto, nunca confie apenas nesta verificação.

Como fazer o Google indexar rapidamente o seu sítio web

Para ter o seu sítio web indexado pelo Google, precisa de se livrar de quaisquer bloqueios que impediriam o Google de o indexar em primeiro lugar.

Segundamente, deve facilitar ao Google a descoberta do seu conteúdo com um empurrão. Lembre-se que o Google tem sempre como objectivo fornecer aos seus utilizadores conteúdos de alta qualidade para responder adequadamente às suas consultas. Certifique-se de que o seu conteúdo se enquadra nesta factura.

Finalmente, aumente a popularidade do seu conteúdo, ganhando backlinks e fazendo as pessoas falarem sobre o seu conteúdo nas redes sociais.

1. Evite que as directivas sobre robôs tenham impacto na indexação

Uma razão comum para o Google não indexar o seu conteúdo é por causa da directiva noindex dos robôs. Embora esta directiva o ajude a evitar problemas de conteúdo duplicado, ela envia ao Google um sinal forte para não indexar certas páginas no seu website. As directivas meta robots podem ser implementadas através da fonte HTML, e do cabeçalho HTTP.

Na sua fonte HTML, a etiqueta meta robots pode parecer algo como isto:

<meta name="robots" content="noindex,follow" />.

Apenas os implemente nas páginas que definitivamente não quer ser indexada, e no caso de uma página que quer ser indexada ter problemas de indexação, verifique duas vezes se a directiva noindex não está implementada.

Descubra o conteúdo noindexed em tempo real

P>Saiba ser alertado instantaneamente sobre qualquer página importante que não esteja indexada. Chega de surpresas SEO!

2. Criar correctamente as etiquetas canónicas

As etiquetas canónicas evitam problemas de conteúdo duplicado

Embora as etiquetas canónicas não sejam um sinal tão forte como a directiva dos meta robôs, o seu uso incorrecto pode levar a problemas de indexação. Certifique-se de que as páginas que pretende obter indexadas não são canonicamente indexadas.

Chloe Smith

Uma coisa que já vi é sites que ficam tão apanhados a garantir a canonicidade das suas páginas, acabam por se canonicizar para páginas que também estão marcadas com noindex.

Google precisa de sinais claros e consistentes, por isso canonicizar o seu conteúdo para uma página marcada com noindex poderia parar o desempenho das páginas afectadas nas suas pistas.

LinkedIn (abre num novo separador)Chloe Smith, SEO Executive, Blue Array (abre num novo separador)

3. Não rejeite o conteúdo que pretende obter indexado

O ficheiro robots.txt é uma ferramenta importante que envia sinais a todos os motores de busca sobre a capacidade de rastreamento dos seus URLs. Pode ser configurado para que o Google saiba que deve ignorar certas partes do seu sítio web.

Certifique-se de que os URLs que quer que sejam indexados não são proibidos em robots.txt. A confusão do seu robots.txt pode levar a que novos conteúdos e actualizações de conteúdos não sejam indexados. Esteja ciente de que qualquer pessoa pode cometer erros no ficheiro robots.txt – mesmo grandes empresas como Ryanair.

Para verificar que páginas estão bloqueadas por robots.txt, verifique o relatório “Indexado, embora bloqueado por robots.txt” no Google Search Console.

Dica de PRO

Disponibilizar um URL em robots.txt não significa necessariamente que o sítio irá desaparecer da Pesquisa do Google. O site pode aparecer em SERPs, mas com um mau snippet.

Gus Pelogia

O ficheiro robots.txt pode ser simples de utilizar, mas é também bastante poderoso em termos de causar uma grande confusão. Já vi muitos casos em que websites estavam “prontos para ir” e foram empurrados ao vivo com um Disallow: /.

Resultando em todas as páginas a serem bloqueadas para motores de busca, e ninguém conseguindo encontrar o website através do Google Search. Entretanto, o cliente começa a perguntar-se porque é que o Google não está a indexar nada. Uma linha de código pode passar despercebida, e bloquear o Google de encontrar todo o conteúdo do seu sítio web!

div>div> LinkedIn (abre numa nova aba)Gus Pelogia, SEO Client Lead, Wolfgang Digital (abre numa nova aba)

4. Prevenir armadilhas de rastreio e optimizar o orçamento de rastreio

Para ter a certeza de tirar o máximo proveito do rastreio do seu website pelo Google, evite criar armadilhas de rastreio. As armadilhas de rastreio são questões estruturais dentro de um website que resultam em que os rastreadores encontram um número praticamente infinito de URLs irrelevantes, nos quais os rastreadores podem perder-se.

Deve certificar-se de que a base técnica do seu website é par, e que está a utilizar ferramentas adequadas que podem detectar rapidamente armadilhas de rastreio em que o Google pode estar a desperdiçar o seu valioso orçamento de rastreio.

Gerry White

A maior causa de armadilhas de rastreio em websites hoje em dia vem da navegação facetada e dos filtros de preço ou tamanho (especialmente se puder seleccionar múltiplos). Se não esconder estes URLs do Google, pode facilmente criar milhões de URLs extra a partir de apenas algumas páginas. Lembre-se que o Google pode seguir tanto as ligações regulares como as ligações JavaScript e que os URLs são sensíveis a maiúsculas/minúsculas.

O meu conselho: certifique-se de que todas as variações de URL que precisam de ser bloqueadas, são realmente bloqueadas!

LinkedIn (abre numa nova aba)Gerry White, Director SEO, Levanta-te às Sete (abre numa nova aba)

5. Alimentar o Google com conteúdo indexável através de um mapa do site XML

Na certeza de que não há nenhum bloqueio do seu lado, deve facilitar ao Google a descoberta dos seus URLs e a compreensão da infra-estrutura do seu site em geral. Os mapas do sítio XML são uma óptima forma de o fazer.

Todos os conteúdos recentemente publicados ou conteúdos actualizados que precisam de ser indexados devem ser adicionados automaticamente ao(s) seu(s) mapa(s) do sítio XML. Para tornar o seu conteúdo fácil de encontrar no Google, submeta o(s) seu(s) mapa(s) do sítio XML ao Google Search Console.

  1. Sign in ao Google Search Console.
  2. Seleccionar a propriedade para a qual deseja submeter um mapa do sítio.
  3. li>Click Sitemaps em Index no lado esquerdo.>Submeter o URL do mapa do sítio XML.

Como submeter um Mapa do Sítio XML à Consola de Pesquisa Google

Google verificará então regularmente o seu Mapa do Sítio XML submetido para descobrir novos conteúdos, rastejar e -hopefully- indexar.

Dica de projecto

Se tiver um site grande, tenha em mente que os mapas de sites XML devem ser limitados a um máximo de 50.000 URLs. É melhor gerar mais mapas de sítios XML com menos URLs cada do que exceder esse limite.

Oliver Mason descreveu uma estratégia de mapa de sítio XML (abre num novo separador) na qual limitou a quantidade de URLs a 10.000 e organizou-as cronologicamente – com sitemap1.xml contendo as páginas mais antigas, e sitemap14.xml contendo as páginas mais recentes.

Isto levou a uma melhor indexação. Parece que compensa alimentar o Google com quantidades menores de URLs e agrupar novos conteúdos.

Jess Joyce

A minha forma de obter rapidamente qualquer coisa indexada é sempre verificar o sítio na Consola de Pesquisa e depois submeter o mapa do sítio XML lá.

Averigúe se o seu mapa do sítio XML tem sempre todas as páginas que deseja ter indexadas, e organizadas para que o Google as possa ler – com índices de mapa do sítio, se necessário.

Para mim esta tem sido a melhor maneira de bater à porta do Google para que saibam que podem percorrer o site o mais depressa possível e rastejar/indexar tudo o que lá se encontra e pode sempre verificar quando foi submetido e lido pela última vez pelo Google.

Jess Joyce, Jess Joyce (abre num novo separador)

6. Submeta manualmente os seus URLs à Consola de Pesquisa do Google

Embora o Google descubra, rasteje, e potencialmente indexe as suas páginas novas ou actualizadas por si próprio, ainda paga para lhe dar um empurrão, submetendo URLs à Consola de Pesquisa do Google. Desta forma, pode também acelerar o processo de classificação.

P>Pode submeter os seus URLs no inspector de URL do GSC:

  1. Inscreva na Consola de Pesquisa do Google
  2. Selecione um website para o qual deseja submeter um URL
  3. Submeta o URL à parte superior da Consola de Pesquisa do Google
  4. li>Cheque se o URL é indexável clicando no botão TEST LIVE URL

    Como submeter um URL à Consola de Pesquisa do Google
  5. Clique no botão REQUEST INDEXING.
  6. Faça o mesmo para páginas que liguem à página que pretende que o Google indexe.
Dica de pesquisa
p>Por favor note que as páginas podem ser indexadas e ainda não classificadas. Por exemplo, se solicitar a indexação no Google Search Console (GSC), as suas páginas serão rapidamente indexadas, mas não serão classificadas de imediato. No entanto, isto irá geralmente acelerar todo o processo.

7. Submeter um post através do Google My Business

Submeter um post através do Google My Business dá ao Google um empurrão extra para rastejar e indexar URLs que lá tenha incluído. Não recomendamos fazer isto apenas para qualquer post, e tenha em mente que este post será mostrado no painel de conhecimentos do Google My Business no lado direito para pesquisas de marca.

  1. Inscrever no Google My Business (abre num novo separador)
  2. Escolha o local para o qual deseja submeter um post.
  3. Click Create post e escolha o tipo What's New.
  4. Adicionar uma fotografia, escrever uma breve mensagem, seleccionar o campo Learn more opção para Add a button (optional), preencher o seu URL no campo Link for your button e premir Publish.
  5. faça o mesmo para páginas que liguem à página que pretende que o Google indexe.

8. Indexação automática através da API de Indexação do Google

Websites com muitas páginas de curta duração, tais como anúncios de trabalhos, anúncios de eventos, ou vídeos de livestream, podem utilizar a API de Indexação do Google (abre-se num novo separador) para os solicitar automaticamente para pesquisar e indexar novos conteúdos e alterações de conteúdos. Uma vez que permite empurrar URLs individuais, é uma forma eficiente para o Google manter o seu índice actualizado.

Com a API de Indexação, pode

  • Atualizar um URL: notificar o Google de um URL novo ou actualizado para rastejar
  • Remover um URL: notificar o Google de que removeu uma página desactualizada do seu website
  • Abter o estado de um pedido: ver quando o Google rastreou o URL da última vez
Suganthan MohanadasanSuganthan Mohanadasan

p>Embora o Google não recomende que lhes forneça outros tipos de conteúdo para além de trabalhos e eventos, consegui indexar páginas regulares utilizando a API. Uma coisa que tenho notado é que a API parece funcionar melhor para novas páginas em vez de ser re-indexada. O Google poderá impor isto em algum momento, mas por agora está a funcionar bem. RankMath tem um plugin (abre num novo separador) que pode tornar o trabalho muito mais fácil, mas requer um pouco de configuração.

Suganthan Mohanadasan, Co-fundador & SEO técnico, Snippet Digital (abre numa nova aba)

9. Fornecer ao Google apenas conteúdo de alta qualidade

O objectivo do Google é devolver conteúdo de alta qualidade aos seus utilizadores, o mais rapidamente possível. Portanto, concentre-se sempre em fornecer ao Google o melhor conteúdo que possa produzir para aumentar as suas hipóteses de ser indexado rapidamente.

Com a avaliação rigorosa do conteúdo do Google e a concorrência sem fim, criar e optimizar grande conteúdo é um processo que nunca cessará.

Parte de gerar novo conteúdo, concentre-se em melhorar o que já está no lugar. Actualizar conteúdos de baixo desempenho de modo a devolver melhores respostas aos potenciais visitantes. Se tiver conteúdo de baixa qualidade ou desactualizado no seu website, considere removê-lo completamente ou desencorajar o Google de gastar o seu precioso orçamento de rastejamento nele.

Ponta de pesquisa
p>O processo de cortar conteúdo desactualizado, irrelevante, ou simplesmente de baixa qualidade é chamado de poda de conteúdo. Ao livrar-se do peso morto, está a criar espaço para outro conteúdo – que tem potencial – florescer, fornecendo ao Google apenas o melhor conteúdo que o seu website tem para oferecer.

10. Prevenir conteúdos duplicados

Outra forma de transformar o orçamento do Google num enorme desperdício é ter conteúdos duplicados. Este termo refere-se a conteúdos muito semelhantes, ou idênticos, que aparecem em múltiplas páginas dentro do seu próprio website, ou noutros websites.

Os robots do motor de pesquisa confundem-se com conteúdos duplicados.

Overtudo, os conteúdos duplicados podem ser verdadeiramente confusos para o Google. Em princípio, o Google indexa apenas um URL para cada conjunto único de conteúdo. Mas é difícil para o motor de pesquisa determinar qual a versão a indexar, e isto reflecte-se subsequentemente nos seus resultados de pesquisa. E como as versões idênticas continuam a competir umas contra as outras, diminui o desempenho para todas elas.

Duplicate content can become into a harsh problem, mainly for eCommerce website owners, who have to find a way to signal to Google which parts of their website to index and which to keep hidden.

To this end, you can use robots.txt disallow for filters and parameters, or you can implement canonicalized URLs. Mas como mencionado na primeira parte deste artigo, tenha muito cuidado com o que está a implementar, pois mesmo uma pequena alteração pode ter um impacto negativo.

11. Aproveite as ligações internas e evite usar nofollow

As ligações internas desempenham um papel enorme em fazer o Google compreender os tópicos do seu website e a sua hierarquia interna. Ao implementar ligações internas estrategicamente colocadas, tornará mais fácil para o Google compreender do que se trata o seu conteúdo e como este ajuda os utilizadores.

Cerve-se de evitar usar o rel=”nofollow” attribute nas suas ligações internas, pois o atributo nofollow indica ao Google que não deve seguir a ligação para o URL alvo. Isto resulta em nenhum valor de link ser passado também.

Sam Underwood

Se precisar de novas páginas indexadas rapidamente, seja estratégico sobre a forma como se liga internamente a elas.

Adicionar ligações internas na sua página inicial e áreas de todo o site como o cabeçalho e rodapé irá acelerar significativamente o processo de rastejamento e indexação.

Considerar criar áreas dinâmicas na sua página inicial que mostrem os seus últimos conteúdos, quer seja um post de blog, um artigo de notícias, ou um produto.

P>Pode também usar ligações dentro de um mega menu que lista os últimos URLs dentro das diferentes taxonomias do seu site.

LinkedIn (abre numa nova aba)Sam Underwood, Ecommerce SEO Consultant, samunderwood.co.uk (abre numa nova aba)

12. Construir ligações relevantes para o seu conteúdo

Não é um exagero dizer que a construção de ligações é uma das disciplinas mais importantes neste campo. O consenso geral é que os links contribuem em mais de 50% para o seu sucesso SEO.

Via inbound links, frequentemente chamados backlinks, o Google pode descobrir o seu website. E como os links também transferem uma parte da sua autoridade, será indexado mais rapidamente se um backlink vier de um website de alta autoridade, e isso afectará significativamente a sua classificação.

Para o ajudar a aumentar as suas opções de indexação e classificação, aqui está uma lista completa de estratégias de construção de links altamente eficazes.

13. Crie buzz em torno do seu conteúdo nas redes sociais

Anteriormente, neste artigo, mencionámos que o Google se tornou muito mais rigoroso no que diz respeito ao conteúdo que indexam. Quando cria buzz em torno do seu conteúdo nas redes sociais, assinala ao Google que o conteúdo é popular, o que acelera o processo de indexação. Por exemplo, a publicação do seu conteúdo no Twitter juntamente com alguns hashtags populares pode realmente ajudar a acelerar o processo de indexação.

Além disso, a criação de buzz em torno do seu conteúdo também conduzirá a inclusões e backlinks de boletins informativos!

Arnout Hellemans

Devido ao acesso do Google ao “firehose data stream” do Twitter (abre-se num novo separador), descobrirá que todos os tipos de conteúdo – mas especialmente o conteúdo de notícias – serão descobertos rapidamente se forem partilhados no Twitter.

Arnout Hellemans, OnlineMarkethink (abre num novo separador)

Conclusão

Garantir que o seu sítio web seja correctamente indexado pelo Google pode revelar-se um trabalho dos diabos. Tem de enfrentar muitos desafios técnicos, bem como de conteúdo e baseados em relações públicas. E com a recente actualização do núcleo do Google em Maio de 2020, a indexação de novas páginas tornou-se ainda mais difícil.

Mas com uma estratégia e lista de verificação adequadas, pode conseguir que o Google indexe as partes mais importantes do seu website e aumente o seu desempenho SEO com classificações elevadas.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *