O processo de indexação do Google é complicado, com muitas fases que se afectam umas às outras.
Para os fazer indexar rapidamente o seu sítio web, é necessário certificar-se de que não existem bloqueios que impeçam o Google de indexar em primeiro lugar.
Segundamente, faça o que puder para notificar o Google de que tem conteúdo fresco e quer que o seu sítio web seja indexado. Tenha em mente que a qualidade do seu conteúdo, e a falta de links internos pode ser um quebra de contrato no processo de indexação.
Finalmente, aumente a popularidade do seu website construindo links externos ao seu website e fazendo com que as pessoas falem do seu conteúdo nas redes sociais.
Se o seu conteúdo não está no Google, será que ele existe mesmo?
Para que o seu website seja visível no motor de pesquisa dominante, ele precisa primeiro de ser indexado. Neste artigo, vamos mostrar-lhe como fazer com que o Google indexe o seu site de forma rápida e eficiente e quais os bloqueios de estrada para evitar que seja atingido.
O processo de indexação do Google em poucas palavras
Antes de mergulhar na forma de indexar o seu site, vamos rever uma explicação simplificada de como funciona o processo de indexação do Google.
O índice do Google pode ser comparado a uma biblioteca massiva – uma que é maior do que todas as bibliotecas do mundo juntas!
O índice contém biliões e biliões de páginas, das quais o Google escolhe as mais relevantes quando os utilizadores fazem consultas de pesquisa.
Com tanto conteúdo que continua a mudar, o Google deve procurar constantemente novos conteúdos, conteúdo que foi removido, e conteúdo que foi actualizado – tudo para manter o seu índice actualizado.
Para que o Google classifique o seu site, precisa primeiro de passar por estas três fases:
-
Discovery: Ao processar os mapas de sítios XML e ao seguir ligações noutras páginas que o Google já conhece, o motor de busca descobre páginas novas e actualizadas e coloca-as em fila para rastejar.
-
Crawling: O Google passa então a rastrear cada página descoberta e passa toda a informação que encontra para os processos de indexação.
-
Indexing: Entre outras coisas, os processos de indexação tratam da análise de conteúdo, renderização de páginas e determinam se devem ou não ser indexadas.
O processo de indexação do Google é altamente complexo, com muitas interdependências entre as etapas incluídas no processo. Se alguma parte do fluxo correr mal, isso afecta também outras fases.
Por exemplo, a 10 de Agosto de 2020, a comunidade SEO notou uma enxurrada de mudanças na classificação dos resultados da pesquisa. Muitos argumentaram que isto significava que o Google estava a fazer uma actualização significativa. Mas no dia seguinte, o Google anunciou que era de facto causado por um bug no seu sistema de indexação que afectava as classificações:
Para lançar alguma luz sobre como o processo de indexação é complicado e entrelaçado, Garry Illyes explicou o fluxo de trabalho da Caffeine num tópico do Twitter:
Este tweet sugere que um bug na fase de indexação pode ter um grande efeito no processo que se lhe segue – neste caso estragando o sistema de classificação.
Paralelamente a este evento, é importante notar que em Maio de 2020, o Google foi submetido a uma ampla actualização do núcleo que teve impacto no processo de indexação. Desde então, o Google tem sido mais lento a indexar novos conteúdos e é mais exigente quanto ao conteúdo que decide indexar. Parece que o seu processo de filtragem de qualidade se tornou muito mais rigoroso do que anteriormente.
Como verificar se o Google indexou o seu website?
Existem várias formas rápidas de verificar se o Google indexou o seu website, ou se ainda estão presos nas fases anteriores de descoberta e rastejamento.
Feedback da Consola de Pesquisa do Google
Utilizar o Relatório de Cobertura de Índice da Consola de Pesquisa do Google para obter uma rápida visão geral do estado de indexação do seu website. Este relatório fornece feedback sobre os detalhes mais técnicos do processo de rastreamento e indexação do seu site.
O relatório devolve quatro tipos de status:
- Válido: estas páginas foram indexadas com sucesso.
- Válido com avisos: estas páginas foram indexadas, mas há alguns problemas que poderá querer verificar.
- Excluído: estas páginas não foram indexadas, uma vez que o Google captou sinais claros de que não as deveriam indexar.
- Erro: O Google não conseguiu indexar estas páginas por alguma razão.
- Log on to Google Search Console.
- Escolha uma propriedade.
- Click
Coverage
emIndex
na navegação da esquerda.
Aqui está um exemplo do aspecto de um relatório de cobertura de índice para um grande sítio web:
O relatório de Cobertura do Índice permite-lhe verificar rapidamente o estado geral de indexação do seu site, e entretanto, pode usar a ferramenta de Inspecção URL da Consola de Pesquisa do Google para fazer zoom em páginas individuais.
- Log on to Google Search Console.
- Selecione uma propriedade.
- Submeta um URL do sítio web que deseja verificar.
P>Próximo, verá algo como isto:
Se a ferramenta de Inspecção URL lhe mostrar que a URL ainda não está indexada, pode usar a mesma ferramenta para solicitar a indexação.
Verifique a cache do URL
Verifica se o seu URL tem uma versão em cache no Google, ou digitando cache:https://example.com
no Google ou na barra de endereços, ou clicando na pequena seta apontando para baixo sob o URL num SERP.
Se vir um resultado, o Google indexou o seu URL. Aqui está um exemplo para um dos nossos artigos:
A data incluída na captura de ecrã refere-se à última vez que o website foi indexado. Tenha em mente que não diz nada sobre quando foi indexado pela última vez. O website pode ter sido rastreado novamente mais tarde sem que o Google indexasse as suas actualizações, como Garry Illyes assinalou neste tweet.
Ao mesmo tempo, verificar uma cache de URLs também não é infalível – pode ver uma página em cache mesmo que – entretanto – a página tenha sido removida do índice do Google.
Se estiver em cache, é indexada
Outra forma de verificar se as suas páginas foram indexadas é verificar se estão em cache usando um rastreador de rank, ou simplesmente verificando os dados de desempenho da Consola de Pesquisa do Google para ver se está a receber cliques e impressões:
- Logar na Consola de Pesquisa do Google.
- Escolha uma propriedade.
li>Click Search results
under Performance
no lado esquerdo.li>There, filter on the page you’re looking for by clicking the filter at the top. Por defeito abre-se com a definição URLs containing
. Preencha o(s) URL(s) que está à procura.
Next, verá algo como isto:
Procure o título exacto da página ou URL
Alternativamente, para ver se uma página está indexada, pode procurar o título exacto da página colocando entre aspas (”Your page’s title”
), use o intitle:
operador de pesquisa com o título da sua página (intitle:"Your page's title"
) ou simplesmente introduza o URL no Google.
site: consultas
P>Pode também verificar se a sua página está indexada usando o site:
consulta para a página. Eis um exemplo: entrando site:https://www.contentkingapp.com/academy/control-crawl-indexing/
pode mostrar se a página está indexada.
No entanto, esta abordagem nem sempre é fiável!
Já vimos casos em que as páginas estão classificadas, mas não aparecem para site:
consultas. Portanto, nunca confie apenas nesta verificação.
Como fazer o Google indexar rapidamente o seu sítio web
Para ter o seu sítio web indexado pelo Google, precisa de se livrar de quaisquer bloqueios que impediriam o Google de o indexar em primeiro lugar.
Segundamente, deve facilitar ao Google a descoberta do seu conteúdo com um empurrão. Lembre-se que o Google tem sempre como objectivo fornecer aos seus utilizadores conteúdos de alta qualidade para responder adequadamente às suas consultas. Certifique-se de que o seu conteúdo se enquadra nesta factura.
Finalmente, aumente a popularidade do seu conteúdo, ganhando backlinks e fazendo as pessoas falarem sobre o seu conteúdo nas redes sociais.
1. Evite que as directivas sobre robôs tenham impacto na indexação
Uma razão comum para o Google não indexar o seu conteúdo é por causa da directiva noindex dos robôs. Embora esta directiva o ajude a evitar problemas de conteúdo duplicado, ela envia ao Google um sinal forte para não indexar certas páginas no seu website. As directivas meta robots podem ser implementadas através da fonte HTML, e do cabeçalho HTTP.
Na sua fonte HTML, a etiqueta meta robots pode parecer algo como isto:
<meta name="robots" content="noindex,follow" />
.
Apenas os implemente nas páginas que definitivamente não quer ser indexada, e no caso de uma página que quer ser indexada ter problemas de indexação, verifique duas vezes se a directiva noindex não está implementada.
P>Saiba ser alertado instantaneamente sobre qualquer página importante que não esteja indexada. Chega de surpresas SEO!
2. Criar correctamente as etiquetas canónicas
Embora as etiquetas canónicas não sejam um sinal tão forte como a directiva dos meta robôs, o seu uso incorrecto pode levar a problemas de indexação. Certifique-se de que as páginas que pretende obter indexadas não são canonicamente indexadas.
Uma coisa que já vi é sites que ficam tão apanhados a garantir a canonicidade das suas páginas, acabam por se canonicizar para páginas que também estão marcadas com
noindex
.Google precisa de sinais claros e consistentes, por isso canonicizar o seu conteúdo para uma página marcada com
noindex
poderia parar o desempenho das páginas afectadas nas suas pistas.
3. Não rejeite o conteúdo que pretende obter indexado
O ficheiro robots.txt é uma ferramenta importante que envia sinais a todos os motores de busca sobre a capacidade de rastreamento dos seus URLs. Pode ser configurado para que o Google saiba que deve ignorar certas partes do seu sítio web.
Certifique-se de que os URLs que quer que sejam indexados não são proibidos em robots.txt. A confusão do seu robots.txt pode levar a que novos conteúdos e actualizações de conteúdos não sejam indexados. Esteja ciente de que qualquer pessoa pode cometer erros no ficheiro robots.txt – mesmo grandes empresas como Ryanair.
Para verificar que páginas estão bloqueadas por robots.txt, verifique o relatório “Indexado, embora bloqueado por robots.txt” no Google Search Console.
Disponibilizar um URL em robots.txt não significa necessariamente que o sítio irá desaparecer da Pesquisa do Google. O site pode aparecer em SERPs, mas com um mau snippet.
O ficheiro robots.txt pode ser simples de utilizar, mas é também bastante poderoso em termos de causar uma grande confusão. Já vi muitos casos em que websites estavam “prontos para ir” e foram empurrados ao vivo com um
Disallow: /
.Resultando em todas as páginas a serem bloqueadas para motores de busca, e ninguém conseguindo encontrar o website através do Google Search. Entretanto, o cliente começa a perguntar-se porque é que o Google não está a indexar nada. Uma linha de código pode passar despercebida, e bloquear o Google de encontrar todo o conteúdo do seu sítio web!
4. Prevenir armadilhas de rastreio e optimizar o orçamento de rastreio
Para ter a certeza de tirar o máximo proveito do rastreio do seu website pelo Google, evite criar armadilhas de rastreio. As armadilhas de rastreio são questões estruturais dentro de um website que resultam em que os rastreadores encontram um número praticamente infinito de URLs irrelevantes, nos quais os rastreadores podem perder-se.
Deve certificar-se de que a base técnica do seu website é par, e que está a utilizar ferramentas adequadas que podem detectar rapidamente armadilhas de rastreio em que o Google pode estar a desperdiçar o seu valioso orçamento de rastreio.
A maior causa de armadilhas de rastreio em websites hoje em dia vem da navegação facetada e dos filtros de preço ou tamanho (especialmente se puder seleccionar múltiplos). Se não esconder estes URLs do Google, pode facilmente criar milhões de URLs extra a partir de apenas algumas páginas. Lembre-se que o Google pode seguir tanto as ligações regulares como as ligações JavaScript e que os URLs são sensíveis a maiúsculas/minúsculas.
O meu conselho: certifique-se de que todas as variações de URL que precisam de ser bloqueadas, são realmente bloqueadas!
5. Alimentar o Google com conteúdo indexável através de um mapa do site XML
Na certeza de que não há nenhum bloqueio do seu lado, deve facilitar ao Google a descoberta dos seus URLs e a compreensão da infra-estrutura do seu site em geral. Os mapas do sítio XML são uma óptima forma de o fazer.
Todos os conteúdos recentemente publicados ou conteúdos actualizados que precisam de ser indexados devem ser adicionados automaticamente ao(s) seu(s) mapa(s) do sítio XML. Para tornar o seu conteúdo fácil de encontrar no Google, submeta o(s) seu(s) mapa(s) do sítio XML ao Google Search Console.
- Sign in ao Google Search Console.
- Seleccionar a propriedade para a qual deseja submeter um mapa do sítio.
li>Click Sitemaps
em Index
no lado esquerdo.>Submeter o URL do mapa do sítio XML.
Google verificará então regularmente o seu Mapa do Sítio XML submetido para descobrir novos conteúdos, rastejar e -hopefully- indexar.
Se tiver um site grande, tenha em mente que os mapas de sites XML devem ser limitados a um máximo de 50.000 URLs. É melhor gerar mais mapas de sítios XML com menos URLs cada do que exceder esse limite.
Oliver Mason descreveu uma estratégia de mapa de sítio XML (abre num novo separador) na qual limitou a quantidade de URLs a 10.000 e organizou-as cronologicamente – com sitemap1.xml
contendo as páginas mais antigas, e sitemap14.xml
contendo as páginas mais recentes.
Isto levou a uma melhor indexação. Parece que compensa alimentar o Google com quantidades menores de URLs e agrupar novos conteúdos.
A minha forma de obter rapidamente qualquer coisa indexada é sempre verificar o sítio na Consola de Pesquisa e depois submeter o mapa do sítio XML lá.
Averigúe se o seu mapa do sítio XML tem sempre todas as páginas que deseja ter indexadas, e organizadas para que o Google as possa ler – com índices de mapa do sítio, se necessário.
Para mim esta tem sido a melhor maneira de bater à porta do Google para que saibam que podem percorrer o site o mais depressa possível e rastejar/indexar tudo o que lá se encontra e pode sempre verificar quando foi submetido e lido pela última vez pelo Google.
6. Submeta manualmente os seus URLs à Consola de Pesquisa do Google
Embora o Google descubra, rasteje, e potencialmente indexe as suas páginas novas ou actualizadas por si próprio, ainda paga para lhe dar um empurrão, submetendo URLs à Consola de Pesquisa do Google. Desta forma, pode também acelerar o processo de classificação.
P>Pode submeter os seus URLs no inspector de URL do GSC:
- Inscreva na Consola de Pesquisa do Google
- Selecione um website para o qual deseja submeter um URL
- Submeta o URL à parte superior da Consola de Pesquisa do Google
- Clique no botão
REQUEST INDEXING
. - Faça o mesmo para páginas que liguem à página que pretende que o Google indexe.
li>Cheque se o URL é indexável clicando no botão TEST LIVE URL
7. Submeter um post através do Google My Business
Submeter um post através do Google My Business dá ao Google um empurrão extra para rastejar e indexar URLs que lá tenha incluído. Não recomendamos fazer isto apenas para qualquer post, e tenha em mente que este post será mostrado no painel de conhecimentos do Google My Business no lado direito para pesquisas de marca.
- Inscrever no Google My Business (abre num novo separador)
- Escolha o local para o qual deseja submeter um post.
- Click
Create post
e escolha o tipoWhat's New
. - Adicionar uma fotografia, escrever uma breve mensagem, seleccionar o campo
Learn more
opção paraAdd a button (optional)
, preencher o seu URL no campoLink for your button
e premirPublish
. - faça o mesmo para páginas que liguem à página que pretende que o Google indexe.
8. Indexação automática através da API de Indexação do Google
Websites com muitas páginas de curta duração, tais como anúncios de trabalhos, anúncios de eventos, ou vídeos de livestream, podem utilizar a API de Indexação do Google (abre-se num novo separador) para os solicitar automaticamente para pesquisar e indexar novos conteúdos e alterações de conteúdos. Uma vez que permite empurrar URLs individuais, é uma forma eficiente para o Google manter o seu índice actualizado.
Com a API de Indexação, pode
- Atualizar um URL: notificar o Google de um URL novo ou actualizado para rastejar
- Remover um URL: notificar o Google de que removeu uma página desactualizada do seu website
- Abter o estado de um pedido: ver quando o Google rastreou o URL da última vez
p>Embora o Google não recomende que lhes forneça outros tipos de conteúdo para além de trabalhos e eventos, consegui indexar páginas regulares utilizando a API. Uma coisa que tenho notado é que a API parece funcionar melhor para novas páginas em vez de ser re-indexada. O Google poderá impor isto em algum momento, mas por agora está a funcionar bem. RankMath tem um plugin (abre num novo separador) que pode tornar o trabalho muito mais fácil, mas requer um pouco de configuração.
9. Fornecer ao Google apenas conteúdo de alta qualidade
O objectivo do Google é devolver conteúdo de alta qualidade aos seus utilizadores, o mais rapidamente possível. Portanto, concentre-se sempre em fornecer ao Google o melhor conteúdo que possa produzir para aumentar as suas hipóteses de ser indexado rapidamente.
Com a avaliação rigorosa do conteúdo do Google e a concorrência sem fim, criar e optimizar grande conteúdo é um processo que nunca cessará.
Parte de gerar novo conteúdo, concentre-se em melhorar o que já está no lugar. Actualizar conteúdos de baixo desempenho de modo a devolver melhores respostas aos potenciais visitantes. Se tiver conteúdo de baixa qualidade ou desactualizado no seu website, considere removê-lo completamente ou desencorajar o Google de gastar o seu precioso orçamento de rastejamento nele.
10. Prevenir conteúdos duplicados
Outra forma de transformar o orçamento do Google num enorme desperdício é ter conteúdos duplicados. Este termo refere-se a conteúdos muito semelhantes, ou idênticos, que aparecem em múltiplas páginas dentro do seu próprio website, ou noutros websites.
Overtudo, os conteúdos duplicados podem ser verdadeiramente confusos para o Google. Em princípio, o Google indexa apenas um URL para cada conjunto único de conteúdo. Mas é difícil para o motor de pesquisa determinar qual a versão a indexar, e isto reflecte-se subsequentemente nos seus resultados de pesquisa. E como as versões idênticas continuam a competir umas contra as outras, diminui o desempenho para todas elas.
Duplicate content can become into a harsh problem, mainly for eCommerce website owners, who have to find a way to signal to Google which parts of their website to index and which to keep hidden.
To this end, you can use robots.txt disallow for filters and parameters, or you can implement canonicalized URLs. Mas como mencionado na primeira parte deste artigo, tenha muito cuidado com o que está a implementar, pois mesmo uma pequena alteração pode ter um impacto negativo.
11. Aproveite as ligações internas e evite usar nofollow
As ligações internas desempenham um papel enorme em fazer o Google compreender os tópicos do seu website e a sua hierarquia interna. Ao implementar ligações internas estrategicamente colocadas, tornará mais fácil para o Google compreender do que se trata o seu conteúdo e como este ajuda os utilizadores.
Cerve-se de evitar usar o rel=”nofollow” attribute
nas suas ligações internas, pois o atributo nofollow indica ao Google que não deve seguir a ligação para o URL alvo. Isto resulta em nenhum valor de link ser passado também.
Se precisar de novas páginas indexadas rapidamente, seja estratégico sobre a forma como se liga internamente a elas.
Adicionar ligações internas na sua página inicial e áreas de todo o site como o cabeçalho e rodapé irá acelerar significativamente o processo de rastejamento e indexação.
Considerar criar áreas dinâmicas na sua página inicial que mostrem os seus últimos conteúdos, quer seja um post de blog, um artigo de notícias, ou um produto.
P>Pode também usar ligações dentro de um mega menu que lista os últimos URLs dentro das diferentes taxonomias do seu site.
12. Construir ligações relevantes para o seu conteúdo
Não é um exagero dizer que a construção de ligações é uma das disciplinas mais importantes neste campo. O consenso geral é que os links contribuem em mais de 50% para o seu sucesso SEO.
Via inbound links, frequentemente chamados backlinks, o Google pode descobrir o seu website. E como os links também transferem uma parte da sua autoridade, será indexado mais rapidamente se um backlink vier de um website de alta autoridade, e isso afectará significativamente a sua classificação.
Para o ajudar a aumentar as suas opções de indexação e classificação, aqui está uma lista completa de estratégias de construção de links altamente eficazes.
13. Crie buzz em torno do seu conteúdo nas redes sociais
Anteriormente, neste artigo, mencionámos que o Google se tornou muito mais rigoroso no que diz respeito ao conteúdo que indexam. Quando cria buzz em torno do seu conteúdo nas redes sociais, assinala ao Google que o conteúdo é popular, o que acelera o processo de indexação. Por exemplo, a publicação do seu conteúdo no Twitter juntamente com alguns hashtags populares pode realmente ajudar a acelerar o processo de indexação.
Além disso, a criação de buzz em torno do seu conteúdo também conduzirá a inclusões e backlinks de boletins informativos!
Devido ao acesso do Google ao “firehose data stream” do Twitter (abre-se num novo separador), descobrirá que todos os tipos de conteúdo – mas especialmente o conteúdo de notícias – serão descobertos rapidamente se forem partilhados no Twitter.
Conclusão
Garantir que o seu sítio web seja correctamente indexado pelo Google pode revelar-se um trabalho dos diabos. Tem de enfrentar muitos desafios técnicos, bem como de conteúdo e baseados em relações públicas. E com a recente actualização do núcleo do Google em Maio de 2020, a indexação de novas páginas tornou-se ainda mais difícil.
Mas com uma estratégia e lista de verificação adequadas, pode conseguir que o Google indexe as partes mais importantes do seu website e aumente o seu desempenho SEO com classificações elevadas.