Para conseguir que indexen tu sitio web rápidamente, debes asegurarte de que no hay obstáculos que impidan a Google indexar en primer lugar.
En segundo lugar, haz todo lo posible para notificar a Google que tienes contenido fresco y que quieres que tu sitio web sea indexado. Ten en cuenta que la calidad de tu contenido, y la falta de enlaces internos puede ser un punto de inflexión en el proceso de indexación.
Por último, impulsa la popularidad de tu sitio web mediante la construcción de enlaces externos a tu sitio web y haz que la gente hable de tu contenido en las redes sociales.
Para que tu sitio web sea visible en el motor de búsqueda dominante, primero tiene que estar indexado. En este artículo, le mostraremos cómo conseguir que Google indexe su sitio de forma rápida y eficiente y qué obstáculos debe evitar encontrar.
El proceso de indexación de Google en pocas palabras
Antes de entrar en cómo conseguir que su sitio web sea indexado, vamos a repasar una explicación simplificada de cómo funciona el proceso de indexación de Google.
El índice de Google se puede comparar con una enorme biblioteca – ¡más grande que todas las bibliotecas del mundo juntas!
El índice contiene miles de millones y miles de millones de páginas, de las que Google selecciona las más relevantes cuando los usuarios realizan consultas de búsqueda.
Con todo este contenido que no deja de cambiar, Google debe buscar constantemente contenido nuevo, contenido que se ha eliminado y contenido que se ha actualizado, todo ello para mantener su índice actualizado.
Para que Google clasifique su sitio, primero debe pasar por estas tres fases:
- Descubrimiento: Al procesar los mapas de sitio XML y seguir los enlaces de otras páginas que Google ya conoce, el motor de búsqueda descubre páginas nuevas y actualizadas y las pone en cola para su rastreo.
-
Rastreo: Google pasa a rastrear cada página descubierta y transmite toda la información que encuentra a los procesos de indexación.
-
Indización: Entre otras cosas, los procesos de indexación se encargan de analizar el contenido, renderizar las páginas y determinar si se indexan o no.
El proceso de indexación de Google es muy complejo, con muchas interdependencias entre los pasos incluidos en el proceso. Si alguna parte del flujo va mal, eso afecta a otras fases también.
Por ejemplo, el 10 de agosto de 2020, la comunidad SEO notó una ráfaga de cambios en el ranking de resultados de búsqueda. Muchos argumentaron que esto significaba que Google estaba desplegando una actualización importante. Pero al día siguiente, Google anunció que en realidad se debía a un error en su sistema de indexación que afectaba a los rankings:
Para arrojar algo de luz sobre cómo el proceso de indexación es complicado y está entrelazado, Garry Illyes explicó el flujo de trabajo de Caffeine en un hilo de Twitter:
Este tuit sugiere que un error en la fase de indexación puede tener un gran efecto en el proceso que le sigue, en este caso desordenando el sistema de ranking.
Paralelamente a este evento, es importante tener en cuenta que en mayo de 2020, Google sufrió una amplia actualización del núcleo que impactó en el proceso de indexación. Desde entonces, Google es más lento a la hora de indexar nuevos contenidos y es más exigente con el contenido que decide indexar. Parece que su proceso de filtrado de calidad se ha vuelto mucho más estricto que antes.
¿Cómo comprobar si Google ha indexado tu sitio web?
Hay varias formas rápidas de comprobar si Google ha indexado su sitio web, o si todavía está atascado en las fases anteriores de descubrimiento y rastreo.
Comentarios de Google Search Console
Utilice el informe de cobertura del índice de Google Search Console para obtener una visión general rápida del estado de indexación de su sitio web. Este informe proporciona información sobre los detalles más técnicos del proceso de rastreo e indexación de su sitio.
El informe devuelve cuatro tipos de estados:
- Válido: estas páginas se han indexado correctamente.
- Válido con advertencias: estas páginas se indexaron, pero hay algunos problemas que tal vez quieras revisar.
- Excluido: estas páginas no se indexaron, ya que Google captó señales claras de que no debía indexarlas.
- Error: Google no ha podido indexar estas páginas por algún motivo.
- Accede a Google Search Console.
- Elige una propiedad.
- Haz clic en
Coverage
bajoIndex
en la navegación izquierda.
Aquí tienes un ejemplo de cómo es un informe de cobertura de índices para un sitio web grande:
El informe de cobertura del índice te permite comprobar rápidamente el estado de indexación general de tu sitio y, mientras tanto, puedes utilizar la herramienta de inspección de URL de Google Search Console para ampliar las páginas individuales.
- Accede a Google Search Console.
- Elige una propiedad.
- Envía una URL del sitio web que quieres comprobar.
A continuación, verás algo así:
Si la herramienta de inspección de URLs te muestra que la URL aún no está indexada, puedes utilizar la misma herramienta para solicitar la indexación.
Comprueba la caché de la URL
Comprueba si tu URL tiene una versión en caché en Google, ya sea escribiendo cache:https://example.com
en Google o en la barra de direcciones, o haciendo clic en la flechita que apunta hacia abajo bajo la URL en una SERP.
Si ves un resultado, Google ha indexado tu URL. Aquí tienes un ejemplo para uno de nuestros artículos:
La fecha incluida en la captura de pantalla se refiere a la última vez que se indexó el sitio web. Hay que tener en cuenta que no dice nada sobre cuándo fue rastreado por última vez. El sitio web puede haber sido rastreado de nuevo más tarde sin que Google indexe sus actualizaciones, como señaló Garry Illyes en este tweet.
Al mismo tiempo, la comprobación de la caché de una URL tampoco es infalible – puede ver una página en caché aunque – mientras tanto – la página haya sido eliminada del índice de Google.
Si se clasifica, está indexada
Otra forma de verificar si sus páginas han sido indexadas es comprobar si se están clasificando utilizando un rastreador de clasificaciones, o simplemente comprobando los datos de Rendimiento de Google Search Console para ver si está recibiendo clics e impresiones:
- Ingrese a Google Search Console.
- Elige una propiedad.
- Haz clic en
Search results
bajoPerformance
en la parte izquierda. - Allí, filtra en la página que buscas haciendo clic en el filtro de la parte superior. Por defecto se abre con la configuración
URLs containing
. Rellena la(s) URL(s) que buscas.
A continuación, verás algo así:
Buscar el título o la URL exacta de la página
Alternativamente, para ver si una página está indexada, puedes buscar el título exacto de la página poniéndolo entre comillas (”Your page’s title”
), utilizar el operador de búsqueda intitle:
con el título de tu página (intitle:"Your page's title"
) o simplemente introducir la URL en Google.
sitio: consultas
También puedes comprobar si tu página está indexada utilizando la site:
consulta de la página. Aquí tienes un ejemplo: introducir site:https://www.contentkingapp.com/academy/control-crawl-indexing/
puede mostrar si esa página está indexada.
¡Sin embargo, este enfoque no siempre es fiable!
Hemos visto casos en los que las páginas se clasifican, pero no aparecen para las consultas site:
. Así que nunca te fíes sólo de esta comprobación.
Cómo conseguir que Google indexe tu sitio web rápidamente
Para conseguir que tu sitio web sea indexado por Google, debes deshacerte de cualquier obstáculo que impida a Google indexarlo en primer lugar.
En segundo lugar, debes facilitar a Google el descubrimiento de tu contenido con un empujón. Recuerda que Google siempre tiene como objetivo ofrecer a sus usuarios un contenido de alta calidad para responder adecuadamente a sus consultas. Asegúrate de que tu contenido se ajusta a este criterio.
Por último, impulsa la popularidad de tu contenido ganando backlinks y haciendo que la gente hable de tu contenido en las redes sociales.
1. Evita que las directivas de robots afecten a la indexación
Una razón común por la que Google no indexa tu contenido es por la directiva robots noindex. Si bien esta directiva te ayuda a prevenir problemas de contenido duplicado, envía a Google una fuerte señal para que no indexe ciertas páginas de tu sitio web. Las directivas meta robots se pueden implementar a través del código fuente HTML, y la cabecera HTTP.
En su código fuente HTML, la etiqueta meta robots puede tener un aspecto similar al siguiente:
<meta name="robots" content="noindex,follow" />
.
Sólo impleméntalas en las páginas que definitivamente no quieres que se indexen, y en caso de que una página que quieres que se indexe esté teniendo problemas de indexación, comprueba dos veces si la directiva noindex no está implementada.
Recibe una alerta al instante sobre cualquier página importante que esté siendo noindexada. Se acabaron las sorpresas de SEO
2. Configura correctamente las etiquetas canónicas
Aunque las etiquetas canónicas no son una señal tan fuerte como la directiva meta robots, su uso incorrecto puede provocar problemas de indexación. Asegúrate de que las páginas que quieres que se indexen no están canonizadas.
Una de las cosas que he visto es que los sitios que se empeñan en asegurarse de que sus páginas se canonizan, acaban canonizando a páginas que también están marcadas con
noindex
.Google necesita señales claras y consistentes, por lo que canonizar su contenido a una página marcada con
noindex
podría detener el rendimiento de las páginas afectadas en su camino.
3. No desautorices el contenido que quieres que se indexe
El archivo robots.txt es una herramienta importante que envía señales a todos los motores de búsqueda sobre la rastreabilidad de tus URLs. Puede configurarse para que Google sepa que debe ignorar ciertas partes de tu sitio web.
Asegúrate de que las URL que quieres que se indexen no están desautorizadas en robots.txt. Un error en el robots.txt puede hacer que los nuevos contenidos y las actualizaciones de contenidos no se indexen. Tenga en cuenta que cualquiera puede cometer errores en el archivo robots.txt, incluso grandes empresas como Ryanair.
Para comprobar qué páginas están bloqueadas por robots.txt, consulte el informe «Indexado, aunque bloqueado por robots.txt» en Google Search Console.
El archivo robots.txt puede ser sencillo de utilizar, pero también es bastante potente en cuanto a causar un gran lío. He visto muchos casos en los que los sitios web estaban «listos para funcionar» y se pusieron en marcha con un
Disallow: /
.El resultado es que todas las páginas están bloqueadas para los motores de búsqueda, y nadie puede encontrar el sitio web a través de la búsqueda de Google. Mientras tanto, el cliente empieza a preguntarse por qué Google no indexa nada. Una línea de código puede pasar desapercibida, y bloquear a Google para que no encuentre todo el contenido de tu sitio web!
4. Evite las trampas de rastreo y optimice el presupuesto de rastreo
Para asegurarse de sacar el máximo partido al rastreo de su sitio web por parte de Google, evite crear trampas de rastreo. Las trampas de rastreo son problemas estructurales dentro de un sitio web que hacen que los rastreadores encuentren un número prácticamente infinito de URLs irrelevantes, en las que los rastreadores pueden perderse.
Debes asegurarte de que la base técnica de tu sitio web está a la altura, y de que estás utilizando herramientas adecuadas que puedan detectar rápidamente las trampas de rastreo en las que Google puede estar desperdiciando tu valioso presupuesto de rastreo.
La mayor causa de las trampas de rastreo en los sitios web de hoy en día proviene de la navegación facetada y de los filtros de precio o tamaño (especialmente si se pueden seleccionar varios). Si no ocultas estas URLs a Google, puedes crear fácilmente millones de URLs extra a partir de unas pocas páginas. Recuerda que Google puede seguir tanto los enlaces normales como los enlaces JavaScript y que las URLs distinguen entre mayúsculas y minúsculas.
Mi consejo: ¡asegúrate de que todas las variaciones de URLs que deban ser bloqueadas, realmente lo sean!
5. Alimenta a Google con contenido indexable a través de un mapa del sitio XML
Una vez que estés seguro de que no hay ningún bloqueo por tu parte, debes facilitar a Google el descubrimiento de tus URLs y la comprensión de la infraestructura de tu sitio web en general. Los mapas de sitio XML son una gran manera de hacer esto.
Todo el contenido recién publicado o el contenido actualizado que necesita ser indexado debe ser añadido a su(s) mapa(s) de sitio XML automáticamente. Para que su contenido sea fácil de encontrar por Google, envíe su(s) mapa(s) de sitio XML a Google Search Console.
- Acceda a Google Search Console.
- Seleccione la propiedad para la que desea enviar un mapa del sitio.
- Haga clic en
Sitemaps
bajoIndex
en el lado izquierdo. - Envíe la URL del mapa del sitio XML.
Google comprobará periódicamente el sitemap XML enviado en busca de nuevo contenido para descubrirlo, rastrearlo y, con suerte, indexarlo.
Si tienes un sitio web grande, ten en cuenta que los sitemaps XML deben limitarse a un máximo de 50.000 URLs. Es mejor generar más sitemaps XML con menos URLs cada uno que superar ese límite.
Oliver Mason ha descrito una estrategia de mapa de sitio XML (se abre en una nueva pestaña) en la que limitó la cantidad de URLs a 10.000 y las organizó cronológicamente – con sitemap1.xml
conteniendo las páginas más antiguas, y sitemap14.xml
conteniendo las páginas más recientes.
Esto llevó a una mejor indexación. Parece que vale la pena alimentar a Google con cantidades más pequeñas de URLs y agrupar el contenido nuevo.
Mi forma de ir a conseguir cualquier cosa indexada rápidamente es siempre verificar el sitio en Search Console y luego enviar el mapa del sitio XML allí.
Asegúrate siempre de que tu mapa del sitio XML tiene todas las páginas que quieres tener indexadas en él, y organizadas para que Google pueda leerlas – con índices de mapas del sitio si es necesario.
Para mí, esta ha sido la mejor manera de llamar a la puerta de Google para que sepan que pueden recorrer el sitio web lo antes posible y rastrear/indexar todo lo que se encuentra allí y siempre se puede volver a comprobar cuándo fue enviado y leído por última vez por Google.
6. Envía manualmente tus URL a Google Search Console
Aunque Google descubrirá, rastreará y potencialmente indexará tus páginas nuevas o actualizadas por sí mismo, sigue mereciendo la pena darle un empujón enviando las URL a Google Search Console. De esta manera, también puede acelerar el proceso de clasificación.
Puedes enviar tus URLs en el inspector de URLs de GSC:
- Accede a Google Search Console
- Selecciona un sitio web para el que quieras enviar una URL
- Envía la URL a la parte superior de Google Search Console
- Comprueba si la URL es indexable haciendo clic en el botón
TEST LIVE URL
- Haz clic en el botón
REQUEST INDEXING
. - Haga lo mismo con las páginas que enlazan con la página que desea que Google indexe.
Tenga en cuenta que las páginas pueden estar indexadas y, sin embargo, no estar clasificadas. Por ejemplo, si solicita la indexación en Google Search Console (GSC), sus páginas se indexarán rápidamente, pero no se clasificarán de inmediato. Sin embargo, esto generalmente acelerará todo el proceso.
7. Enviar post a través de Google My Business
Enviar un post a través de Google My Business le da a Google un empujón extra para rastrear e indexar las URLs que has incluido allí. No recomendamos hacer esto para cualquier post, y ten en cuenta que este post se mostrará en el panel de conocimiento de Google My Business en la parte derecha para las búsquedas de la marca.
- Accede a Google My Business (se abre en una nueva pestaña)
- Elige la ubicación para la que quieres enviar un post.
- Haz clic en
Create post
y elige el tipoWhat's New
. - Añade una foto, escribe un breve post, selecciona la opción
Learn more
paraAdd a button (optional)
, rellena tu URL en el campoLink for your button
y dale aPublish
. - Haz lo mismo con las páginas que enlazan con la página que quieres que Google indexe.
8. Indexación automática a través de la API de indexación de Google
Los sitios web que tienen muchas páginas de corta duración, como anuncios de empleo, anuncios de eventos o vídeos en directo, pueden utilizar la API de indexación de Google (se abre en una nueva pestaña) para solicitarle automáticamente que rastree e indexe el contenido nuevo y los cambios de contenido. Debido a que permite empujar URLs individuales, es una manera eficiente para que Google mantenga su índice fresco.
Con la API de indexación, puedes
- Actualizar una URL: notificar a Google de una URL nueva o actualizada para que la rastree
- Eliminar una URL: notificar a Google que has eliminado una página obsoleta de tu sitio web
- Obtener el estado de una solicitud: ver cuándo Google rastreó la URL la última vez
Aunque Google no recomienda que les alimentes con otros tipos de contenido que no sean trabajos y eventos, he conseguido indexar páginas normales utilizando la API. Una cosa que he notado es que la API parece funcionar mejor para las páginas nuevas que para la reindexación. Google podría imponer esto en algún momento, pero por ahora funciona bien. RankMath tiene un plugin (opens in a new tab) que puede facilitar mucho el trabajo, pero requiere un poco de configuración.
9. Proporciona a Google sólo contenido de alta calidad
El objetivo de Google es devolver a sus usuarios contenido de alta calidad, lo más rápido posible. Por lo tanto, concéntrese siempre en proporcionar a Google el mejor contenido que pueda producir para aumentar sus posibilidades de ser indexado rápidamente.
Con la estricta evaluación de contenido de Google y la interminable competencia, crear y optimizar un gran contenido es un proceso que nunca cesará.
Además de generar nuevo contenido, concéntrese en mejorar el que ya existe. Actualice el contenido de bajo rendimiento para que devuelva mejores respuestas a los visitantes potenciales. Si tiene contenido de baja calidad o anticuado en su sitio web, considere la posibilidad de eliminarlo por completo o de disuadir a Google de que gaste su preciado presupuesto de rastreo en él.
El proceso de cortar el contenido anticuado, irrelevante o simplemente de muy baja calidad se denomina poda de contenido. Al deshacerse del peso muerto, está creando espacio para que otros contenidos -que sí tienen potencial- florezcan, proporcionando a Google sólo el mejor contenido que su sitio web puede ofrecer.
10. Evita el contenido duplicado
Otra forma de convertir el presupuesto de rastreo de Google en un enorme desperdicio es tener contenido duplicado. Este término se refiere al contenido muy similar, o idéntico, que aparece en varias páginas dentro de su propio sitio web, o en otros sitios web.
En general, el contenido duplicado puede ser realmente confuso para Google. En principio, Google sólo indexa una URL para cada conjunto de contenido único. Pero es difícil para el buscador determinar qué versión debe indexar, y esto se refleja posteriormente en sus resultados de búsqueda. Y como las versiones idénticas siguen compitiendo entre sí, baja el rendimiento de todas ellas.
El contenido duplicado puede convertirse en un duro problema, sobre todo para los propietarios de sitios web de eCommerce, que tienen que encontrar una forma de indicar a Google qué partes de su sitio web debe indexar y cuáles debe mantener ocultas.
Para ello, puede utilizar robots.txt disallow para filtros y parámetros, o puede implementar URLs canonicalizadas. Pero como se mencionó en la primera parte de este artículo, ten mucho cuidado con lo que estás implementando, ya que incluso un pequeño cambio puede tener un impacto negativo.
11. Aprovecha los enlaces internos y evita el uso de nofollow
Los enlaces internos juegan un papel enorme para que Google entienda los temas de tu sitio web y su jerarquía interna. Al implementar enlaces internos estratégicamente colocados, facilitarás que Google entienda de qué trata tu contenido y cómo ayuda a los usuarios.
Asegúrate de evitar el uso del atributo rel=”nofollow” attribute
en tus enlaces internos, ya que el valor del atributo nofollow indica a Google que no debe seguir el enlace a la URL de destino. Esto hace que tampoco se pase el valor del enlace.
Si necesitas que las nuevas páginas se indexen rápidamente, sé estratégico sobre cómo enlazarlas internamente.
Añadir enlaces internos en su página de inicio y en áreas de todo el sitio como la cabecera y el pie de página acelerará significativamente el proceso de rastreo e indexación.
Considere la posibilidad de crear áreas dinámicas en su página de inicio que muestren su contenido más reciente, ya sea una entrada del blog, un artículo de noticias o un producto.
También puede utilizar enlaces dentro de un mega menú que enumere las últimas URL dentro de las diferentes taxonomías de su sitio.
12. Construye backlinks relevantes para tu contenido
No es exagerado decir que la construcción de enlaces es una de las disciplinas más importantes en este campo. El consenso general es que los enlaces contribuyen en más de un 50 por ciento a su éxito SEO.
A través de los enlaces entrantes, a menudo llamados backlinks, Google puede descubrir su sitio web. Y como los enlaces también transfieren una parte de su autoridad, se indexará más rápido si un backlink proviene de un sitio web de alta autoridad, y afectará significativamente a su clasificación.
Para ayudarle a impulsar sus opciones de indexación y clasificación, aquí hay toda una lista de estrategias de construcción de enlaces altamente eficaces.
13. Crea buzz alrededor de tu contenido en las redes sociales
Al principio de este artículo, mencionamos que Google se ha vuelto mucho más estricto cuando se trata de qué contenido indexa. Cuando creas un rumor en torno a tu contenido en las redes sociales, le indica a Google que el contenido es popular, lo que acelera el proceso de indexación. Por ejemplo, publicar tu contenido en Twitter junto con algunos hashtags populares puede ayudar a acelerar el proceso de indexación.
Debido al acceso de Google al «flujo de datos de la manguera de fuego» de Twitter (se abre en una nueva pestaña), verás que todo tipo de contenido -pero especialmente el contenido de noticias- se descubrirá rápidamente si se comparte en Twitter.
Conclusión
Conseguir que tu sitio web sea indexado correctamente por Google puede resultar un trabajo infernal. Tienes que enfrentarte a muchos retos tanto técnicos como de contenido y de relaciones públicas. Y con la reciente actualización del núcleo de Google en mayo de 2020, la indexación de nuevas páginas se ha vuelto aún más difícil.
Pero con una estrategia adecuada y una lista de comprobación en su lugar, puede conseguir que Google indexe las partes más importantes de su sitio web y aumentar su rendimiento de SEO con altos rankings.