Google explica las razones por las que el rastreo no se indexa

Google explica las razones por las que el rastreo no se indexa


En mayo, Gary Illyes de Google asistió a una entrevista en la conferencia SERP Conf 2024 en Bulgaria y respondió una pregunta sobre las causas del rastreo pero no indexación, ofreciendo múltiples razones que son útiles para depurar y corregir este error.

Aunque la entrevista tuvo lugar en mayo, el video de la entrevista no fue reportado y no mucha gente lo vio. Sólo me enteré porque la siempre increíble Olesia Korobka (@Giridja) recientemente llamó la atención sobre la entrevista en una publicación de Facebook.

Entonces, aunque la entrevista se realizó en mayo, la información sigue siendo oportuna y útil.

Motivo del rastreo: actualmente no indexado

Rastreada actualmente no indexada es una referencia a un informe de error en el informe de indexación de páginas de Google Search Console que alerta de que Google rastreó una página pero no fue indexada.

Durante una entrevista en vivo, alguien envió una pregunta:

“¿Puede ser rastreada pero no indexada el resultado de que una página sea demasiado similar a otras cosas ya indexadas?

Entonces, ¿Google sugiere que ya hay suficientes cosas más y que las tuyas no son lo suficientemente únicas?

La documentación de la consola de búsqueda de Google no proporciona una respuesta de por qué Google puede rastrear una página y no indexarla, por lo que es una pregunta legítima.

Gary Illyes respondió que sí, una de las razones podría ser que ya existe otro contenido similar. Pero también continúa diciendo que hay otras razones.

Él respondió:

“Sí, eso podría ser algo que pueda significar. Rastreado pero no indexado, lo ideal sería dividir esa categoría en partes más granulares, pero es muy difícil debido a cómo existen internamente los datos.

Pueden ser muchas cosas, la eliminación de duplicados es una de esas cosas, donde rastreamos la página y luego decidimos no indexarla porque ya hay una versión de eso o una versión extremadamente similar de ese contenido disponible en nuestro índice y Tiene mejores señales.

Pero sí, pero pueden ser varias cosas”.

La calidad general del sitio puede afectar la indexación

Luego, Gary llamó la atención sobre otra razón por la cual Google podría rastrear pero optar por no indexar un sitio, diciendo que podría ser un problema de calidad del sitio.

Illyes luego continuó su respuesta:

“Y la calidad general del sitio, eso puede importar mucho, cuántos de estos rastreados pero no indexados se ven en la consola de búsqueda. Si el número de estas URL es muy alto, esto podría indicar problemas de calidad generales.

Y lo he visto muchas veces desde febrero, donde de repente decidimos que estamos indexando una gran cantidad de URL en un sitio simplemente porque… nuestra percepción del sitio ha cambiado».

Otras razones por las que el rastreo no se indexa

A continuación, Gary ofreció otras razones por las que las URL podrían rastrearse pero no indexarse, diciendo que podría ser que la percepción de Google del sitio podría haber cambiado, pero que podría tratarse de un problema técnico.

Gary explicó:

“…Y una posibilidad es que cuando veamos que ese número aumenta, que la percepción de… la percepción de Google del sitio haya cambiado, eso podría ser una cosa.

Pero también podría haber un error, por ejemplo en el sitio, y luego mostró exactamente la misma página en cada URL del sitio. Esa también podría ser una de las razones por las que ese número aumenta.

Entonces sí, podría haber muchas cosas”.

Comidas para llevar

Gary proporcionó respuestas que deberían ayudar a depurar por qué Google puede rastrear una página web pero no indexarla.

  • El contenido es similar al contenido ya clasificado en las páginas de resultados del motor de búsqueda (SERP).
  • Existe exactamente el mismo contenido en otro sitio que tiene mejores señales.
  • Problemas generales de calidad del sitio
  • Problemas técnicos

Aunque Illyes no explicó lo que quiso decir con otro sitio con mejores señales, estoy bastante seguro de que está describiendo el escenario en el que un sitio distribuye su contenido a otro sitio y Google elige clasificar el otro sitio por el contenido y no por el editor original.

Mire a Gary responder esta pregunta en el minuto 9 de la entrevista grabada:

Imagen destacada de Shutterstock/Roman Samborskyi

Related Posts
Leave a Reply

Your email address will not be published.Required fields are marked *