Pregúntele a un SEO: ¿Por qué mis páginas se descubren pero no se indexan?

Pregúntele a un SEO: ¿Por qué mis páginas se descubren pero no se indexan?


La pregunta de hoy de Ask An SEO proviene de Mandeep, quien está teniendo problemas con la indexación en su sitio.

Mandeep pregunta:

“Hemos rediseñado un sitio web y hemos agregado algunas páginas nuevas. Algunas páginas se indexaron correctamente y otras no.

Lo intenté varias veces en Google pero no funciona. Ahora, mientras envío la URL para indexar, muestra este error a través de Google Search Console: Descubierto: actualmente no indexado […]

Lo he intentado todo pero nada funciona. Por favor ayúdenme a resolver este problema”.

Esta advertencia proviene de la sección «Páginas» del informe «Indexación» en Google Search Console. Este informe brinda a los usuarios información sobre las páginas que Google ha rastreado e indexado y los problemas que puede haber encontrado al hacerlo.

El informe brindará detalles de las páginas que se han rastreado e indexado correctamente. También enumera los motivos por los que las páginas del sitio no se han indexado.

¿Es un problema si una página no está indexada?

La mayoría de los sitios tienen páginas que no están indexadas. A menudo se realizan a petición del propietario del sitio web.

Por ejemplo, una página podría excluirse deliberadamente de los índices del motor de búsqueda mediante una etiqueta HTML «noindex» en la página, o tal vez se esté bloqueando su rastreo en el archivo robots.txt.

Las URL que se han excluido intencionalmente de la indexación aparecerán en este informe, así como las páginas con problemas de indexación problemáticos.

En general, puede llevar algún tiempo rastrear e indexar una nueva página de un sitio web. Una nueva página que tarda en aparecer entre las páginas «indexadas» del informe no siempre es una señal de un problema.

No es necesario abordar todos los motivos del informe «Por qué las páginas no están indexadas».

Problemas de indexación

Google no rastreará ni indexará todas las URL que encuentre. Su principal preocupación como administrador de un sitio web es que las páginas que desea que estén disponibles como resultados de búsqueda estén indexadas.

Básicamente, si no están indexados, no serán elegibles para ser un resultado de búsqueda.

Hay varias razones en el informe «Por qué las páginas no están indexadas» que hacer sugerir un problema en el sitio que debería ser investigado. Por ejemplo, «Error del servidor (500)» y «Soft 404».

Es posible que estas marcas no sean necesariamente un problema para las URL individuales si no son las que desea indexar, pero pueden indicar un problema más amplio con el sitio.

¿Qué es “descubierto – actualmente no indexado”?

«Descubierto: actualmente no indexado» es un error que Google señala para las URL que conoce pero que no ha indexado.

Lo que es importante recordar es que las URL no aparecerán en este segmento si caben dentro de otro en el informe.

Por ejemplo, técnicamente Google puede haber descubierto una página con una etiqueta noindex y no haberla indexado, pero aparecería en el grupo «Excluida por la etiqueta ‘noindex'», por lo que las páginas dentro del grupo «Descubierta – actualmente no indexada» están ahí. por otra razón.

La explicación que da Google para una URL que aparece como «Descubierta – actualmente no indexada» es:

“Google encontró la página, pero aún no la rastreó. Normalmente, Google quería rastrear la URL, pero se esperaba que esto sobrecargara el sitio; por lo tanto, Google reprogramó el rastreo. Es por eso que la fecha del último rastreo está vacía en el informe”.

Google intenta que sus bots rastreen a conciencia.

Es decir, como Googlebot no es el único visitante de un sitio, y tal vez uno entre muchos robots que lo rastrean, no quiere bloquear el sitio enviando demasiadas «solicitudes» al servidor.

¿Qué podría estar causando que una URL sea “descubierta – actualmente no indexada”?

Hay dos razones principales por las que Google conoce una página pero no la indexa. John Muller dio detalles sobre estos en 2023.

Esencialmente, además de las preocupaciones sobre la capacidad del servidor para soportar el rastreo, también se considera la calidad de la página.

Ahora bien, si una página no ha sido rastreada, ¿cómo puede Google saber su calidad? Bueno, no puede. Lo que puede hacer es hacer suposiciones basadas en la calidad de las páginas del resto del sitio.

Así es: las páginas delgadas, duplicadas y de bajo valor en otras partes de su sitio web pueden afectar la indexación de sus páginas principales.

Cómo solucionar el problema

No existe una solución rápida para mover una página de «Descubierta – actualmente no indexada» a «Indexada», pero existen varias soluciones que puede probar.

Compruebe si la página está realmente indexada

El primer paso es determinar si el informe de Google Search Console es preciso y está actualizado.

En la esquina superior derecha del informe, verá la fecha de «Última actualización». Esto le da una idea de si el informe podría estar desactualizado.

A continuación, vaya a Google y realice una sitio:[yourwebsitedomain] URL interna:[the URL slug of the page you want to index] buscar.

Si la página aparece como resultado de búsqueda, entonces sabrá que en realidad está indexada.

Dele algo de tiempo al informe para que se actualice y comenzará a aparecer en la sección «Indexado» y no en el informe «Descubierto – actualmente no indexado».

Verifique la calidad de la página de su sitio

A continuación, es posible que desees considerar la calidad general de tu sitio web, ya que esta podría ser la razón por la que Google no indexa tu página.

Recuerde, la calidad no es sólo una medida de las palabras de su sitio, su relevancia para las consultas de búsqueda y el «EEAT» general mostrado. En cambio, John Muller de Google lo describió como:

“Cuando hablamos de la calidad del contenido, no nos referimos sólo al texto de sus artículos.

Es realmente la calidad de su sitio web en general.

Y eso incluye todo, desde la distribución hasta el diseño.

Por ejemplo, cómo presentas las cosas en tus páginas, cómo integras las imágenes, cómo trabajas con velocidad, todos esos factores entran en juego allí”.

Por lo tanto, revise su sitio web con estos criterios en mente. ¿Cómo se compara la calidad de su sitio web con la de sus competidores?

Una auditoría exhaustiva del sitio web es un buen punto de partida.

Buscar páginas duplicadas

A veces, un sitio web puede tener páginas duplicadas o de baja calidad de las que el administrador del sitio web no tiene conocimiento.

Por ejemplo, se puede acceder a una página a través de varias URL. Es posible que tenga una página «Contáctenos» que exista tanto en exampledomain.com/contact-us como en exampledomain.com/contact-us/.

El robot de Google considera la URL con y la URL sin la “barra diagonal” páginas separadas si puede llegar a ambas y el servidor devuelve un código de estado 200. Es decir, ambas son páginas vivas.

Existe la posibilidad de que todas sus páginas se dupliquen de esta misma manera.

Es posible que también tenga muchos parámetros de URL en su sitio web que desconoce. Estas son URL que contienen «cadenas de consulta», como ejemplodominio.com/vestido?color=rojo.

Por lo general, se deben a las opciones de filtrado y clasificación de su sitio web. En un sitio web de comercio electrónico, esto podría verse como una página de categoría de producto filtrada según criterios como el color y que se puede ordenar por precio.

Como resultado, las características principales de la página no cambian con este filtrado y clasificación, solo los productos enumerados. Estas son páginas técnicamente separadas y rastreables y pueden estar causando muchos duplicados en su sitio.

Puede pensar que su sitio web solo tiene 100 páginas de alta calidad. Sin embargo, un robot de Google puede ver cientos de miles de páginas casi duplicadas como resultado de estos problemas técnicos.

Formas de solucionar «Descubierto: actualmente no indexado»

Una vez que haya identificado las causas probables por las que su URL no se indexa, puede intentar solucionarlo.

Si su sitio web tiene páginas duplicadas, baja calidad, contenido extraído u otros problemas de calidad, ahí es por donde empezar.

Como beneficio adicional, es probable que vea mejorar su clasificación en todas sus páginas a medida que trabaja para solucionar estos problemas.

Señale la importancia de la página

En el ejemplo de nuestra pregunta inicial, hay una página específica que Mandeep está luchando por indexar.

En este escenario, sugeriría intentar reforzar la importancia de la página ante los ojos de los motores de búsqueda. Dales una razón para rastrearlo.

Agregue la página al mapa del sitio XML del sitio web

Una forma de mostrarle a Google que es una página importante que merece ser rastreada e indexada es agregándola al mapa de sitio XML de su sitio web.

Esto es esencialmente una señal de todas las URL que cree que los robots de búsqueda deberían rastrear.

Recuerde, el robot de Google ya sabe que la página existe; simplemente no cree que sea beneficioso rastrearlo e indexarlo.

Si ya está en el mapa del sitio XML, no te detengas ahí. Considere estos próximos pasos.

Agregar enlaces internos a la página

Otra forma de mostrar la importancia de una página es vincularla desde páginas internas del sitio.

Por ejemplo, agregar la página a su sistema de navegación principal, como el menú principal.

O agregue enlaces contextuales desde la copia en otras páginas de su sitio web. Esto le indicará al robot de Google que se trata de una página importante de su sitio web.

Agregar enlaces externos a la página

Vínculos de retroceso: son una parte fundamental del SEO. Sabemos desde hace tiempo que Google utilizará enlaces de otros sitios web para determinar la relevancia y autoridad de una página para un tema.

Si tiene dificultades para mostrarle a Google que su página tiene la calidad suficiente para indexarla, tener enlaces externos de sitios web relevantes y de buena reputación que apunten a ella puede brindarle una seguridad adicional sobre el valor de la página.

Por ejemplo, si la página que tiene dificultades para ser indexada es la página de detalles del producto de un vestido rojo específico, entonces el hecho de que la página de ese vestido aparezca en algunos blogs de moda puede darle a Google la señal de que es una página de alta calidad.

Envíelo para que lo rastreen

Una vez que haya realizado cambios en su sitio web, intente volver a enviar la página para que se rastree a través de Google Search Console.

Si observa en el informe «Indexación» de Google Search Console que la URL todavía está dentro del grupo «Descubierta – actualmente no rastreada» después de un tiempo (Google puede tardar desde unos días hasta algunas semanas en rastrear una página enviada). ), entonces sabrás que es posible que todavía tengas algunos problemas con la página.

En resumen

Optimice su sitio web para rastreo e indexación. Si hace esto, es probable que vea que esas páginas pasan de «Descubiertas – actualmente no indexadas» a «Indexadas».

Optimizar su sitio web en particular requerirá un análisis en profundidad de la calidad general del sitio e identificar cómo transmitir la importancia de las páginas «descubiertas – actualmente no indexadas» al robot de Google.

Más recursos:


Imagen de portada: Paul Poetry/Search Engine Journal

Related Posts
Leave a Reply

Your email address will not be published.Required fields are marked *