La pregunta de esta semana proviene de Xaris, que pregunta:
«Por qué, aunque he compuesto y vinculado correctamente el mapa del sitio con el sitio web de un cliente, y he revisado todo, ¿estoy teniendo problemas de indexación con algunos artículos, no todos, incluso después de repetidas solicitudes a Google y Google Search Console? ¿Cuál podría ser el problema? No puedo resolverlo».
Esto está lejos de ser un problema único; ¡Todos lo hemos experimentado! «He hecho todo lo que puedo pensar, pero Google todavía no está indexando mis páginas».
¿Definitivamente no está indexado?
El primer aspecto para verificar es si la página realmente no está indexada, o simplemente no se clasifica bien.
Podría ser que la página no parezca indexada porque no puede encontrarla para lo que considera las palabras clave relevantes. Sin embargo, eso no significa que no esté indexado.
A los fines de esta pregunta, les daré consejos sobre cómo lidiar con ambas circunstancias.
¿Cuál podría ser el problema?
Hay muchas razones por las que una página podría no estar indexada o clasificada bien en Google. Discutamos los principales.
Problema técnico
Hay razones técnicas, tanto errores como decisiones conscientes, que podrían estar impidiendo que Googlebot llegue a su página e indexe.
Bots bloqueados en robots.txt
Google necesita poder comunicarse con el contenido de una página si se trata de comprender el valor de la página y, en última instancia, servirlo como resultado de búsqueda para consultas relevantes.
Si GoogleBot se bloquea para visitar estas páginas a través de Robots.txt, eso podría explicar por qué no está indexando.
Técnicamente, todavía puede indexar una página a la que no puede acceder, pero no podrá determinar el contenido de la página y, por lo tanto, tendrá que usar señales externas como vínculos de retroceso para determinar su relevancia.
Si no puede rastrear la página, incluso si sabe que existe a través del mapa del sitio, aún hará que sea poco probable que se clasifique.
La página no se puede renderizar
De manera similar, si el bot puede rastrear la página pero no puede renderizar el contenido, podría elegir no indexarlo. Sin duda, es poco probable que clasifique bien la página, ya que no podrá leer el contenido de la página.
La página tiene una etiqueta sin índice
Un problema obvio, pero a menudo pasado por alto, es que se ha aplicado una etiqueta de noindex a la página. Esto literalmente instruirá a GoogleBot que no indexe la página.
Esta es una directiva, es decir, algo que Googlebot está comprometido a promulgar.
Bloqueo de bot a nivel de servidor
Podría haber un problema a nivel de su servidor que impide que GoogleBot se rastree su página web.
Bien puede haber habido reglas establecidas en su servidor o nivel de CDN que impiden que GoogleBot se rastree nuevamente su sitio y descubra estas nuevas páginas.
Es algo que puede ser un problema bastante común cuando los equipos que no están bien versados en SEO son responsables del mantenimiento técnico de un sitio web.
Códigos de respuesta del servidor no 200
Las páginas que ha agregado al Sitemap puede ser devolver un código de estado del servidor que confunde GoogleBot.
Por ejemplo, si una página devuelve un código 4xx, a pesar de que puede ver el contenido en la página, GoogleBot puede decidir que no es una página en vivo y no lo indexará.
Página de carga lenta
Podría ser que sus páginas web se estén cargando muy lentamente. Como resultado, la percepción de su calidad puede estar disminuida.
También podría ser que estén tardando tanto en cargar que los bots tienen que priorizar las páginas que se arrastran tanto que sus páginas más nuevas no se están arrastrando.
Calidad de la página
También hay problemas con el contenido del sitio web en sí que podrían evitar que se indexe una página.
Enlaces internos bajos que sugieren una página de bajo valor
Una de las formas en que Google determinará si vale la pena clasificar una página es a través de los enlaces internos que le apuntan. Los enlaces entre páginas en su sitio web pueden significar el contenido de la página que está vinculado, pero también si la página es una parte importante de su sitio. Una página que tiene pocos enlaces internos puede no parecer lo suficientemente valioso como para clasificarse bien.
Las páginas no agregan valor
Una de las razones principales por las que una página no está indexada por Google es que no se percibe como de alta calidad.
Google no se arrastrará e indexará cada página que podría. Google priorizará contenido único y atractivo.
Si sus páginas son delgadas, o realmente no agregan valor a Internet, es posible que no se indexen a pesar de que técnicamente podrían estarlo.
Son duplicados o casi duplicados
De manera similar, si Google percibe que sus páginas son exactas o muy cerca de versiones duplicadas de las páginas existentes, no puede indexar sus nuevas.
Incluso si ha señalado que la página es única al incluirla en su mapa del sitio XML, y utilizando una etiqueta canónica de autorreferencia, Google aún hará su propia evaluación sobre si vale la pena indexar una página.
Acción manual
También existe la posibilidad de que su página web haya sido objeto de una acción manual, y es por eso que Google no la está indexando.
Por ejemplo, si las páginas que está tratando de hacer que Google indexe son lo que considera «páginas de afiliados delgados», es posible que no pueda clasificarlas debido a una penalización manual.
Las acciones manuales son relativamente raras y generalmente afectan las áreas del sitio más amplias, pero vale la pena verificar las acciones manuales de la consola de búsqueda informan para descartar esto.
Identificar el problema
Saber cuál podría ser la causa de su problema es solo la mitad de la batalla. Veamos cómo podría reducir el problema y luego cómo podría solucionarlo.
Verifique las herramientas de webmaster de Bing
Mi primera sugerencia es verificar si su página está indexada en Bing.
Es posible que no se esté centrando mucho en Bing en su estrategia de SEO, pero es una forma rápida de determinar si este es un problema centrado en Google, como una acción manual o una clasificación deficiente, en lugar de algo en su sitio que evita que la página se indexe.
Vaya a Bing Webmaster Tools e ingrese la página en su herramienta de inspección de URL. Desde aquí, verá si Bing está indexando la página o no. Si es así, entonces sabe que esto es algo que solo está afectando a Google.
Consulte el informe «Página» de la consola de búsqueda de Google
A continuación, vaya a la consola de búsqueda de Google. Inspeccione la página y vea si está realmente marcado como no indexado. Si no está indexado, Google debería dar una explicación de por qué.
Por ejemplo, podría ser que la página sea:
Excluido por «noindex»
Si Google detecta una etiqueta noindex en la página, no la indexará. Según los resultados de la herramienta de inspección de URL, le dirá que «la página no está indexada: excluida por la etiqueta ‘noindex'»
Si este es el resultado que está obteniendo para sus páginas, su próximo paso será eliminar la etiqueta noindex y volver a enviar la página que GoogleBot se arrastra.
Descubierto: actualmente no está indexado
La herramienta de inspección puede indicarle que la «página no está indexada: actualmente no está indexada».
Si ese es el caso, usted sabe con certeza que es un problema de indexación, y no un problema con las clasificaciones deficientes, lo que está causando que su página no aparezca en la búsqueda de Google.
Google explica que una URL que aparece como «descubierta, actualmente no indexada» es:
«La página fue encontrada por Google, pero aún no se rastreó. Por lo general, Google quería rastrear la URL, pero se esperaba que esto sobrecargara el sitio; por lo tanto, Google reprogramó el rastreo. Es por eso que la última fecha de rastreo está vacía en el informe».
Si está viendo este estado, existe una gran posibilidad de que Google haya examinado otras páginas en su sitio web y haya considerado que no vale la pena agregar al índice y, como tal, no gastan recursos que se arrastren a estas otras páginas de las que es consciente porque espera que sean de baja calidad.
Para solucionar este problema, debe significar la calidad y relevancia de una página para GoogleBot. Es hora de echar un vistazo crítico a su sitio web e identificar si hay razones por las cuales Google puede considerar que sus páginas son de baja calidad.
Para obtener más detalles sobre cómo mejorar una página, lea mi artículo anterior: «¿Por qué se descubren mis páginas pero no indexadas?»
Rastreado: actualmente no indexado
Si su página inspeccionada devuelve un estado de «rastreado, actualmente no indexado», esto significa que Google está al tanto de la página, lo ha rastreado, pero no ve valor al agregarlo al índice.
Si obtiene este código de estado, es mejor que busque formas de mejorar la calidad de la página.
Duplicado, Google eligió diferentes canónicos que el usuario
Puede ver una alerta para la página que ha inspeccionado, que le indica que esta página es un «Duplicado, Google eligió diferentes canónicos que el usuario».
Lo que esto significa es que ve la URL como un duplicado cercano de una página existente, y está eligiendo que la otra página se muestre en los SERP en lugar de la página inspeccionada, a pesar de haber establecido correctamente una etiqueta canónica.
La forma de alentar a Google a mostrar ambas páginas en los SERP es asegurarse de que sean únicos, tener suficiente contenido para ser útiles para los lectores.
Esencialmente, debe darle a Google una razón para indexar ambas páginas.
Solucionando los problemas
Aunque sus páginas pueden no estar indexadas por una o más de varias razones, las soluciones son bastante similares.
Es probable que haya un problema técnico con el Sitio, como una etiqueta canónica errante o un bloque Robots.
O bien, existe un problema con la calidad de la página, lo que está causando que Google no lo vea como lo suficientemente valioso como para ser indexado.
Comience revisando las posibles causas técnicas. Esto lo ayudará a identificar rápidamente si se trata de una solución «rápida» que usted o sus desarrolladores pueden cambiar.
Una vez que haya descartado los problemas técnicos, lo más probable es que esté buscando problemas de calidad.
Dependiendo de lo que ahora crea que está causando que la página no aparezca en los SERPS, puede ser que la página en sí tenga problemas de calidad o una parte más grande de su sitio web.
Si es el primero, considere EEAT, la singularidad de la página en el alcance de Internet y cómo puede significar la importancia de la página, como a través de vínculos de retroceso relevantes.
Si es lo último, es posible que desee ejecutar una auditoría de contenido para ayudarlo a reducir las formas de mejorar la percepción general de la calidad en su sitio web.
Resumen
Se necesitará un poco de investigación para identificar si su página realmente no está indexada, o si Google solo elige no clasificarlo altamente para consultas que siente que son relevantes.
Una vez que haya identificado eso, puede comenzar a acercarse si se trata de un problema técnico o de calidad que está afectando sus páginas.
Este es un problema frustrante, pero las correcciones son bastante lógicas y, con suerte, la investigación debería revelar más formas de mejorar el rastreo e indexación de su sitio.
Más recursos:
Imagen Feaded: Paulo Bobita/Search Engine Journal