El defensor de búsqueda de Google, John Mueller, ha rechazado la idea de crear páginas Markdown o JSON separadas solo para modelos de lenguaje grandes (LLM), diciendo que no ve por qué los LLM necesitarían páginas que nadie más ve.
La discusión comenzó cuando Lily Ray preguntó en Bluesky sobre «crear páginas de rebajas/JSON separadas para LLM y entregar esas URL a bots», y si Google podría compartir su perspectiva.
Ray preguntó:
No estoy seguro de poder responder, pero estoy empezando a escuchar mucho sobre la creación de páginas de rebajas/JSON separadas para LLM y la entrega de esas URL a bots. ¿Puedes compartir la perspectiva de Google sobre esto?
La pregunta llama la atención sobre una tendencia en desarrollo en la que los editores crean instantáneas de importantes en formatos que son más fáciles de entender para los sistemas de inteligencia artificial.
Hay una discusión más activa sobre este tema en X.
Este ha sido el tema candente últimamente, me han propuesto empresas que hacen esto.
—Lily Ray 😏 (@lilyraynyc) 23 de noviembre de 2025
Lo que dijo Mueller sobre las páginas exclusivas de LLM
Mueller respondió que no tiene conocimiento de nada por parte de Google que requiera este tipo de configuración.
Señala que los LLM han trabajado con páginas web normales desde el principio:
No tengo conocimiento de nada al respecto. En mi punto de vista, los LLM se han entrenado (leído y analizado) páginas web normales desde el principio, parece un hecho que no tienen problemas para lidiar con HTML. ¿Por qué querrían ver una página que ningún usuario ve? Y, si comprueban la equivalencia, ¿por qué no utilizar HTML?
Cuando Ray preguntó si un formato separado podría ayudar a “agilizar la transmisión rápida de puntos clave a los LLM”, Mueller argumentó que si los formatos de archivo marcaban una diferencia significativa, probablemente escucharía eso directamente de las empresas que ejecutan esos sistemas.
Mueller añadió:
Si quienes crean y ejecutan estos sistemas supieran que pueden crear mejores respuestas desde sitios con formatos de archivo específicos, espero que lo expresaran muy abiertamente. Las empresas de IA no son conocidas por ser tímidas.
Dijo que algunas páginas aún pueden funcionar mejor para los sistemas de inteligencia artificial que otras, pero no cree que eso se reduzca a HTML versus Markdown:
Dicho esto, puedo imaginar que algunas páginas funcionen mejor para los usuarios y otras mejor para los sistemas de inteligencia artificial, pero dudo que se deba al formato del archivo y definitivamente no se puede generalizar a todo. (Excluyendo JS, que todavía parece difícil para muchos de estos sistemas)”.
En conjunto, los comentarios de Mueller sugieren que, desde el punto de vista de Google, no es necesario crear Markdown o clones JSON solo para bots de páginas existentes solo para que los LLM lo entiendan.
Cómo encajan los datos estructurados
Otras personas en el hilo trazaron una línea entre los formatos especulativos «en la sombra» y los casos en los que las plataformas de inteligencia artificial tienen requisitos de alimentación claramente definidos.
Una respuesta de Matt Wright señaló los feeds de productos de comercio electrónico de OpenAI como un ejemplo en el que los esquemas JSON son importantes.
En ese contexto, una especificación definida rige cómo ChatGPT ingiere y muestra los datos del producto. Wright explica:
Curiosamente, los feeds de productos de comercio electrónico OpenAI están activos: los esquemas JSON parecen tener ya un papel clave en la búsqueda de IA.
Ese ejemplo respalda la idea de que los feeds y esquemas estructurados son más importantes cuando una plataforma publica una especificación y le pide que la use.
Además, Wright señala un hilo en LinkedIn donde Chris Long observó que «los sitios editoriales que utilizan esquemas de productos tienden a incluirse en las citas de ChatGPT».
Por qué esto importa
Si se pregunta si debe crear versiones Markdown o JSON “optimizadas para LLM” de su contenido, este intercambio puede ayudarlo a regresar a lo básico.
Los comentarios de Mueller refuerzan que los LLM han podido leer y analizar HTML estándar durante mucho tiempo.
Para la mayoría de los sitios, es más productivo seguir mejorando la velocidad, la legibilidad y la estructura del contenido en las páginas que ya tiene, e implementar un esquema donde haya una guía clara de la plataforma.
Al mismo tiempo, el hilo de Bluesky muestra que los formatos específicos de IA están comenzando a surgir en áreas estrechas como las fuentes de productos. Vale la pena seguirlos, pero están vinculados a integraciones explícitas, no a una regla general que indique que el descuento es mejor para los LLM.
Mirando hacia el futuro
La conversación destaca la rapidez con la que los cambios de búsqueda impulsados por la IA se están convirtiendo en solicitudes técnicas para los equipos de desarrollo y SEO, a menudo antes de que exista documentación que los respalde.
Hasta que los proveedores de LLM publiquen pautas más concretas, este hilo le indica el trabajo que puede justificar hoy: mantenga su HTML limpio, reduzca el JavaScript innecesario donde dificulta el análisis del contenido y utilice datos estructurados donde las plataformas tengan esquemas claramente documentados.
Imagen de portada: Roman Samborskyi/Shutterstock



