Evitar que la IA de Google Use Tu Contenido

Sara Solana Pascual
Apr 15, 2025By Sara Solana Pascual

Evitar que la IA de Google Use Tu Contenido: Guía Técnica 2025
Para evitar que Google utilice tu contenido en el entrenamiento de modelos de inteligencia artificial como Gemini o Vertex AI, existen dos métodos principales: el uso de la directiva Google-Extended en el archivo robots.txt y el uso de la etiqueta nosnippet en el HTML de cada página.

¿Qué es Google-Extended?


Google-Extended es una directiva creada por Google para que los editores puedan limitar el uso de su contenido en modelos de IA generativa. Esta función, anunciada oficialmente en septiembre de 2023, permite controlar si las páginas web son usadas para mejorar los productos de IA de Google.

Cómo implementar Google-Extended


A nivel de sitio (robots.txt)


Agrega las siguientes líneas al archivo robots.txt de tu sitio web:

User-agent: Google-Extended  
Disallow: /

Ventajas:

Impide el uso de tu contenido para entrenamiento de IA.

Desventajas:

No evita el uso de contenido ya recopilado.
Puede tener efectos no documentados en la visibilidad.


A nivel de carpetas


User-agent: Google-Extended  
Disallow: /privado/

Limitaciones técnicas y riesgos

  • No actúa a nivel de página individual.
  • La documentación oficial es confusa y poco accesible.
  • Google podría usar la exclusión como argumento para no licenciar tu contenido en el futuro.


¿Afecta esto al posicionamiento SEO?


Según Google, Google-Extended no afecta la inclusión ni el ranking en la Búsqueda de Google. Sin embargo, algunos expertos indican que podría influir indirectamente en las señales de ranking basadas en IA, como "consenso". No hay evidencia empírica suficiente hasta la fecha.

Bloqueo a nivel de página: meta etiqueta nosnippet


Para impedir el uso de contenido en una página específica, puedes usar esta etiqueta HTML dentro del <head>:

<meta name="robots" content="nosnippet">

Ventajas:

Evita fragmentos en resultados de búsqueda, incluyendo AI Overviews.


Inconvenientes:

Podría reducir el CTR al eliminar el fragmento en los "10 enlaces azules".


Opciones adicionales: max-snippet y data-nosnippet


Existen otras dos etiquetas para controlar fragmentos:

  • max-snippet: limita el número de caracteres del fragmento.
  • data-nosnippet: excluye contenido específico dentro del cuerpo de la página.


Ejemplo de uso de data-nosnippet:


<span data-nosnippet>Este texto no debe usarse en IA Overviews.</span>

Recomendación final


Joe Youngblood recomienda a los editores perjudicados por actualizaciones de Google o por el uso no autorizado de su contenido que bloqueen el acceso de Google a sus datos con Google-Extended, al menos hasta que se ofrezcan condiciones justas.

Declaración de experto: "El bloqueo mediante Google-Extended no es perfecto, pero es una herramienta necesaria en la defensa de los derechos de los editores en la era de la IA." – Electronic Frontier Foundation (eff.org)

Referencias

“An update on web publisher controls” by Danielle Romain VP, Trust at Google published on Sep 28th, 2023: https://blog.google/technology/ai/an-update-on-web-publisher-controls/

“Google’s Common Crawlers” by Google for Developers last updated March 6th, 2025: https://developers.google.com/search/docs/crawling-indexing/google-common-crawlers

“AI Overviews and Your Site” by Google Search Central last updated on February 11th, 2025: https://developers.google.com/search/docs/appearance/ai-overviews

“Our AI Principals” by Google: https://ai.google/responsibility/principles/