Checker de acceso de bots de IA

Ve de un vistazo qué crawlers de IA (GPTBot, ClaudeBot, Perplexity, Google-Extended y más) está bloqueando tu sitio — y cuáles sí pueden leer tu contenido.

100% gratis Sin registro Resultado al instante

Por qué importa el acceso de bots de IA

Cada LLM importante (ChatGPT, Claude, Perplexity, Gemini, Mistral) crawlea la web con un user agent propio para que los dueños de sitios los permitan o bloqueen en robots.txt. Si bloqueas GPTBot, tu contenido nunca entrenará a ChatGPT. Si bloqueas OAI-SearchBot o PerplexityBot, no aparecerás en respuestas de IA — incluso cuando un usuario haga una pregunta que tu sitio responde perfectamente. Muchos sitios bloquean estos bots por accidente (un default de CDN, un template viejo, un snippet copiado). Esta herramienta te muestra exactamente cuáles están bloqueados en segundos.

Preguntas frecuentes sobre crawlers de IA

¿Cuál es la diferencia entre bots de entrenamiento y bots de búsqueda?

Los bots de entrenamiento (GPTBot, ClaudeBot, Google-Extended, CCBot) crawlean tu sitio para construir o mejorar modelos futuros. Los bots de búsqueda / respuestas (OAI-SearchBot, PerplexityBot, Claude-Web) traen páginas al momento de la consulta para incluirlas en respuestas de IA en vivo. Los bots de fetch (ChatGPT-User, Perplexity-User) traen URLs específicas cuando un usuario las comparte o las pide explícitamente. Bloquear los de entrenamiento mantiene tu contenido fuera de modelos futuros. Bloquear los de búsqueda te deja fuera de respuestas de IA hoy.

¿Debería bloquear los bots de IA?

Depende de tu estrategia. Si tu contenido es un activo competitivo que no quieres ver en respuestas de IA, bloquear tiene sentido. Si quieres visibilidad en ChatGPT, Claude, Perplexity y Gemini, necesitas permitir los bots relevantes. Muchos sitios marketing-pesados bloquean crawlers de IA sin querer porque Cloudflare, plugins de WP o templates viejos incluyen reglas de disallow por default. Esta tool te ayuda a detectarlos.

¿Dónde revisa el checker?

Hacemos fetch a https://tusitio.com/robots.txt y lo parseamos con el Robots Exclusion Protocol estándar. Luego revisamos cada uno de ~20 crawlers de IA conocidos contra las reglas: si un bot tiene su propia sección User-agent con Disallow: /, lo marcamos como bloqueado explícitamente. Si no hay sección propia pero User-agent: * tiene Disallow: /, lo marcamos como bloqueado por wildcard. Todo lo demás cuenta como permitido.

¿Cuál es la diferencia entre GPTBot y ChatGPT-User?

GPTBot es el crawler de entrenamiento de OpenAI — recolecta datos para mejorar modelos GPT futuros. ChatGPT-User es un fetcher activado por usuario que trae una URL cuando alguien la comparte en una conversación de ChatGPT. OAI-SearchBot es el más nuevo: potencia ChatGPT Search y visita páginas para incluirlas en respuestas en tiempo real. Permitir los tres maximiza tu visibilidad; bloquear GPTBot y permitir los otros te deja fuera del entrenamiento pero presente en respuestas en vivo.

¿Esta tool revisa todos los bots de IA?

Revisamos cerca de 20 de los user agents de IA más declarados entre OpenAI, Anthropic, Google, Perplexity, Meta, Apple, Amazon, ByteDance, Mistral, Cohere, You.com, DuckDuckGo y Common Crawl. Aparecen bots nuevos seguido, así que refrescamos la lista periódicamente. Si usas un agent privado o enterprise que no cubrimos, agrégalo al mismo snippet que damos como fix.

Otras herramientas gratis de visibilidad en IA