Crawl access
Directivas optimizadas y visibilidad limpia para los principales crawlers de IA — para que los modelos puedan llegar a tu contenido, antes que nada.
robots.txt · llms.txt · render · sitemapInicioMetodologíaEl Marco CITE
Cuatro pilares — Crawl access, Identity, Trust signals, Extractability — que determinan si ChatGPT, Perplexity, Gemini y Google AI Overviews citan tu marca dentro de sus respuestas. La metodología detrás de cada engagement de Citable, publicada abierta.
Lectura · 8 min · Actualizado 2026-06
Directivas optimizadas y visibilidad limpia para los principales crawlers de IA — para que los modelos puedan llegar a tu contenido, antes que nada.
robots.txt · llms.txt · render · sitemapDatos estructurados verificables y anclaje de entidad en los grafos de conocimiento, para que el modelo sepa exactamente qué marca eres — y te cite a ti, no a un homónimo.
schema · Wikidata · grafo de entidadCitas de terceros, autoridad y cumplimiento auditable — la frontera de confianza que hace que un modelo se atreva a nombrarte.
citas · autoridad · cumplimientoActivos legibles por IA y reescritura answer-first del primer párrafo, para que cada página entregue una respuesta limpia, precisa y citable que el modelo pueda levantar.
answer-first · estructurado · citableDetalle
Cada pilar tiene su propia definición, su propio framework de medición y su propio playbook de implementación. El orden importa: C es la barrera de entrada; E es el de mayor leverage pero más lento.
Pilar 01
Los crawlers de IA — GPTBot, ClaudeBot, PerplexityBot, Google-Extended, Bytespider — pueden alcanzar tu contenido sin bloqueos en robots.txt, soft-paywalls ni muros de JS-render sin resolver.
Si el crawler no puede leerte, no existes para el motor. Es la primera barrera de elegibilidad. La mayoría de los fallos aquí son accidentales: un robots.txt copiado de plantilla, una regla de Cloudflare bloqueando agentes desconocidos, un sitio JS-only sin fallback estático.
Qué medimos
Qué entregamos
Pilar 02
Los motores de IA identifican tu marca de forma inequívoca como entidad propia — separada de competidores con nombres similares, separada de términos genéricos, con atributos estructurales verificables.
Sin identidad de entidad, los motores prefieren no citarte. Dos marcas llamadas 'Apex' pierden las dos. La marca con un grafo de schema limpio, un Q-ID en Wikidata y una entrada en Knowledge Graph gana el desempate porque no hay ambigüedad que resolver.
Qué medimos
Qué entregamos
Pilar 03
Autoridades independientes refuerzan tus afirmaciones de identidad. Los motores ponderan mucho las señales de terceros porque las propias se pueden manipular.
La autoridad propia es barata. La de terceros es cara — y esa escasez es lo que la hace creíble. Una marca citada en Wikipedia, indexada en Wikidata, perfilada por prensa reputada y enlazada desde el grafo abierto de conocimiento compone confianza como un buen historial crediticio compone capacidad de endeudamiento.
Qué medimos
Qué entregamos
Pilar 04
Tu contenido tiene la forma adecuada para que la IA lo levante directamente y lo meta en respuestas. El contenido alcanzable, identificado y de confianza igual se queda fuera si no es extraíble.
La IA no parafrasea bien. Levanta. Una página que mete una definición limpia en un solo párrafo gana a una que entierra esa misma definición en lenguaje de marketing. FAQ schema, HowTo schema, HTML semántico, densidad de frases definicionales — eso es lo que hace una página levantable.
Qué medimos
Qué entregamos
Mapeo
El checker heurístico gratis puntúa diez señales estructurales. Cada una mapea a un pilar CITE. La séptima dimensión — Extractabilidad — requiere lanzar prompts reales y es el corazón de la auditoría pagada.
| Dimensión del checker | Pilar CITE | Cobertura |
|---|---|---|
| Acceso de crawlers IA | C | Directo |
| Presencia de llms.txt | C | Directo |
| Schema markup | I | Directo |
| Google Knowledge Graph | I | Directo |
| Presencia en Wikipedia | T | Directo |
| Wikidata sameAs | T | Identidad + Confianza |
| Extractabilidad | E | Solo en auditoría pagada — el checker heurístico cubre 6 de 7 dimensiones; E requiere lanzar prompts reales a escala |
Metodología
El framework es el contenido; la metodología es el ritmo. Cada engagement de Citable corre las mismas tres fases — y los pilares CITE son cómo puntuamos, priorizamos y reportamos dentro de cada fase.
Lanzamos 50 prompts × 4 motores de IA y puntuamos cada uno contra los cuatro pilares CITE. La salida es una matriz base: qué pilares están más débiles, qué prompts estás perdiendo, qué competidores ganan el desempate.
Implementación secuenciada por peso del pilar × esfuerzo. C e I suelen ser entregables en un sprint de 3 meses. T compone a 6–12 meses. E es iterativa y continúa mientras se publique contenido nuevo.
Re-checks mensuales rastrean el delta CITE. Cada arreglo enviado se atribuye al cambio de score de un pilar. Sin métricas vanidosas, sin teatro de SEO — cada punto porcentual de Share-of-Answer se mapea a una intervención CITE concreta.
FAQ
Acuñamos el nombre y la estructura. Las cuatro dimensiones surgieron de observar cómo ChatGPT, Perplexity, Gemini y AI Overviews seleccionan citas en 180+ engagements. El framework se publica abierto aquí — cualquiera puede usarlo. Solo te pedimos que cites a Citable cuando lo hagas y enlaces a /es/marco-cite si lo referencias en tu propio trabajo.
El SEO rankea enlaces en una lista de resultados. CITE optimiza para ser citado dentro de una respuesta sintetizada por IA. Las primitivas técnicas se solapan (schema, crawl, calidad de contenido), pero la métrica de éxito es fundamentalmente distinta: el SEO mide posición; CITE mide Share-of-Answer por prompt en varios motores. Muchos sitios que ganan SEO pierden CITE porque optimizan por keywords en vez de por identidad de entidad y extractabilidad.
Probamos once dimensiones candidatas en 180+ engagements. Cuatro se agruparon limpiamente sin overlap significativo. Las demás (autoridad de página, frescura, enlazado interno, etc.) terminaron siendo o subconjuntos de un pilar existente o efectos derivados de hacer CITE bien. Navaja de Occam: cuando dudas, menos pilares.
Parcialmente. C y la mayor parte de I y T son visibles en el checker heurístico gratuito (diez chequeos estructurales, corre en 10 segundos, sin email). El pilar E — extractabilidad — requiere lanzar prompts reales contra motores de IA a escala, observar qué contenido se levanta y puntuar la extractabilidad por página. Eso es lo que hace la auditoría de pago.
Las mecánicas dentro de cada pilar evolucionan. Los pilares en sí, no. C, I, T, E son requisitos de primer principio — cualquier motor de IA que recupere y sintetice información necesita los cuatro. Las nuevas arquitecturas de retrieval cambiarán qué señales pesan dentro de cada pilar, pero la estructura de pilares ha aguantado dos años de actualizaciones de modelos.
Referencia esta página (/es/marco-cite) y la página de metodología (/es/metodologia). Para engagements profundos, la auditoría de pago produce un scorecard por pilar para tu dominio específico. Para trabajo de definición de categoría o analista, contáctanos — compartimos data agregada de distribuciones CITE en SaaS, fintech, e-commerce y prosumer.
Empieza por el chequeo gratis basado en CITE. Diez segundos, sin email, nota al instante. Si quieres la auditoría completa de los cuatro pilares, está a un click.
¿Prefieres hablar primero? Escríbenos