Ir al contenido
SealMetrics
Calidad del dato

Muestreo de datos en GA4: por qué tus números de tráfico están mal

7 min de lecturaPor Rafa Jiménez

Conclusiones clave

  • GA4 aplica muestreo en los reports de Exploración cuando los datos superan los umbrales internos — la versión gratis tiene umbrales más bajos que GA360.
  • El dato muestreado puede invertir los rankings de campañas: la Campaña A con 342 conversiones reales puede estimarse en 310 mientras que la Campaña B con 298 aparece como 320.
  • Antes incluso de empezar el muestreo, GA4 ya ha perdido ~87% del tráfico UE por rechazo de consentimiento, ad blockers y restricciones de navegador — estás decidiendo sobre una estimación de una fracción.
  • La analítica cookieless captura cada sesión sin muestreo — cuando ves 72.847 visitantes, son 72.847 sesiones reales, no una proyección.

Si tu sitio web recibe tráfico significativo, GA4 no te está mostrando todo. Te está mostrando una estimación estadística basada en una muestra. Esto se llama muestreo de datos, y es uno de los aspectos peor entendidos de Google Analytics.

¿Qué es el muestreo en GA4?

El muestreo ocurre cuando GA4 analiza un subconjunto de tus datos y extrapola los resultados para representar el dataset completo. En lugar de procesar cada evento, GA4 toma una muestra estadística y aplica modelos matemáticos para estimar cómo sería la foto completa.

En GA4, el muestreo se dispara cuando creas reports de exploración que superan ciertos umbrales de datos. Google no comunica públicamente los umbrales exactos, pero el icono de muestreo aparece en tus reports cuando está activo. La versión gratis de GA4 tiene umbrales más bajos que GA360, lo que significa que el muestreo se activa antes para la mayoría de los negocios.

Por qué el muestreo importa al decidir

El muestreo introduce un margen de error. Para tendencias de tráfico de alto nivel, puede ser aceptable. Pero para análisis específicos — performance de campaña por segmento, análisis de conversion path, atribución de revenue por creatividad — incluso márgenes pequeños se acumulan en conclusiones poco fiables.

Considera este escenario:

Tu data real muestra que la Campaña A generó 342 conversiones y la Campaña B 298. Tras el muestreo, GA4 estima la Campaña A en 310 y la B en 320. Aumentas presupuesto de la B.

La decisión se tomó sobre datos muestreados. La realidad era la contraria.

El muestreo es solo parte del problema

El muestreo reduce la precisión del dato que sí tienes. Pero el problema mayor es el dato que ni siquiera recoges. Antes de empezar el muestreo, GA4 ya ha perdido visitantes por rechazo en banners de consentimiento, ad blockers y restricciones de cookies del navegador.

En un sitio europeo típico, GA4 captura aproximadamente el 13% del tráfico real. De ese 13%, el muestreo degrada aún más la precisión. Estás decidiendo sobre una estimación de una fracción.

La alternativa: analítica a resolución completa

Las plataformas de analítica cookieless como SealMetrics tienen un enfoque fundamentalmente distinto. Al recoger datos por métodos cookieless first-party, cada sesión se captura independientemente del estado del banner, del ad blocker o de las restricciones del navegador. Y como el volumen de datos se gestiona a nivel de infraestructura, no hace falta muestreo estadístico.

Cuando ves 72.847 visitantes en SealMetrics, ese número representa 72.847 sesiones reales. No una muestra. No una estimación. No una proyección a partir del subconjunto que aceptó cookies.

Qué puedes hacer

Si usas GA4, revisa tus reports de exploración por el indicador de muestreo. Si lo ves, tu dato es aproximado. Para reports estándar, GA4 usa datos modelados (Google los llama “blended data”), lo que introduce su propia capa de estimación.

La forma más fiable de entender el gap es correr una herramienta de analítica completa en paralelo a GA4 y comparar los números. Puedes estimar tu pérdida de datos aquí o ver cómo funciona la analítica cookieless.