Muestreo
Yandex Metrica genera informes utilizando datos detallados de sesiones y usuarios. Calcular indicadores para grandes volúmenes de datos puede requerir una cantidad considerable de tiempo y recursos. Por esta razón, Yandex Metrica puede usar solo una parte de los datos disponibles para sus informes, lo que se conoce como muestreo. De esta manera, Yandex Metrica puede mantener una alta velocidad de generación de informes.
¿Qué es el muestreo?
El muestreo es un método estadístico utilizado en el procesamiento de datos donde se obtienen observaciones generales sobre todos los datos a partir de su subconjunto, conocido como muestra.
Supongamos que hablamos sobre visitas directas al sitio. Podemos contar cuántas se produjeron en 1/10 de todas las sesiones y luego multiplicar el resultado pode 10 para obtener la cantidad aproximada de visitas directas. De esta manera, se obtendrá la respuesta 10 veces más rápido, pero la respuesta será aproximada.
Más información sobre el muestreo
Mecanismo de muestreo de Yandex Metrica
El algoritmo de muestreo selecciona datos de manera uniforme a través de la audiencia del sitio web, asegurando que el informe muestreado mantenga las mismas correlaciones y distribuciones de atributos que el informe completo.
Nota
- El muestreo se utiliza solo al crear informes analíticos en Yandex Metrica. Los datos originales no se eliminan ni se alteran.
- El muestreo no se aplica en los informes del grupo “Yandex Direct” en Yandex Metrica.
- Los segmentos de audiencia se crean y guardan utilizando el 100 % de los datos en el informe.
- Los datos completos se muestran en los informes de Yandex Direct.
- El muestreo no afecta el rendimiento de los anuncios.
¿Cuándo se puede aplicar el muestreo en Yandex Metrica?
El muestreo se puede aplicar al generar informes tanto en la interfaz web como en la API.
Yandex Metrica puede aplicar muestreo cuando la muestra de la solicitud original excede 500,000 sesiones (o 2 millones de vistas en los informes correspondientes). La proporción de muestreo se determina dinámicamente para asegurar que el informe incluya la máxima cantidad de datos, lo que depende de los recursos computacionales requeridos.
Cómo controlar el muestreo
Puede ajustar el nivel de muestreo de sus informes usando Muestra.
Si aumenta el tamaño de la muestra, el informe puede tardar más en generarse o puede que no se genere en absoluto. Para asegurar que sus informes se puedan cargar, Yandex Metrica puede limitar los aumentos manuales del tamaño de la muestra si los datos sin procesar contienen más de 500 000 sesiones.
Nota
Esta restricción entra en vigor a partir de septiembre de 2023.
Cómo obtener informes para el 100 % de sus datos
Reducir el período del informe
-
El muestreo se aplica automáticamente cuando se excede el límite en la cantidad de datos sin procesar en la solicitud. Puede ajustar la solicitud para incluir no más de 500 000 sesiones reduciendo el período del informe.
Por ejemplo, si su sitio web tiene un tráfico mensual de aproximadamente 100 000 sesiones, las proporciones de muestreo para diferentes períodos de informe serán las siguientes:
Período del informe
Total de sesiones en la muestra original
Porcentaje de datos utilizados para generar el informe
Un mes
100.000
100 %
Cinco meses
500.000
100 %
Seis meses
600.000
83.3 %
Doce meses
1200000
41.7 %
Conviértase en un asociado de la Red de Publicidad de Yandex
- La capacidad de generar cualquier informe basado en datos al 100 % está disponible para socios de YAN si el volumen de impresiones visibles asciende consistentemente a al menos 10 millones por mes.