Estadísticas: datos originales y “toqueteados”
Todos los días mi esposa y yo nos besamos. ¿Nos queremos más en los marzos que en los febreros? En la Argentina un heladero vende mayor cantidad en enero que en junio de cada año. ¿Es este último dato un indicador de recesión económica? El Día de la Madre el precio de las flores aumenta considerablemente. ¿Volvió la inflación? Estos ejemplos muestran que no siempre los datos deben ser analizados en su formato original, aunque la transformación no es una operación mecánica, sino que debe ponerse al servicio de la pregunta que se quiere contestar.
Al respecto, consulté al ruso Andrey Nikolaevich Kolmogorov (1903-1987), quien estudió en la Universidad de Moscú. Cuando en 1929 completó su doctorado, ya había publicado 18 trabajos, incluyendo la ley fuerte de los grandes números. Luego de visitar Francia y Alemania, dictó clases en su alma mater. Los domingos paseaba con estudiantes, fueran o no sus alumnos, para discutir los problemas matemáticos entonces en boga.
–A usted se lo conoce por la formulación de la ley de los grandes números, que no es lo mismo que la ley de los números grandes. ¿De qué se trata?
–La referida ley describe el comportamiento del promedio de una sucesión de variables aleatorias cuando aumenta el número total de variables. El teorema describe hipótesis suficientes para afirmar que ese promedio converge al promedio de las esperanzas de las variables aleatorias involucradas. La ley de los grandes números implica que el promedio de una muestra al azar de una población de gran tamaño tenderá a estar cerca de la media de la población completa. Hay que distinguir entre una ley débil y una ley fuerte de los grandes números. Se la considera el primer teorema fundamental de la teoría de las probabilidades
–Soy un usuario intuitivo de esa ley. Dentro de unos días, el FMI actualizará sus estimaciones macroeconómicas de los países miembros, de las cuales solo le presto atención al PBI mundial.
–Bien hecho, porque como en algunos países el pronóstico pifiará por exceso, y en otros por defecto, el pronóstico del agregado es más confiable que el de cada uno de sus componentes.
–Daniel Kahneman habló de la ley de los pequeños números.
–Usó la ironía, para enfatizar que los seres humanos, al adoptar muchas decisiones, ignoramos el bosque y nos dejamos llevar por un árbol o, peor aún, por una hojita.
–Los datos estadísticos a veces se pueden utilizar como son publicados, pero en otras ocasiones es preferible transformarlos.
–Pensemos en un uso profesional de la información, no del politizado. Un análisis profesional pone la información al servicio de la pregunta que se quiere contestar. Ejemplo: en la Argentina 2024 tiene particular interés saber cuándo fue que la actividad económica dejó de caer y comenzó a recuperarse. Y para ello los datos originales sirven de poco.
–¿Qué hizo la profesión al respecto?
–Intentó descomponer las series de tiempo en cuatro partes: tendencia, ciclo, estacionalidad y aleatoriedad. Cuando se busca averiguar cuándo fue que en la Argentina de 2024 la actividad dejó de caer y comenzó a reactivarse, la desestacionalización de las series originales es mucho mejor que la comparación, basada tanto en las series originales como entre lo que ocurrió en un período durante el año en curso e igual período del año anterior.
–¿Quién hace ese trabajo?
–El Indec, tanto en el EMAE como en la estimación de la producción industrial y de la construcción, así como FIEL, en el caso de la producción industrial.
–Buenísimo, ¿algún problema?
–Que las técnicas de desestacionalización no son perfectas. Cuando usted estudió en la UCA y en Harvard, la desestacionalización era algo burda. De la variable a desestacionalizar se tomaba el promedio de los eneros, los febreros, etcétera, de los últimos, digamos, 10 años. Supongamos que en determinada variable el valor de enero duplicaba el del resto de los meses. Entonces el último dato de enero se dividía por dos y, si superaba el promedio, ello indicaba una mejora cíclica.
–Algo burdo.
–También lo fueron los primeros modelos de autos, computadoras personales, etcétera. Hoy, las técnicas de desestacionalización han mejorado. Por ejemplo, tienen en cuenta si los desvíos frente a los promedios ocurrieron en años recientes o en años anteriores; diferencia fundamental, porque lo que queremos es entender lo que ocurre en la actualidad, pensando en lo que puede ocurrir. La estacionalidad de una serie en la época de la Revolución de Mayo no tiene la misma importancia que la verificada desde el Covid-19 para acá.
–¿Cómo utilizar las series desestacionalizadas?
–Con cuidado. Por empezar, no hagamos una teoría de los decimales, porque todas las estimaciones económicas están sujetas a problemas conceptuales y prácticos. Más importante todavía, las técnicas de desestacionalización generan resultados más confiables en el centro del período sobre el cual se basan los cálculos, y menos confiables en las puntas. Particularmente en la final, que desde el punto de vista del análisis es la que más interesa.
–Esto en cuanto a la desestacionalización. ¿Qué me dice de la anualización de las estimaciones mensuales o trimestrales?
–Que brindan la misma información que el velocímetro del auto. Cuando el indicador está ubicado en “80″, significa a qué distancia estaré si durante una hora mantengo la velocidad a la que estoy llevando el auto en este momento.
–¿No indica el trayecto que recorreré durante los próximos 60 minutos?
–Claro que no. Ejemplo: puedo parar para almorzar, en cuyo caso en la siguiente hora no recorreré ni un solo kilómetro. No conozco a nadie que piense que el velocímetro del auto es defectuoso porque no pronostica lo que voy a hacer en la próxima hora. Ahora voy a aplicar esto a economía.
–Lo escucho.
–Cuando alguien dice que entre julio y agosto pasados en promedio los precios al consumidor aumentaron 62% equivalente anual, está tomando el aumento observado entre los dos meses citados, elevándolo a la potencia 12, restándole 1 y multiplicando el resultado por 100. De la misma manera que cuando alguien dice que el PBI real cayó X% anualizado, entre el primer y el segundo trimestre de 2024, está tomando la caída observada entre los dos trimestres citados, elevándola a la potencia cuatro.
–¿Para qué sirven estos cálculos?
–Fuera del uso politizado, sirven para realizar comparaciones. ¿Cuál PBI aumentó a mayor ritmo, el de China si durante los últimos cuatro años creció X%, o el de la India, si durante los últimos ocho años aumentó Y%? A simple vista es difícil saber, la equivalencia anual de ambas estimaciones ayuda; sabiendo que ese cálculo no refleja la realidad, porque nadie sabe qué pasó con el PBI de China durante los cuatro años restantes.
–Don Andrey, muchas gracias.