Capítulo 4

Inferencia Frecuentista

Inferencia Frecuentista determina las propiedades de una distribución usando observaciones de los datos.

Estimación Puntual

Uno de los objetivos principales de la estadística es estimar parámetros desconocidos. Para aproximar estos parámetros, se escoge un estimador, es decir, una función que depende de observaciones tomadas aleatoriamente.

Para entender esta idea, vamos a estimar el valor de \( \pi \) escogiendo aleatoriamente puntos distribuidos uniformemente en un cuadrado que contiene un círculo inscrito. Recuerda que el valor de \( \pi \) puede expresarse como la razón entre las áreas. $$\begin{matrix}S_{circle} = \pi r^2\\S_{square} = 4r^2\end{matrix} \implies \pi = 4 \frac{S_{circle}}{S_{square}}$$ Ahora, podemos estimar esta razón con los puntos que hemos escogido como muestra. Si \( m \) es el número de observaciones en el círculo y \( n \) el total de puntos escogidos en el cuadrado, definimos nuestro estimador \( \hat{\pi} \) como: $$\hat{\pi} = 4 \frac{m}{n}$$ Se puede demostrar que este estimador tiene dos propiedades deseables: insesgado (o centrado) y consistente.

\( m= \) 0.00
\( n= \) 0.00
\( \hat{\pi}= \)
Escoge 100 puntos
Escoge 1000 puntos

Intervalos de Confianza

A diferencia de los estimadores puntuales, los intervalos de confianza estiman un parámetro especificando un rango de posibles valores. Dicho intervalo está asociado con un nivel de confianza, que se define como la probabilidad que el procedimiento usado para generar el intervalo produzca un intervalo que contenga el parámetro verdadero.

Escoge una distribución de probabilidad para tomar una muestra.

Escoge un tamaño muestral \((n)\) y un nivel de confianza \((1-\alpha)\).


Empieza a muestrear para generar los intervalos de confianza.

Empieza muestreo

Esta visualización fue adaptada de una fantástica visualización hecha por Kristoffer Magnusson acerca de intervalos de confianza.

Bootstrap

Mucha de la inferencia frecuentista se centra en el uso de "buenos" estimadores. Sin embargo, la distribución precisa de estos estimadores usualmente puede ser difícil de encontrar analíticamente. El Bootstrap es una técnica computacional que proporciona una forma conveniente de estimar propiedades de un estimador usando remuestreo. En este ejemplo, vamos a remuestrear con remplazo de una distribución empírica (la cual fue generada a su vez tomando una muestra de la población) con el fin de estimar el error estándar de la media muestral.

Escoge una distribución de probabilidad de la cual tomaremos una muestra para generar la función de distribución empírica.

Escoge un tamaño de muestra (y remuestreo) \((n)\) y toma una muestra de la distribución que escogiste.

Muestra

Remuestrea para tener una idea de la extensión de la distribución de la media muestral.

Remuestrea
Remuestrea 100 veces