Inferencia Frecuentista determina las propiedades de una distribución usando observaciones de los datos.
Uno de los objetivos principales de la estadística es estimar parámetros desconocidos. Para aproximar estos parámetros, se escoge un estimador, es decir, una función que depende de observaciones tomadas aleatoriamente.
Para entender esta idea, vamos a estimar el valor de \( \pi \) escogiendo aleatoriamente puntos distribuidos uniformemente en un cuadrado que contiene un círculo inscrito. Recuerda que el valor de \( \pi \) puede expresarse como la razón entre las áreas. $$\begin{matrix}S_{circle} = \pi r^2\\S_{square} = 4r^2\end{matrix} \implies \pi = 4 \frac{S_{circle}}{S_{square}}$$ Ahora, podemos estimar esta razón con los puntos que hemos escogido como muestra. Si \( m \) es el número de observaciones en el círculo y \( n \) el total de puntos escogidos en el cuadrado, definimos nuestro estimador \( \hat{\pi} \) como: $$\hat{\pi} = 4 \frac{m}{n}$$ Se puede demostrar que este estimador tiene dos propiedades deseables: insesgado (o centrado) y consistente.
\( m= \) 0.00 \( n= \) 0.00 |
\( \hat{\pi}= \) |
A diferencia de los estimadores puntuales, los intervalos de confianza estiman un parámetro especificando un rango de posibles valores. Dicho intervalo está asociado con un nivel de confianza, que se define como la probabilidad que el procedimiento usado para generar el intervalo produzca un intervalo que contenga el parámetro verdadero.
Escoge una distribución de probabilidad para tomar una muestra.
Escoge un tamaño muestral \((n)\) y un nivel de confianza \((1-\alpha)\).
Empieza a muestrear para generar los intervalos de confianza.
Esta visualización fue adaptada de una fantástica visualización hecha por Kristoffer Magnusson acerca de intervalos de confianza.
Mucha de la inferencia frecuentista se centra en el uso de "buenos" estimadores. Sin embargo, la distribución precisa de estos estimadores usualmente puede ser difícil de encontrar analíticamente. El Bootstrap es una técnica computacional que proporciona una forma conveniente de estimar propiedades de un estimador usando remuestreo. En este ejemplo, vamos a remuestrear con remplazo de una distribución empírica (la cual fue generada a su vez tomando una muestra de la población) con el fin de estimar el error estándar de la media muestral.
Escoge una distribución de probabilidad de la cual tomaremos una muestra para generar la función de distribución empírica.
Escoge un tamaño de muestra (y remuestreo) \((n)\) y toma una muestra de la distribución que escogiste.
Remuestrea para tener una idea de la extensión de la distribución de la media muestral.