Capítulo 3

Distribuciones de Probabilidad

Una distribución de probabilidad determina la factibilidad de cada uno de los posibles resultados de un experimento.

Variables Aleatorias

Formalmente, una variable aleatoria es una función que asigna un número real a cada evento en el espacio de probabilidad. En esta actividad definirás tu propia variable aleatoria en el espacio de probabilidad que se encuentra a tu derecha, donde cada casilla tiene la misma probabilidad de ocurrencia. Luego generarás una muestra para encontrar su distribución empírica.

Para seleccionar casillas en el espacio de probabilidad a tu derecha, puedes dar clic y arrastrar con el mouse. Una vez seleccionadas, puedes escoger en el menú de abajo un número real y presionar "Enviar".

Color Valor
0

Genera una muestra del espacio de probabilidad para producir la distribución empírica de tu variable aleatoria.

Genera una muestra
Reiniciar

Discretas y Continuas

Hay dos tipos de distribuciones de probabilidad

Una variable aleatoria discreta tiene un número finito o contable de posibles valores.

Si \( X \) es una variable aleatoria discreta, entonces existe un único par de funciones no negativas, \( f(x) \) y \( F(x) \), tal que lo siguiente se cumple:

$$\begin{align*}P(X = x) &= f(x)\\P(X < x) &= F(x)\end{align*}$$

Aquí encontraras algunas de las principales distribuciones discretas. Escoge una para visualizarla. La función de masa de probabilidad \( f(x) \) aparece en amarillo y la función de distribución acumulada \( F(x) \) en naranja (y la puedes controlar deslizando el círculo naranja).


Una variable aleatoria Bernoulli toma el valor de 1 con probabilidad \(p\) y el valor de 0 con probabilidad de \(1-p\). Con frecuencia se usa para representar experimentos binarios, como el lanzamiento de una moneda.

Una variable aleatoria binomial es la suma de \(n\) variables aleatorias Bernoulli independientes con parámetro \(p\). Con frecuencia se usa para modelar el número de aciertos en un número específico de experimentos binarios idénticos, como el número de sellos luego de lanzar una moneda cinco veces.

Una variable aleatoria binomial negativa cuenta el número de aciertos en una secuencia de experimentos Bernoulli independientes con parámetro \(p\) antes de que ocurran \(r\) fallas. Por ejemplo, esta distribución puede ser usada para modelar el número de sellos que salen al lanzar una moneda antes de obtener tres caras.

Una variable aleatoria geométrica cuenta el número de intentos necesarios para observar el primer acierto, donde cada intento es Bernoulli independiente y tiene una probabilidad de acierto de \(p\). Por ejemplo, esta distribución se usa para modelar el número de veces que se debe lanzar un dado para obtener un seis.

Una distribución Poisson cuenta el número de eventos que ocurren en un intervalo fijo de tiempo o espacio, dado que dichos eventos ocurren con una tasa promerio \(\lambda\). Esta distribución se usa para modelar lluvias de meteoros y goles en un partido de fútbol.

La distribución uniforme es una distribución continua tal que todos los intervalos que tienen el mismo tamaño dentro del soporte de la distribución comparten la misma probabilidad. Por ejemplo, esta distribución puede modelar el tiempo de nacimiento de un grupo de personas, donde asumimos que todo momento en el año calendario es igualmente probable.

La distribución normal (o Gaussiana) tiene una función de densidad en forma de campana y se usa en las ciencias para representar variables aleatorias que pertenecen a los números reales asumiendo que son producidas por la combinación de muchísimos efectos pequeños. Por ejemplo la distribución normal puede modelar la altura de las personas, dado que podemos asumir que la altura es el resultado de muchísimos factores genéticos y ambientales.

La distribución t de Student aparece cuando estimamos la media de una población con distribución Normal en situcaciones donde el tamaño de la muestra es pequeño y la desviación estándar de la población es desconocida.

Una variable aleatoria chi cuadrada con (\k\) grados de libertad es la suma de \(k\) variables aleatorias normales estándar al cuadrado independientes e idénticamente distribuidas. Usualmente se encuentra en pruebas de hipótesisy en la construcción de intervalos de confianza.

La distribución exponencial es el análogo continuo de la distribución geométrica. Usualmente se usa para modelar tiempos de espera.

La distribución F, tambien conocida como la distribución de Fisher–Snedecor, aparece usualmente como la distribución de la hipótesis nula de un test estadístico, principalmente en el análisis de varianza.

La distribución Gamma es una familia de distribuciones de probabilidad continuas. Las distribuciones exponencial y chi cuadrada son casos especiales de la distribución gamma.

La distribución beta es una familia de distribuciones de probabilidad continuas acotadas entre 0 y 1. La distribución beta es usada frecuentemente como una distribución prior conjugada en estadística bayesiana










Teorema de Límite Central

El Teorema del Límite Central (TLC) dice que la media muestral de un número suficientemente largo de variables aleatorias independientes idénticamente distribuidas (i.i.d.) tiene aproximadamente una distribución normal; y dicha aproximación mejora a medida que crece el tamaño de la muestra.

Cambia los parámetros \(\alpha\) y \(\beta\) para determinar la distribución que quieres muestrear.


Escoge el tamaño de la muestra y el número de promedios muestrales a extraer de ella, luego presiona "Muestreo". También puedes seleccionar la casilla para ver la distribución real de la media muestral.


Muestreo

Esta visualización fue adaptada de la magnífica visualización realizada por Philipp Plewa sobre el teorema del límite central.