Para volver al menú principal pulse sobre la palabra

Estimación por intervalo.


Esquema

1. El intervalo de confianza para m, cuando se muestrea una distribución normal con varianza conocida
2. Intervalo de confianza para m cuando se muestrea una distribución normal de varianza desconocida.
3. Intervalos de confianza para la diferencia de medias cuando se muestrean dos distribuciones normales independientes.
4. Intervalo de confianza para s2 cuando se muestrea una distribución normal con media desconocida.
5. Intervalos de confianza para el cociente de dos varianzas cuando se muestrean dos distribuciones normales independientes.
6. Intervalos de confianza para el parámetro de proporción p cuando se muestrea una distribución binomial.

Pongamos un ejemplo para introducir el concepto de estimación por intervalo.

Una compañía decide que los últimos 36 meses han sido típicos en relación a la demanda de un producto, con base en los datos muestrales el valor calculado para la media muestral es de:

En otras palabras 200 es un valor estimado puntual de un parámetro desconocido, el cual representa la demanda promedio de este producto por la compañía. Este estimador, ¿implica que la demanda promedio desconocida no sea mayor de 250 ni menor de 150?. Esto no es posible saberlo, ya que no se tiene ninguna indicación del posible error en el estimado puntual.

Supóngase que la desviación estándar de la media muestral es 60. De acuerdo con el teorema central del límite

De esta forma la probabilidad de que

lo que equivale a que

Dado que  es una variable aleatoria, el intervalo

es un intervalo aleatorio y la probabilidad de que dicho intervalo contenga al verdadero valor de m, es de 0,95. En otras palabras si se obtienen muestras repetidas de la misma población y del mismo tamaño y se calculan los valores específicos para dicho intervalo; entonces debe esperarse que en un 95% de los casos estos intervalos contengan al valor de la media desconocida m.

Por otro lado, para los datos obtenidos de una sola muestra

sería incorrecto decir que la probabilidad de que m se encuentre en el intervalo

es de 0,95. Sin embargo, la probabilidad de 0,95 para el intervalo aleatorio sugiere que la confianza en que el intervalo (80, 320) contenga el valor de la media desconocida m es alta. Sólo en este sentido se permite asignar un grado de confianza a la proposición m se encuentra en el intervalo  (80, 320) igual a la probabilidad del intervalo aleatorio

Así cuando se escribe

no se está formulando ninguna proposición probabilística en sentido clásico, sino más bien un grado de confianza.

En general, la construcción de un intervalo de confianza para el parámetro desconocido q consiste en encontrar un estadístico suficiente T y relacionarlo con otra variable aleatoria X=f(T;q), en donde X involucra a q pero la distribución de X no contiene a q, así como tampoco a ningún otro parámetro desconocido. Entonces se seleccionan dos  valores x1 y x2 tales que:

en donde 1-a recibe el nombre de coeficiente de confianza. Mediante cálculo algebraico se puede modificar el contenido entre paréntesis y expresarlo:

El intervalo de confianza de q se obtiene sustituyendo en h1(T) y h2(T) los estimadores calculados a partir de la muestra, dando lugar a lo que se llama intervalos de confianza bilaterales. Al seguirse el mismo procedimiento pueden calcularse los intervalos de confianza unilaterales.

Intervalos de confianza para m cuando se muestrea una distribución normal con varianza conocida.

El intervalo de confianza se calcula en base al mejor estimador de m, la media muestral .

Por tanto,

de manera que

y

en donde f es la función de densidad de la distribución de muestreo  de .

Dado que

y por tanto

sigue una normal N(0; 1) se sigue:

Pero

se sigue que

Despejando g1(m) y g2(m) se obtiene:

Teniendo en cuenta que Z a/2 es igual a  –Z1-a/2 el intervalo queda de la forma:

Al manipular las desigualdades de dentro del paréntesis, se tiene:

Si se reemplaza la variable aleatoria por los datos calculados a partir de una muestra de tamaño n, un intervalo de confianza del 100(1-a)% para m, es:

Tamaño de la muestra. Supóngase, en las mismas condiciones de este ejercicio, que deseamos estimar el tamaño de la muestra de manera que, con una probabilidad de 1-a, la media muestral  se encuentre a una distancia inferior a e unidades de la media poblacional m. De la expresión:

se obtiene

al resolver para n se obtiene:

Una objeción muy severa a esta formula es que se requiere el conocimiento de la varianza poblacional s2. Si este no se conoce, una estimación muy burda para la desviación típica es igual a la sexta parte del recorrido de las observaciones, ya que para distribuciones unimodales la gran mayoría de las observaciones se encuentran a una distancia de 3 desviaciones estándar de la media.

[Volver al principio]  

Intervalo de confianza para m cuando se muestrea una distribución normal de varianza desconocida.

Cuando se muestrea una población normal N(m,s) , el estadístico

sigue una t-Student con n-1 grados de libertad, donde

Por lo tanto es posible determinar el cuantil t1-a/2, n-1 de T, para el cual

Al sustituir T por su valor se obtiene

de donde

La probabilidad de que este intervalo aleatorio contenga a la media poblacional es de 1-a.

Para una muestra particular de tamaño n, a partir de los valores estimados de  y de s2, un intervalo de confianza del 100(1-a)% para m es:

[Volver al principio]  

Intervalos de confianza para la diferencia de medias cuando se muestrean dos distribuciones normales independientes.

Sean X1, X2, …, XnX  e  Y1, Y2, …, Yny dos muestras aleatorias de dos distribuciones normales independientes.

Si suponemos que las varianzas poblacionales son distintas pero conocidas, entonces se tiene:

De donde

y por tanto

De esta forma es posible encontrar el cuantil Z1-a/2, tal que:

Sustituyendo Z por su valor y operando

 

Un intervalo de confianza para una muestra particular de tamaño n, viene dado por:

Para el caso en el que el muestreo se lleve a cabo sobre dos poblaciones normales independientes con varianzas iguales pero desconocidas

donde

sigue una t-Student con nX + nY –2 grados de libertad.

Un intervalo de confianza, para una muestra partícula al 100(1-a)% viene dado por:

Donde sp es el valor obtenido para la muestra particular de Sp.

 

En el supuesto de que s2X y s2Y sean desconocidas y distintas y haya que estimarlas a partir de S2X y S2Y el problema se complica, en tal caso se tiene:

 

 

sigue una distribución t-Student con f grados de libertad, en donde f es la aproximación de Welch:

expresado en número entero.

[Volver al principio]  

Intervalo de confianza para s2 cuando se muestrea una distribución normal con media desconocida

La inferencias con respecto a la varianza s2 cuando se muestrea una población normal se formula con base a

Entonces es posible determinar los valores cuantiles

tales que:

y de aquí

 

Con base en los datos de una muestra se pude calcular un intervalo de confianza al 100(1-a)%

[Volver al principio]  

Intervalos de confianza para el cociente de dos varianzas cuando se muestrean dos distribuciones normales independientes.

Sean X1, X2, …., Xnx variables aleatorias independientes N(mX, sX)

Sean Y1, Y2, …, Yny variables aleatorias independientes N( mY, sY)

Si X e Y son independientes

Es decir, el cociente sigue una F con nX-1, nY-1 grados de libertad.

Entonces puede escribirse:

donde a y b son los valores cuantiles

 

La probabilidad se puede expresar así:

De esta manera un intervalo de confianza del 100(1-a)% para sY2/sX2 está dado por

[Volver al principio]  

Intervalos de confianza para el parámetro de proporción p cuando se muestrea una distribución binomial.

Puede demostrarse que el estimador de máxima verosimilitud del parámetro p, denotado por

donde X es binomial con parámetro n y p. Nótese que s u  estimador insesgado de p, ya que

La varianza viene dada por:

Recuérdese que para n grande, la variable aleatoria

entonces puede demostrarse que la distribución de

De esta forma, la probabilidad

Para una muestra particular de tamaño n, un intervalo de confianza al 100(1-a)% viene dado por

donde el estimador de  se obtiene de la muestra:

Tamaño de muestra: Con respecto al muestreo de una distribución binomial, un problema que surge de forma frecuente, es el estimar el tamaño de la muestra necesario para que con una confiabilidad del 100(1-a)% el estimado del parámetro de proporción se encuentre a no más de e unidades de p. Es decir

de donde se sigue que

Despejando

Se ha obtenido n en función de p, el parámetro que se desea estimar. Dado que este no se conoce de antemano, lo que de manera generalizada se hace es escoger el valor más conservador de n. Esto ocurre cuando la cantidad p(1-p) es máxima, es decir cuando p=1/2.

[Volver al principio]  

Hosted by www.Geocities.ws

1