Enlace Local # 16

 

Estimación de parámetros 
 

1.- Introducción 
A la inferencia estadística le interesa sacar conclusiones de un gran número de acontecimientos (población), fundándose en las observaciones de una parte de los mismos (muestra). 
 

La estadística nos proporciona herramientas que formalizan y uniforman los procedimientos para sacar conclusiones siempre que las muestras seleccionadas sean representativas de la población que han sido extraídas. Esta representatividad permite extender los valores que describen a las muestras (estadísticos), tales como la media, la desviación típica, un coeficiente de correlación, a la población correspondiente, es decir, la media o la desviación típica (estadísticos) pueden tomarse como estimadores de los parámetros μ y σ, valores que caracterizan a la población. 
 

Los estadísticos, valores obtenidos en la muestra, son, pues, estimadores de los parámetros correspondientes (valores de la población) 
 

2.- Características de los estimadores. 
 

Conviene que los estadísticos, en su función de estimadores de los correspondientes parámetros, reúnan determinados requisitos. Fundamentalmente son: 
 

  1. CARENCIA DE SESGO. 
 
 
  1. CONSISTENCIA
 
 
  1. EFICIENCIA
 
   
 

ESTIMACIÓN POR INTERVALOS

 
 

Dos tipos de estimaciones: estimación puntual y estimación por intervalos 
 

Estimación puntual: Es aquella que considera un único valor como estimación del parámetro; es decir se usa un solo estadístico muestral para estimar el parámetro poblacional correspondiente. Ej.: Si se desea conocer el promedio de horas que los alumnos universitarios dedican a ver televisión se elige aleatoriamente una muestra y se calcula la media. Se supone que la muestra es representativa de la población y por lo tanto el valor calculado puede considerarse como una buena estimación del parámetro correspondiente. Tomamos un único valor como estimación de su correspondiente parámetro. 
 

La estimación puntual de un parámetro no es muy significativa si no se acompaña de alguna medida del error probable que se comete al realizar la estimación. Por ello las estimaciones suelen ser de intervalo. 
 

Estimación por intervalos: Hasta ahora hemos ofrecido un solo valor, un solo punto, como estimación del parámetro de que se trate. Por otra parte, no podíamos indicar la diferencia probable entre el parámetro y el estadístico, es decir el error probable cometido al estimar el parámetro. Lo único que podemos afirmar en la mayoría de los casos es que ese error tenderá a disminuir a medida que vaya aumentando el tamaño de la muestra mediante la cual intentamos estimar el parámetro. 
 

En la estimación por intervalos vamos a ofrecer una infinidad de valores, un intervalo de puntos, dentro del cual esperamos se encuentre el parámetro. Además indicaremos la probabilidad o confianza con la que esperamos se encuentre el parámetro dentro de dicho intervalo.  
 

Llamaremos "intervalo confidencial" al intervalo dentro del cual confiamos se encuentre el parámetro que va a ser estimado. 
 

Llamaremos "nivel de confianza" a la probabilidad o grado de confianza según el cual afirmaremos que el parámetro se encuentra dentro del mismo. A veces, este nivel de confianza o probabilidad confidencial suele venir multiplicado por 100. Así, se suele hablar de nivel de confianza del 95% en vez de p=0.95. 
 

A veces también, en vez de utilizar el nivel de probabilidad, por ej. 0.95, se suele expresar el margen de riesgo al hacer la estimación, α=0.05, que quiere decir que admitimos un margen de riesgo del 5% de que el parámetro no se encuentre dentro del intervalo confidencial. 
 

Llamaremos "límites confidenciales" a los dos extremos (inferior y superior) del intervalo confidencial. 
 

Para ilustrar la estimación del intervalo, refirámonos a la media como estimación de μ. Sabemos que si se escogen aleatoriamente muestras de tamaño n a partir de una población con media μ y varianza σ2, la distribución muestral de la media tendrá también una media μ y una varianza σ2/N y si n es lo suficientemente grande, la distribución es normal. 
 

La desviación típica de esta distribución muestral, o sea el error típico de la media es . Si esto es así, el 68% de las observaciones se hallarán dentro del intervalo y . Aproximadamente el 95% de las estará dentro del intervalo y , puesto que aproximadamente el 95% del área bajo la curva normal se halla dentro de dos desviaciones típicas respecto a la . Mediante la tabla de áreas de la distribución normal podemos determinar exactamente cuantas desviaciones típicas debemos alejarnos en cualquier dirección de la para establecer intervalos que incluyan el 70%, 90%, 95%, 99% o cualquier otro porcentaje bajo la curva. 
 

1º) de la población normalmente distribuida, siendo σ2 conocida. 
 

Sabemos por lo que se vio al hablar de distribuciones muestrales que la distribución muestral de la media, calculada a partir de todas las muestras posibles de tamaño n que se puede recoger de una población N, está normalmente distribuida y tiene una media y una varianza σ2/N. 
 

Resumen:

  1. Sacamos de la población una muestra de tamaño N
  2. Calculamos la y
  3. Seleccionamos un nivel de confianza determinado al que pretendemos hacer la estimación α=0.01, 0.05, ...., etc.
  4. De acuerdo con ese nivel de confianza buscamos el valor de zi en la tabla de áreas de la distribución normal entrando en ella con .
  5. Construimos el intervalo de confianza, sumando y restando a la el valor de , error muestral máximo para α=0.01, 0.05, ...., etc.
 
 
 
 

Algunos ejemplos de intervalos de confianza 
 

  1. Intervalo de confianza para la media de una población normal y varianza de la población conocida.
 
 

Supongamos que la σ2 de la población de alumnos de 1º ESO en velocidad lectora es de 64 puntos. Seleccionamos al azar una muestra de 144 sujetos y obtenemos una media aritmética de 75 palabras. Se desea establecer el intervalo de confianza para la con un nivel de confianza del 99%.  
 

En toda estimación por intervalo se tiene un estadístico (valor calculado en la muestra) o estimador al que hay que sumar y restar el valor de su error muestral máximo al nivel de confianza establecido. 
 

Siguiendo los pasos expresados anteriormente tenemos

 
   

76.7286

 
 
 

α= 0.01

μ=75±2.58*0.67

3.4572

 
 

1.7286

73.2714

 
 
 

Lo que significa que tenemos un 99% de confianza de que la media de la población no sea menor que 73.2714 ni mayor que 76.7286, o que esté entre estos dos valores extremos. 
 

   

76.31

 
 
 

α= 0.05

μ=75±1.96*0.67

2.62

 
 

1.31

73.69

 
 
 

Lo que significa que tenemos un 95% de confianza de que la media de la población no sea menor que 73.69 ni mayor que 76.31, o que esté entre estos dos valores extremos. 
 

  1. Intervalo de confianza para la media de una población normal con desviación típica de la población desconocida.
 
 

Pueden darse dos casos, según el número de elementos de la muestra:

¬ Si N es grande (≥30) se procede como en el caso anterior, tomando en el por numerador la desviación típica de la muestra ya que la es desconocida.

­ Si N es pequeño (>30) el procedimiento general es el mismo, excepto en dos detalles. Uno es que la desviación típica de la muestra es un estimador sesgado de la desviación típica de la población, y para evitar este sesgo el error de la media es . Otro es que distribución muestral sigue el modelo teórico de la t de Student con g. l. = N-1; en vez de buscar en la tabla de áreas el punto crítico para calcular el error muestral máximo, habrá que encontrarlo en la tabla "t" de Student para α/2 y g.l.=N-1, llamándose "t" en vez de zi.  
 

Por ejemplo: 
 

Se sabe que la variable “número de palabras correctamente escritas del vocabulario fundamental de 1º ESO” se distribuye normalmente. Seleccionada una muestra de 20 alumnos se encontró una media de 45 y una desviación típica de 8. Determina el intervalo confidencial para la media aritmética con α= 0.01.

Ê Como n es menor que 30, el error de la media será

 

Ë Trabajamos con α= 0.01 y al estimar el parámetro habrá que tomar α/2.

Ì Para α/2; 0.01/2=0.005; entrando en la tabla de valores "t" encontramos un valor de 2,861. Este valor aparece mirando en la primera columna de la tabla (g.l.) que en nuestra caso es N-1; 20-1=19 y para un nivel de significación de dos colas, (0.01). En la intersección de columna y fila aparece el valor 2,861; t=2.861 es el valor equivalente a la zi anterior.

Í Construimos el intervalo de confianza, que será en este caso:  
 

   

50.24

 
 
 

μ=45±2.861*1.83

   
   

39.76

 
 
 

Se tiene la confianza del 99% de que la media de la población de alumnos de 1º ESO en esa variable no sea ni inferior a 39.76 ni superior a 50.23, o que está entre estos dos valores extremos. 
 

De la misma manera se puede estimar cualquier parámetro ya que lo único que necesitamos es el valor del estadístico calculado en la muestra y el error típico de ese estadístico.

Errores típicos de algunos estadísticos

 
 

Error típico de la media: 
 

donde σ = desviación típica de la población. Si no se conoce se toma la (Sx) de la muestra y N= número de elementos de la muestra.  
 

Si el número de elementos de la muestra es pequeño, la Sx de una muestra es un estimador sesgado de la desviación típica de la población. En este caso el error de la media viene dado por en donde el denominador N-1 corrige el sesgo de la desviación típica que figura en el numerador 
 

Error típico de la mediana: 
 

Viene dado por  
 

Error típico de la desviación típica: 
 
 
 

Error típico de una proporción o porcentaje: 
 

Proporción

Porcentaje

, p y q son las proporciones

, P y Q son los porcentajes

 

 

 

Pagina_principal_ii

Hosted by www.Geocities.ws

1