Enlace Local # 16

Estimación de parámetros

1.- Introducción
A la inferencia estadística le interesa sacar conclusiones de un gran número de acontecimientos (población), fundándose en las observaciones de una parte de los mismos (muestra).

La estadística nos proporciona herramientas que formalizan y uniforman los procedimientos para sacar conclusiones siempre que las muestras seleccionadas sean representativas de la población que han sido extraídas. Esta representatividad permite extender los valores que describen a las muestras (estadísticos), tales como la media, la desviación típica, un coeficiente de correlación, a la población correspondiente, es decir, la media o la desviación típica (estadísticos) pueden tomarse como estimadores de los parámetros μ y σ, valores que caracterizan a la población.

Los estadísticos, valores obtenidos en la muestra, son, pues, estimadores de los parámetros correspondientes (valores de la población)

2.- Características de los estimadores.

Conviene que los estadísticos, en su función de estimadores de los correspondientes parámetros, reúnan determinados requisitos. Fundamentalmente son:

CARENCIA DE SESGO.

Un estimador (estadístico) carece de sesgo si el promedio (media) de todos los valores posibles de todas las muestras posibles de tamaño n de una población es igual al parámetro, es decir, si la media de la distribución muestral del estadístico considerado es igual al valor del parámetro. Así, la media es un estimador insesgado de μ porque se puede demostrar que la media aritmética de una distribución muestral coincide con el valor del parámetro, algo que no puede decirse de r, por ejemplo, o de la varianza (s2) o de la mediana de una población no distribuida normalmente.

CONSISTENCIA

Un estimador es consistente en la medida en que, al aumentar el tamaño de la muestra, - n - su valor se acerca cada vez más al parámetro correspondiente o lo que es lo mismo, si a medida que aumenta el tamaño de la muestra, las estimaciones que ésta proporciona son cada vez más próximas al valor del parámetro.

Algunos estimadores sesgados son consistentes, acercándose cada vez más sus valores a los de sus respectivos parámetros a medida que el tamaño de la muestra (n) aumenta, tal es el caso de s o s2 que son estimadores sesgados pero consistentes de la desviación típica (σ) o de la varianza (σ2) de la población.

EFICIENCIA

La 3ª propiedad de los estimadores es su eficiencia, que se refiere a la precisión que alcanzan los estadísticos en la estimación de los parámetros, es decir, un estimador será tanto más eficiente cuanto menos varíe de muestra a muestra de una misma población. Como la variabilidad de una distribución muestral viene dada por su error típico, un buen estimador será aquel que menor error típico alcanza. Así, entre la media y la mediana, la primera es claramente más eficiente. La varianza de la distribución muestral de la mediana es mayor que la de la media, lo que significa que la mediana fluctúa más que la media en muestras sucesivas de la misma población.

En una población normal, la varianza de la distribución muestral de la media es de σ2/n y la varianza de la distribución muestral de la mediana es de 1.57xσ2/n. Si comparamos la eficiencia de la media respecto de la mediana dividiendo las varianzas de las distribuciones muestrales respectivas, se aprecia la superioridad de la media en grado de eficiencia.

Eficiencia relativa =

Indicando con esto que para medidas normalmente distribuidas, independientemente de la magnitud de n, la mediana es aproximadamente 2/3 menos eficiente que la media (Véase Siegel, Cap. 3). Es decir que si se emplea una muestra de 100 casos y se utiliza la Me como estimador de μ, puede obtenerse el mismo valor de estimación calculando la media de 64 observaciones.

En general, para escoger un óptimo estimador de un parámetro, deben combinarse los criterios de no tendenciosidad (carencia de sesgo) y de eficiencia. Ante dos estimadores insesgados del mismo parámetro, se preferirá aquel que tenga mayor eficiencia, es decir, que tenga el mínimo error en términos de varianza.

Estimadores insesgados: Media, Mediana, Moda, sx (distribución normal n → ¥), rxy=0,

Estimadores sesgados: , sx, rxy¹0

Estimadores consistentes: Proporciones,

Estimadores insesgados y eficientes: μ y σ2

Estimadores insesgados y no eficientes: Me muestral y [son estimadores insesgados de μ]

Estimadores sesgados y no eficientes: σ y desviación típica modificada () y rango semiintercuartílico

ESTIMACIÓN POR INTERVALOS

Dos tipos de estimaciones: estimación puntual y estimación por intervalos

Estimación puntual: Es aquella que considera un único valor como estimación del parámetro; es decir se usa un solo estadístico muestral para estimar el parámetro poblacional correspondiente. Ej.: Si se desea conocer el promedio de horas que los alumnos universitarios dedican a ver televisión se elige aleatoriamente una muestra y se calcula la media. Se supone que la muestra es representativa de la población y por lo tanto el valor calculado puede considerarse como una buena estimación del parámetro correspondiente. Tomamos un único valor como estimación de su correspondiente parámetro.

La estimación puntual de un parámetro no es muy significativa si no se acompaña de alguna medida del error probable que se comete al realizar la estimación. Por ello las estimaciones suelen ser de intervalo.

Estimación por intervalos: Hasta ahora hemos ofrecido un solo valor, un solo punto, como estimación del parámetro de que se trate. Por otra parte, no podíamos indicar la diferencia probable entre el parámetro y el estadístico, es decir el error probable cometido al estimar el parámetro. Lo único que podemos afirmar en la mayoría de los casos es que ese error tenderá a disminuir a medida que vaya aumentando el tamaño de la muestra mediante la cual intentamos estimar el parámetro.

En la estimación por intervalos vamos a ofrecer una infinidad de valores, un intervalo de puntos, dentro del cual esperamos se encuentre el parámetro. Además indicaremos la probabilidad o confianza con la que esperamos se encuentre el parámetro dentro de dicho intervalo.

Llamaremos "intervalo confidencial" al intervalo dentro del cual confiamos se encuentre el parámetro que va a ser estimado.

Llamaremos "nivel de confianza" a la probabilidad o grado de confianza según el cual afirmaremos que el parámetro se encuentra dentro del mismo. A veces, este nivel de confianza o probabilidad confidencial suele venir multiplicado por 100. Así, se suele hablar de nivel de confianza del 95% en vez de p=0.95.

A veces también, en vez de utilizar el nivel de probabilidad, por ej. 0.95, se suele expresar el margen de riesgo al hacer la estimación, α=0.05, que quiere decir que admitimos un margen de riesgo del 5% de que el parámetro no se encuentre dentro del intervalo confidencial.

Llamaremos "límites confidenciales" a los dos extremos (inferior y superior) del intervalo confidencial.

Para ilustrar la estimación del intervalo, refirámonos a la media como estimación de μ. Sabemos que si se escogen aleatoriamente muestras de tamaño n a partir de una población con media μ y varianza σ2, la distribución muestral de la media tendrá también una media μ y una varianza σ2/N y si n es lo suficientemente grande, la distribución es normal.

La desviación típica de esta distribución muestral, o sea el error típico de la media es . Si esto es así, el 68% de las observaciones se hallarán dentro del intervalo y . Aproximadamente el 95% de las estará dentro del intervalo y , puesto que aproximadamente el 95% del área bajo la curva normal se halla dentro de dos desviaciones típicas respecto a la . Mediante la tabla de áreas de la distribución normal podemos determinar exactamente cuantas desviaciones típicas debemos alejarnos en cualquier dirección de la para establecer intervalos que incluyan el 70%, 90%, 95%, 99% o cualquier otro porcentaje bajo la curva.

1º) de la población normalmente distribuida, siendo σ2 conocida.

Sabemos por lo que se vio al hablar de distribuciones muestrales que la distribución muestral de la media, calculada a partir de todas las muestras posibles de tamaño n que se puede recoger de una población N, está normalmente distribuida y tiene una media y una varianza σ2/N.

Resumen:

Sacamos de la población una muestra de tamaño N

Calculamos la y

Seleccionamos un nivel de confianza determinado al que pretendemos hacer la estimación α=0.01, 0.05, ...., etc.

De acuerdo con ese nivel de confianza buscamos el valor de zi en la tabla de áreas de la distribución normal entrando en ella con .

Construimos el intervalo de confianza, sumando y restando a la el valor de , error muestral máximo para α=0.01, 0.05, ...., etc.

	Límite superior del intervalo

	Límite inferior del intervalo

Algunos ejemplos de intervalos de confianza

Intervalo de confianza para la media de una población normal y varianza de la población conocida.

Supongamos que la σ2 de la población de alumnos de 1º ESO en velocidad lectora es de 64 puntos. Seleccionamos al azar una muestra de 144 sujetos y obtenemos una media aritmética de 75 palabras. Se desea establecer el intervalo de confianza para la con un nivel de confianza del 99%.

En toda estimación por intervalo se tiene un estadístico (valor calculado en la muestra) o estimador al que hay que sumar y restar el valor de su error muestral máximo al nivel de confianza establecido.

Siguiendo los pasos expresados anteriormente tenemos

Cálculo del error típico

Como el nivel de confianza es del 99%, esto quiere decir que trabajamos con α= 0.01.

A ese α= 0.01 le corresponde, mirando las tablas, con α/2, una zi de ±2.58.

Por lo tanto el intervalo de confianza es:

		76.7286
α= 0.01	μ=75±2.58*0.67	3.4572
	1.7286	73.2714

Lo que significa que tenemos un 99% de confianza de que la media de la población no sea menor que 73.2714 ni mayor que 76.7286, o que esté entre estos dos valores extremos.

		76.31
α= 0.05	μ=75±1.96*0.67	2.62
	1.31	73.69

Lo que significa que tenemos un 95% de confianza de que la media de la población no sea menor que 73.69 ni mayor que 76.31, o que esté entre estos dos valores extremos.

Intervalo de confianza para la media de una población normal con desviación típica de la población desconocida.

Pueden darse dos casos, según el número de elementos de la muestra:

¬ Si N es grande (≥30) se procede como en el caso anterior, tomando en el por numerador la desviación típica de la muestra ya que la es desconocida.

Si N es pequeño (>30) el procedimiento general es el mismo, excepto en dos detalles. Uno es que la desviación típica de la muestra es un estimador sesgado de la desviación típica de la población, y para evitar este sesgo el error de la media es . Otro es que distribución muestral sigue el modelo teórico de la t de Student con g. l. = N-1; en vez de buscar en la tabla de áreas el punto crítico para calcular el error muestral máximo, habrá que encontrarlo en la tabla "t" de Student para α/2 y g.l.=N-1, llamándose "t" en vez de zi.

Por ejemplo:

Se sabe que la variable “número de palabras correctamente escritas del vocabulario fundamental de 1º ESO” se distribuye normalmente. Seleccionada una muestra de 20 alumnos se encontró una media de 45 y una desviación típica de 8. Determina el intervalo confidencial para la media aritmética con α= 0.01.

Ê Como n es menor que 30, el error de la media será

Ë Trabajamos con α= 0.01 y al estimar el parámetro habrá que tomar α/2.

Ì Para α/2; 0.01/2=0.005; entrando en la tabla de valores "t" encontramos un valor de 2,861. Este valor aparece mirando en la primera columna de la tabla (g.l.) que en nuestra caso es N-1; 20-1=19 y para un nivel de significación de dos colas, (0.01). En la intersección de columna y fila aparece el valor 2,861; t=2.861 es el valor equivalente a la zi anterior.

Í Construimos el intervalo de confianza, que será en este caso:

		50.24
	μ=45±2.861*1.83
		39.76

Se tiene la confianza del 99% de que la media de la población de alumnos de 1º ESO en esa variable no sea ni inferior a 39.76 ni superior a 50.23, o que está entre estos dos valores extremos.

De la misma manera se puede estimar cualquier parámetro ya que lo único que necesitamos es el valor del estadístico calculado en la muestra y el error típico de ese estadístico.

Errores típicos de algunos estadísticos

Error típico de la media:

donde σ = desviación típica de la población. Si no se conoce se toma la (Sx) de la muestra y N= número de elementos de la muestra.

Si el número de elementos de la muestra es pequeño, la Sx de una muestra es un estimador sesgado de la desviación típica de la población. En este caso el error de la media viene dado por en donde el denominador N-1 corrige el sesgo de la desviación típica que figura en el numerador

Error típico de la mediana:

Viene dado por

Error típico de la desviación típica:

Error típico de una proporción o porcentaje:

Proporción	Porcentaje
, p y q son las proporciones	, P y Q son los porcentajes

Pagina_principal_ii

Hosted by www.Geocities.ws