Enlace Local # 1

Estimación puntual: Es aquella que considera un único valor como estimación del parámetro; es decir se usa un solo estadístico muestral para estimar el parámetro poblacional correspondiente. Ej.: Si se desea conocer el promedio de horas que los alumnos universitarios dedican a ver televisión se elige aleatoriamente una muestra y se calcula la media. Se supone que la muestra es representativa de la población y por lo tanto el valor calculado puede considerarse como una buena estimación del parámetro correspondiente. Tomamos un único valor como estimación de su correspondiente parámetro.

La estimación puntual de un parámetro no es muy significativa si no se acompaña de alguna medida del error probable que se comete al realizar la estimación. Por ello las estimaciones suelen ser de intervalo.

Estimación por intervalos: Hasta ahora hemos ofrecido un solo valor, un solo punto, como estimación del parámetro de que se trate. Por otra parte, no podíamos indicar la diferencia probable entre el parámetro y el estadístico, es decir el error probable cometido al estimar el parámetro. Lo único que podemos afirmar en la mayoría de los casos es que ese error tenderá a disminuir a medida que vaya aumentando el tamaño de la muestra mediante la cual intentamos estimar el parámetro.

En la estimación por intervalos vamos a ofrecer una infinidad de valores, un intervalo de puntos, dentro del cual esperamos se encuentre el parámetro. Además indicaremos la probabilidad o confianza con la que esperamos se encuentre el parámetro dentro de dicho intervalo.

Llamaremos "intervalo confidencial" al intervalo dentro del cual confiamos se encuentre el parámetro que va a ser estimado.

Llamaremos "nivel de confianza" a la probabilidad o grado de confianza según el cual afirmaremos que el parámetro se encuentra dentro del mismo. A veces, este nivel de confianza o probabilidad confidencial suele venir multiplicado por 100. Así, se suele hablar de nivel de confianza del 95% en vez de p=0.95.

A veces también, en vez de utilizar el nivel de probabilidad, por ej. 0.95, se suele expresar el margen de riesgo al hacer la estimación, α=0.05, que quiere decir que admitimos un margen de riesgo del 5% de que el parámetro no se encuentre dentro del intervalo confidencial.

Llamaremos "límites confidenciales" a los dos extremos (inferior y superior) del intervalo confidencial.

Para ilustrar la estimación del intervalo, refirámonos a la media como estimación de μ. Sabemos que si se escogen aleatoriamente muestras de tamaño n a partir de una población con media μ y varianza σ2, la distribución muestral de la media tendrá también una media μ y una varianza σ2/N y si n es lo suficientemente grande, la distribución es normal.

La desviación típica de esta distribución muestral, o sea el error típico de la media es . Si esto es así, el 68% de las observaciones se hallarán dentro del intervalo y . Aproximadamente el 95% de las estará dentro del intervalo y , puesto que aproximadamente el 95% del área bajo la curva normal se halla dentro de dos desviaciones típicas respecto a la . Mediante la tabla de áreas de la distribución normal podemos determinar exactamente cuantas desviaciones típicas debemos alejarnos en cualquier dirección de la para establecer intervalos que incluyan el 70%, 90%, 95%, 99% o cualquier otro porcentaje bajo la curva.

Sabemos por lo que se vio al hablar de distribuciones muestrales que la distribución muestral de la media, calculada a partir de todas las muestras posibles de tamaño n que se puede recoger de una población N, está normalmente distribuida y tiene una media y una varianza σ2/N.

	Límite superior del intervalo

	Límite inferior del intervalo

Supongamos que la σ2 de la población de alumnos de 1º ESO en velocidad lectora es de 64 puntos. Seleccionamos al azar una muestra de 144 sujetos y obtenemos una media aritmética de 75 palabras. Se desea establecer el intervalo de confianza para la con un nivel de confianza del 99%.

En toda estimación por intervalo se tiene un estadístico (valor calculado en la muestra) o estimador al que hay que sumar y restar el valor de su error muestral máximo al nivel de confianza establecido.

		76.7286
α= 0.01	μ=75±2.58*0.67	3.4572
	1.7286	73.2714

Lo que significa que tenemos un 99% de confianza de que la media de la población no sea menor que 73.2714 ni mayor que 76.7286, o que esté entre estos dos valores extremos.

		76.31
α= 0.05	μ=75±1.96*0.67	2.62
	1.31	73.69

Lo que significa que tenemos un 95% de confianza de que la media de la población no sea menor que 73.69 ni mayor que 76.31, o que esté entre estos dos valores extremos.

¬ Si N es grande (≥30) se procede como en el caso anterior, tomando en el por numerador la desviación típica de la muestra ya que la es desconocida.

Si N es pequeño (>30) el procedimiento general es el mismo, excepto en dos detalles. Uno es que la desviación típica de la muestra es un estimador sesgado de la desviación típica de la población, y para evitar este sesgo el error de la media es . Otro es que distribución muestral sigue el modelo teórico de la t de Student con g. l. = N-1; en vez de buscar en la tabla de áreas el punto crítico para calcular el error muestral máximo, habrá que encontrarlo en la tabla "t" de Student para α/2 y g.l.=N-1, llamándose "t" en vez de zi.

Se sabe que la variable “número de palabras correctamente escritas del vocabulario fundamental de 1º ESO” se distribuye normalmente. Seleccionada una muestra de 20 alumnos se encontró una media de 45 y una desviación típica de 8. Determina el intervalo confidencial para la media aritmética con α= 0.01.

Ì Para α/2; 0.01/2=0.005; entrando en la tabla de valores "t" encontramos un valor de 2,861. Este valor aparece mirando en la primera columna de la tabla (g.l.) que en nuestra caso es N-1; 20-1=19 y para un nivel de significación de dos colas, (0.01). En la intersección de columna y fila aparece el valor 2,861; t=2.861 es el valor equivalente a la zi anterior.

		50.24
	μ=45±2.861*1.83
		39.76

Se tiene la confianza del 99% de que la media de la población de alumnos de 1º ESO en esa variable no sea ni inferior a 39.76 ni superior a 50.23, o que está entre estos dos valores extremos.

De la misma manera se puede estimar cualquier parámetro ya que lo único que necesitamos es el valor del estadístico calculado en la muestra y el error típico de ese estadístico.

Errores típicos de algunos estadísticos

donde σ = desviación típica de la población. Si no se conoce se toma la (Sx) de la muestra y N= número de elementos de la muestra.

Si el número de elementos de la muestra es pequeño, la Sx de una muestra es un estimador sesgado de la desviación típica de la población. En este caso el error de la media viene dado por en donde el denominador N-1 corrige el sesgo de la desviación típica que figura en el numerador

Proporción	Porcentaje
, p y q son las proporciones	, P y Q son los porcentajes

ESTIMACIÓN POR INTERVALOS

Errores típicos de algunos estadísticos