Enlace Local # 12
Estimación puntual: Es aquella
que considera un único valor como estimación del parámetro; es decir se usa un
solo estadístico muestral para estimar el parámetro poblacional correspondiente.
Ej.: Si se desea conocer el promedio de horas que los alumnos universitarios
dedican a ver televisión se elige aleatoriamente una muestra y se calcula la
media. Se supone que la muestra es representativa de la población y por lo tanto
el valor calculado puede considerarse como una buena estimación del parámetro
correspondiente. Tomamos un único valor como estimación de su correspondiente
parámetro.
La estimación puntual
de un parámetro no es muy significativa si no se acompańa de alguna medida del
error probable que se comete al realizar la estimación. Por ello las
estimaciones suelen ser de
intervalo.
Estimación por
intervalos: Hasta ahora hemos ofrecido un solo valor, un solo punto, como
estimación del parámetro de que se trate. Por otra parte, no podíamos indicar la
diferencia probable entre el parámetro y el estadístico, es decir el error
probable cometido al estimar el parámetro. Lo único que podemos afirmar en la
mayoría de los casos es que ese error tenderá a disminuir a medida que vaya
aumentando el tamańo de la muestra mediante la cual intentamos estimar el
parámetro.
En la estimación por
intervalos vamos a ofrecer una infinidad de valores, un
intervalo de puntos,
dentro del cual esperamos se encuentre el parámetro. Además indicaremos la
probabilidad o confianza con la que esperamos se encuentre el parámetro dentro
de dicho intervalo.
Llamaremos "intervalo
confidencial" al intervalo
dentro del cual confiamos se encuentre el parámetro que va a ser estimado.
Llamaremos "nivel de
confianza" a la probabilidad o grado de confianza según el cual afirmaremos que
el parámetro se encuentra dentro del mismo. A veces, este nivel de confianza o
probabilidad confidencial suele venir multiplicado por 100. Así, se suele hablar
de nivel de confianza del 95% en vez de p=0.95.
A veces también, en vez
de utilizar el nivel de probabilidad, por ej. 0.95, se suele expresar el margen
de riesgo al hacer la estimación, α=0.05, que quiere decir que admitimos un
margen de riesgo del 5% de que el parámetro no se encuentre dentro del
intervalo confidencial.
Llamaremos "límites
confidenciales" a los dos extremos (inferior y superior) del
intervalo confidencial.
Para ilustrar la
estimación del intervalo,
refirámonos a la media como estimación de
μ.
Sabemos que si se escogen aleatoriamente muestras de tamańo n a partir de una
población con media μ
y varianza σ2,
la distribución muestral de la media tendrá también una media
μ
y una varianza σ2/N
y si n es lo suficientemente grande, la distribución es normal.
La desviación típica de
esta distribución muestral, o sea el error típico de la media es . Si esto es
así, el 68% de las observaciones se hallarán dentro del
intervalo y .
Aproximadamente el 95% de las estará dentro del
intervalo y , puesto que
aproximadamente el 95% del área bajo la curva normal se halla dentro de dos
desviaciones típicas respecto a la . Mediante la tabla de áreas de la
distribución normal podemos determinar exactamente cuantas desviaciones típicas
debemos alejarnos en cualquier dirección de la para establecer intervalos que
incluyan el 70%, 90%, 95%, 99% o cualquier otro porcentaje bajo la curva.
1ş) de la población
normalmente distribuida, siendo σ2
conocida.
Sabemos por lo que se
vio al hablar de distribuciones muestrales que la distribución muestral de la
media, calculada a partir de todas las muestras posibles de tamańo n que se
puede recoger de una población N, está normalmente distribuida y tiene una media
y una varianza σ2/N.
Resumen:
|
Límite superior del intervalo |
||
| |
||
|
Límite inferior del intervalo |
Algunos ejemplos
de intervalos de confianza
Supongamos que la
σ2
de la población de alumnos de 1ş ESO en velocidad lectora es de 64 puntos.
Seleccionamos al azar una muestra de 144 sujetos y obtenemos una media
aritmética de 75 palabras. Se desea establecer el
intervalo de confianza
para la con un nivel de confianza del 99%.
En toda estimación por
intervalo se tiene un
estadístico (valor calculado en la muestra) o estimador al que hay que sumar y
restar el valor de su error muestral máximo al nivel de confianza establecido.
Siguiendo los pasos expresados anteriormente tenemos
|
76.7286 |
|||
| α= 0.01 |
μ=75±2.58*0.67 |
3.4572 |
|
|
1.7286 |
73.2714 |
Lo que significa
que tenemos un 99% de confianza de que la media de la población no sea menor que
73.2714 ni mayor que 76.7286, o que esté entre estos dos valores extremos.
|
76.31 |
|||
| α= 0.05 |
μ=75±1.96*0.67 |
2.62 |
|
|
1.31 |
73.69 |
Lo que significa
que tenemos un 95% de confianza de que la media de la población no sea menor que
73.69 ni mayor que 76.31, o que esté entre estos dos valores extremos.
¬ Si N es grande (≥30) se procede como en el caso anterior, tomando en el por numerador la desviación típica de la muestra ya que la es desconocida.
Si N es pequeńo (>30) el procedimiento general es el mismo, excepto en dos
detalles. Uno es que la desviación típica de la muestra es un estimador sesgado
de la desviación típica de la población, y para evitar este sesgo el error de la
media es . Otro es que distribución muestral sigue el modelo teórico de la t de
Student con g. l. = N-1; en vez de buscar en la tabla de áreas el punto crítico
para calcular el error muestral máximo, habrá que encontrarlo en la tabla "t" de
Student para α/2 y g.l.=N-1, llamándose "t" en vez de zi.
Por ejemplo:
Se sabe que la variable “número de palabras correctamente escritas del vocabulario fundamental de 1ş ESO” se distribuye normalmente. Seleccionada una muestra de 20 alumnos se encontró una media de 45 y una desviación típica de 8. Determina el intervalo confidencial para la media aritmética con α= 0.01.
Ę Como n es menor que 30, el error de la media será
Ë Trabajamos con α= 0.01 y al estimar el parámetro habrá que tomar α/2.
Ě Para α/2; 0.01/2=0.005; entrando en la tabla de valores "t" encontramos un valor de 2,861. Este valor aparece mirando en la primera columna de la tabla (g.l.) que en nuestra caso es N-1; 20-1=19 y para un nivel de significación de dos colas, (0.01). En la intersección de columna y fila aparece el valor 2,861; t=2.861 es el valor equivalente a la zi anterior.
Í
Construimos el intervalo
de confianza, que será en este caso:
|
50.24 |
|||
| |
μ=45±2.861*1.83 |
||
|
39.76 |
Se tiene la
confianza del 99% de que la media de la población de alumnos de 1ş ESO en esa
variable no sea ni inferior a 39.76 ni superior a 50.23, o que está entre estos
dos valores extremos.
De la misma manera se puede estimar cualquier parámetro ya que lo único que necesitamos es el valor del estadístico calculado en la muestra y el error típico de ese estadístico.
Error típico de
la media:
donde σ = desviación
típica de la población. Si no se conoce se toma la (Sx) de la muestra y N=
número de elementos de la muestra.
Si el número de
elementos de la muestra es pequeńo, la Sx de una muestra es un estimador sesgado
de la desviación típica de la población. En este caso el error de la media viene
dado por en donde el denominador N-1 corrige el sesgo de la desviación típica
que figura en el numerador
Error típico de la
mediana:
Viene dado por
Error típico de la
desviación típica:
Error típico de una
proporción o porcentaje:
|
Proporción |
Porcentaje |
|
, p y q son las proporciones |
, P y Q son los porcentajes |