Enlace Local # 4

 

Estimación y Prueba de Hipótesis

En la estadística hay dos formas principales de inferir:

La estimación parte desde suponer un modelo estadístico para la distribución de la característica que nos interesa en la población. Esta característica es, generalmente, numérica y distinguimos a las variables en continuas y discretas.

Si nos interesa el rendimiento o eficiencia de los trabajadores, como en el tercer ejemplo, tendremos el tiempo de realización de una tarea específica (variable continua).

En el segundo ejemplo nos interesará el número y tipo de errores cometidos en la factura (variable discreta).

En el primero nos interesa la opinión que mediremos como favorable o desfavorable (variable discreta = número de personas a favor o en contra).

Si tiene Ud. inclinaciones más poéticas, recuerde a la reina de las hadas y su problema de enamorarse del primero que vea al despertar; ahí tenemos el mismo tipo de situación: el amado será guapo o no guapo, y el parámetro desconocido es la ``densidad'' de guapos alrededor de la reina dormida.

 

Estimación

Para estimar partimos de un modelo probabilístico de cómo se distribuye la característica en la población o de cómo se realizó el muestreo. Este modelo incluye cantidades que desconocemos y que llamamos parámetros

Por ejemplo, en la encuesta para saber la opinión de los clientes, el número de clientes a favor es un parámetro, y la probabilidad de que obtengamos al azar a una persona que está a favor es la proporción de personas a favor en la población (que desconocemos). Esto se parece al lío de la reina de las hadas.

Para los tiempos de realización de la tarea, en el tercer ejemplo, podemos suponer una distribución normal con una media y una desviación estándar desconocidas; nuestro interés se centraría en el valor del promedio de la población.

De la muestra estimamos los valores de los parámetros en la población y esto lo hacemos:

Los métodos de estimación puntual pueden tener varias características estadísticas entre las que sobresalen:

  1. Insesgamiento. Que el valor del parámetro coincida con el valor promedio del estimador. Esta propiedad la tienen la mayoría de los estimadores usados en la práctica.
  2. Consistencia. Que el valor de la muestra se acerque al valor del parámetro al aumentar el tamaño de la muestra.
  3. Suficiencia. Que el estimador use toda la información que la muestra contiene respecto al parámetro de interés.
  4. Eficiencia. Que el estimador tenga menor variabilidad que otro posible.

 

Estimación puntual y de intervalo

Los estimadores puntuales más comunes son:

Es práctica común hablar de 2 veces la desviación estándar de un estimador como el error de estimación. Este error usualmente depende del tamaño de la población de donde se saca la muestra, sin embargo esta dependencia es muy moderada para muestras pequeñas en relación al tamaño de la población. Algo de esto ya lo experimentamos cuando hablamos de muestreo. Es costumbre no hacer caso de esta corrección por población finita.

Vemos varias fórmulas para estimación y para error de estimación en el pizarrón, no están en estas notas, las puede encontrar en el capítulo 7 del libro de texto. (Ahí encuentra Ud. también las ideas generales que hemos estado mencionando en estas notas).

La otra forma de estimar es más realista en cierto sentido. Estimamos usando un intervalo. Analicemos el siguiente ejemplo.

De 400 entrevistados 220 estan a favor. ¿Qué tan probable es tener 220 o más a favor cuando las opiniones estan divididas igualmente entre a favor o en contra?

Resulta 2.28% o 2.56% dependiendo de la fórmula usada. Pero si hubieran sido 1100 de 2000 la probabilidad cambiaría a cero (aunque la proporción: 220 de 400 sea la misma que 1100 de 2000). Si hubieran sido 55 de 100 la proporción permanece pero la probabilidad aumenta a 15.87%.

En estos ejemplos la estimación puntual permanece igual, pero las probabilidades dan tantos tumbos que concluimos que no es posible que reportemos sólo la estimación puntual, ¡Hace falta mencionar el error de estimación! Una manera muy compacta de hacerlo es un intervalo de confianza.

Éste consta de dos valores que encierran al parámetro con una probabilidad preestablecida arbitrariamente por nosostros. Lo común es usar 90% ó 95% ó 99%. A esta probabilidad la llamamos confianza

 

 

Pagina_principal_ii

Hosted by www.Geocities.ws

1