Técnicas de Muestreo [editar]

República Bolivariana de Venezuela

Ministerio de Educación Superior

Universidad Yacambú

Vicerrectorado estudios a distancia

Estadística Inferencial

Trabajo 7

Realizado por:

Gustavo Jaime

CI Nº 11962050

Barquisimeto; Noviembre 2007

Muestreo Aleatorio

Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande.

Podemos aquí mencionar que para el caso de que se estuviese estudiando una proporción dentro de la población (una elección de candidato, la aceptación o rechazo de una propuesta en una comunidad, la presencia o ausencia de una característica hereditaria), y el en caso de un muestreo aleatorio simple, la estimación que se puede hacer de la proporción buscada a partir de la proporción hallada en la muestra se obtiene mediante la construcción de un intervalo de confianza:

 = P ± tolerancia de la muestra

Donde  es la proporción buscada en la población y P es la proporción presente en la muestra.

Por otro lado, la tolerancia de la muestra está relacionada directamente con el nivel de confianza y se obtiene a partir de la distribución normal al igual que como se obtuvo para el cálculo del tamaño de las muestras. La representaremos con Z para obtener la fórmula:

Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupan los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k=N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k.

El riesgo se este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.

Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (tamaño geográfico, sexos, edades,...).

Decisión estadística

Constituye una herramienta básica para la toma de decisiones, basadas en evidencia científica. La manera de hacerlo es plantear las hipótesis posibles y luego efectuarle una prueba o test estadístico. Llamada en algunas obras: la docimasia estadística. Cuando una conclusión se valida con un test estadístico se la llama de tipo cuantitativo, en caso contrario la decisión adoptada es de tipo cualitativo, o sea, una decisión tomada en forma subjetiva. El método consiste en definir una probabilidad de aceptación del orden del 95% (o rechazo) de una hipótesis de trabajo planteada, que permite calcular los valores críticos (o límites de aceptación) de un estadígrafo calculado a partir de los valores medidos. La importancia de este tema es muy grande. Basta decir que el objeto final de la Estadística es la toma de decisiones. Esta herramienta permite la toma de decisiones en muchos casos prácticos, como ver si un método clínico esta calibrado, testear precisión y exactitud, plantear métodos de Control de Calidad, comparar entre sí dos técnicas de laboratorio, o entre dos medicamentos, entre otros.

Diferencia entre Estadística Descriptiva e Inferencial

Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada.

La estadística descriptiva es una parte de la estadística que se dedica a analizar y representar los datos. Este análisis es muy básico, pero fundamental en todo estudio. Aunque hay tendencia a generalizar a toda la población las primeras conclusiones obtenidas tras un análisis descriptivo, su poder inferencial es mínimo y debería evitarse tal proceder. Otras ramas de la estadística se centran en el contraste de hipótesis y su generalización a la población.

Algunas de las técnicas empleadas en este primer análisis de los datos se enumeran más abajo en el listado de conceptos básicos. Básicamente, se lleva a cabo un estudio calculando una serie de medidas de tendencia central, para ver en qué medida los datos se agrupan o dispersan en torno a un valor central.

*La estadística descriptiva, que se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de descriptores numéricos son la media y la desviación estándar. Resúmenes gráficos incluyen varios tipos de figuras y gráficos.

La inferencia estadística es una parte de la Estadística que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra).

La bondad de estas deducciones se mide en términos probabilísticos, es decir, toda inferencia se acompaña de su probabilidad de acierto.

La estadística inferencial comprende:

La Teoría de muestras.

La estimación de parámetros.

El Contraste de hipótesis.

El Diseño experimental.

La Inferencia bayesiana.

La inferencia estadística, que se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población de estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen ANOVA, series de tiempo y minería de datos.

Muestras y Población

Algo importante que hay que mencionar es que no siempre se trabaja con todos los datos. Esto por diversas razones, que pueden ser desde prácticas hasta por economía. Por ejemplo, resultaría muy costoso obtener los datos de todos los seres humanos, o impráctico (y a la vez destructivo) obtener como datos el tiempo en el que se funden las bombillas producidas por una cierta marca realizando la medición de toda la producción. El estudio conduciría a la empresa a la ruina, pues la producción entera desaparecería.

Por esta razón se considera un subconjunto del total de los casos, sujetos u objetos que se estudian y que se les obtienen los datos. La población, entonces, es el total hipotético de los datos que se estudian o recopilan. Ante la imposibilidad ocasional de conseguir a la población, entonces se recurre a la muestra, que viene siendo un subconjunto de los datos de la población, pero tal subconjunto tiene que contener datos que pueden servir para posteriores generalizaciones de las conclusiones

Diferencias entre muestra y población

	Población	Muestra

Definición	Colección de elementos considerados	Parte o porción de la población seleccionada para su estudio
Características	“Parámetros”	“Estadísticas”
Símbolos	Tamaño de la población = N	Tamaño de la muestra = n
	Media de la población = 	Media de la muestra = 
	Desviación estándar de la población = 	Desviación estándar de la muestra = s

Técnicas de Muestreo

Muestreo probabilístico

Forman parte de este tipo de muestreo todos aquellos métodos para los que puede calcularse la probabilidad de extracción de cualquiera de las muestras posibles. Este conjunto de técnicas de muestreo es el más aconsejable, aunque en ocasiones no es posible optar por él. En este caso se habla de muestras probabilísticas, pues no es razonable hablar de muestras representativas dado que no conocemos las características de la población.

El muestreo aleatorio simple puede ser de dos tipos:

Sin reposición de los elementos: cada elemento extraído se descarta para la subsiguiente extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar la vida media de las bombillas que la integran, no será posible medir más que una vez la bombilla seleccionada.

Con reposición de los elementos: las observaciones se realizan con reemplazamiento de los individuos, de forma que la población es idéntica en todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse sin reposición aunque, realmente, no lo sea.

Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción de números aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto.

Muestreo estratificado

Consiste en la división previa de la población de estudio en grupos o clases que se suponen homogéneos respecto a característica a estudiar. A cada uno de estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo que compondrán la muestra.

Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos técnicas de muestreo estratificado:

Asignación proporcional: el tamaño de cada estrato en la muestra es proporcional a su tamaño en la población.

Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan más variabilidad. Para ello es necesario un conocimiento previo de la población.

Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por separado las opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra que contenga también esa misma proporción.

Muestreo sistemático

Se utiliza cuando el universo es de gran tamaño o ha de extenderse en el tiempo. Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una constante, que se denomina coeficiente de elevación K= N/n; donde N es el tamaño del universo y n el tamaño de la muestra. Determinar en qué fecha se producirá la primera extracción, para ello hay que elegir al azar un número entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenómeno.

Muestreo por conglomerados

Cuando la población se encuentra dividida, de manera natural, en grupos que se suponen que contienen toda la variabilidad de la población, es decir, la representan fielmente respecto a la característica a elegir, pueden seleccionarse sólo algunos de estos grupos o conglomerados para la realización del estudio.

Dentro de los grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las personas a encuestar, y podría aplicársele el instrumento de medición a todas las unidades, es decir, los miembros del grupo, o sólo se le podría aplicar a algunos de ellos, seleccionados al azar. Este método tiene la ventaja de simplificar la recogida de información muestral.

Cuando, dentro de cada conglomerado, se extraen los individuos que formarán parte de la muestra por m.a.s., el muestreo se llama bietápico.

Las ideas de estratificación y conglomerados son opuestas. El primer método funciona mejor cuanto más homogénea es la población respecto del estrato, aunque más diferentes son éstos entre sí. En el segundo, ocurre lo contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben ser muy parecidos entre sí.

Muestreo no probabilístico

Aquel para el que no puede calcularse la probabilidad de extracción de una determinada muestra.

Hay dos tipos:

Muestreo intencional

La extracción de la muestra y su tamaño para ser representativa se valora de forma subjetiva. Se basa en una buena estrategia y el buen juicio del investigador. Se puede elegir las unidades del muestreo. Un caso frecuente es tomar elementos que se juzgan típicos o representativos de la población, y suponer que los errores en la selección se compensarán unos con otros. El problema que plantea es que sin una comprobación de otro tipo, no es posible saber si los casos típicos lo son en realidad, y tampoco se conoce como afecta a esos casos típicos los posibles cambios que se producen.

Estadístico

Un estadístico es una medida cuantitativa, derivada de un conjunto de datos de una muestra con el objetivo de estimar o contrastar características de una población o modelo estadístico.

Más formalmente un estadístico es una función medible que dado una muestra estadística de valores, les asigna un número que sirve para estimar los parámetros de la distribución de la que procede la muestra. Así por ejemplo la media muestral de valores sirve para estimar el valor esperado de una variable, la varianza muestral de una muestra amplia sirve para estimar la varianza de la población, etc.

Parámetro

En Estadística, se llama parámetro a un valor representativo de una población, como la media aritmética, una proporción o su desviación típica.

En Ciencias de la computación, un parámetro o argumento es una variable que puede ser recibida por una subrutina.

Distribución en el Muestreo:

Medias

El modelo de Gauss para las distribuciones de medias muestrales se puede aplicar para muestras de tamaño treinta o mayores (n ≥ 30) donde µ

e = µx =X y σ

e = σ / n; por lo tanto el estadígrafo Z para poder compararlo con el valor crítico de tablas Zα, será:Z = n-Xσ/µ donde σ es desconocido y se lo aproxima con DS.

Ejemplo de calibración: Se realizaron 36 mediciones repetidas de una misma magnitud clínica: glucosa; usando una solución calibrada con µ = 90 mg/dl, los resultados obtenidos arrojan una media de 95 mg/dl y un desvío estándar de 8 mg/dl. Ensayar la hipótesis de que el sistema de medición está calibrado (en exactitud) con un nivel de confianza adecuado.

Aquí conviene plantear la igualdad como una hipótesis nula.

Ho: µ = 90 mg/dl y el sistema está calibrado en exactitud. H1: µ ≠ 90 mg/dl y el sistema no está calibrado, tiene un error de tipo sistemático.

Varianzas

El modelo de Gauss para las distribuciones de varianzas muestrales se puede aplicar para muestras de tamaño cien o mayores (N ≥ 100), donde µ e = µ σ2 =DS2 y SE (σ 2) = σ σ2= σ22/n.

Por lo tanto, el estadígrafo Z para poder compararlo con el valor crítico de tablas Zα, será: Z = 2/n σσ DS 222− donde σ es desconocido y se lo postula con Ho.

Ejemplo de calibración: Continuando con el caso anterior, el investigador completa las 100 muestras obteniendo una nueva media de 94,6 mg/dl con un desvío de 9,65 mg/dl. De los libros de texto surge que la dispersión aceptada para la determinación de Glucosa viene dada por un co-eficiente de variación del 10%. Se desea analizar si la dispersión encontrada en el experimento es menor, o por lo menos igual que la aceptable.

El CV% = 10% significa: 0,1 = σ max / µ = σ max / 90. De allí surge σ max.= 9 mg/dl. Se plantean: H0: σ ≤ 9 mg/dl y el sistema tiene una dispersión aceptable. H1: σ > 9 mg/dl y el error casual es muy grande. El sistema no está calibrado en precisión.

Por lo tanto, se trata de un ensayo de una sola cola y el estadígrafo de comparación se saca con: Z = 2 / σσ DS 222−= 2/100)9)9) (9,6522((−2= 1,06

Los valores críticos de tablas son: Z 0,95= 1,645; Z 0,99 = 2,33 y Z 0,999 = 3,09

Como Z < Zα no se rechaza la Ho. σ2≤ 81 ∈ 95% CI (-∞; + 87,2)

Por lo tanto, los resultados no fueron significativos. Esto es, no hay evidencia suficiente como para pensar que la dispersión no sea aceptable. El error casual no es significativo. Dicho en otros términos, la precisión del sistema de medición es menor que la máxima admisible recomendada en los libros de texto. La forma de expresarlo puede ser:

a.- no se rechaza la hipótesis nula: Z = 1,06 (ns) y también con 95% CI (-∞; +87,2);

b.- no hay evidencia que pruebe una dispersión no aceptable.

Teorema del límite central

El Lema de Límite Central o Teorema Central del Límite indica que, bajo condiciones muy generales, la distribución de la suma de variables aleatorias tiende a una Distribución Normal (también llamada Distribución Gaussiana) cuando la cantidad de variables es muy grande.

Teorema: Sea $X 1$ , $X 2$ , ..., $X n$ una muestra aleatoria de una distribución con media μ y varianza σ². Entonces, si n es suficientemente grande, la variable aleatoria

$\bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_i$

tiene aproximadamente una distribución normal con $\mu_{\bar X} = \mu$ y $\sigma^2_{\bar X}= \sigma^2/n$ .

También se cumple que si

${T_0}=\sum_{i=1}^{n}X_i$

tiene aproximadamente una distribución normal con $\mu_{T_0} = n\mu$ y $\sigma^2_{T_0} = n\sigma^2$ . Cuanto más grande sea el valor de n, mejor será la aproximación.

El Teorema del Límite Central garantiza una distribución normal cuando n es suficientemente grande.

Existen diferentes versiones del teorema, en función de las condiciones utilizadas para asegurar la convergencia. Una de las más simples establece que es suficiente que las variables que se suman sean independientes, idénticamente distribuidas, con valor esperado y varianza finitas.

La aproximación entre las dos distribuciones es, en general, mayor en el centro de las mismas que en sus extremos o colas, motivo por el que se prefiere el nombre "Teorema del Límite Central" ("central" califica al límite, más que al teorema).

Este teorema, perteneciente a la Teoría de la Probabilidad, encuentra aplicación en muchos campos relacionados, como la Inferencia estadística o la Teoría de renovación.

Estimación puntual y Estimación por intervalos

Estimación puntual

Consiste en la estimación del valor del parámetro mediante un sólo valor, obtenido de una fórmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado grupo de individuos, puede extraerse una muestra y ofrecer como estimación puntual la talla media de los individuos.

Estimación por intervalos

Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado con una cierta probabilidad. En la estimación por intervalos se usan los siguientes conceptos:

Estimación de parámetros

Si no se conoce, puede obtenerse una aproximación en los datos aportados por la literatura científica o en un estudio piloto. También hay métodos para calcular el tamaño de la muestra que prescinde de este aspecto. Habitualmente se usa como medida de esta variabilidad la desviación típica poblacional y se denota σ.

Intervalos de confianza

Se llama intervalo de confianza en estadística a un intervalo de valores alrededor de un parámetro muestral en los que, con una probabilidad o nivel de confianza determinado, se situará el parámetro poblacional a estimar. Si $α$ es el error aleatorio que se quiere cometer, la probabilidad será de $1 - α$ . A menor nivel de confianza el intervalo será más preciso, pero se cometerá un mayor error.

Para comprender las siguientes fórmulas, es necesario conocer los conceptos de variabilidad del parámetro, error, nivel de confianza, valor crítico y valor α (véase Estimación por intervalos).

Un intervalo de confianza es, pues, una expresión del tipo [θ₁, θ₂] ó θ₁ ≤ θ ≤ θ₂, donde θ es el parámetro a estimar. Este intervalo contiene al parámetro estimado con una determinada certeza o nivel de confianza 1-α.

Al ofrecer un intervalo de confianza se da por supuesto que los datos poblacionales se distribuyen de un modo determinado. Es habitual que lo hagan mediante la distribución normal. La construcción de intervalos de confianza se realiza usando la desigualdad de Chebyshev

Ejemplos

Intervalo de confianza para la media de una población

De una población de media $μ$ y desviación típica $σ$ se pueden tomar muestras de $n$ elementos. Cada una de estas muestras tiene a su vez una media ( $\bar{x}$ ). Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional:

$\mu_{\bar{x}} = \mu$

Pero además, si el tamaño de las muestras es lo suficientemente grande, las medias muestrales tienden a una distribución normal (o gaussiana) con dicha media y una desviación típica dada por la siguiente expresión:

$\sigma_{\bar{x}}^2 = \frac{\sigma^2}{n}; \sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}$

Si estandarizamos:

$\frac{\bar{x} - \mu_{\bar{x}}}{\sigma_{\bar{x}}} = \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}} \sim N(0, 1)$

En esta distribución normal de medias se puede calcular el intervalo de confianza donde se encontrará la media poblacional si sólo se conoce una media muestral ( $\bar{x}$ ), con una confianza determinada. Habitualmente se manejan valores de confianza del 95% y 99%. A este valor se le llamará $1 - α$ (debido a que $α$ es el error que se cometerá, un término opuesto).

Para ello se necesita calcular el punto $X α$ $/ 2$ —o mejor dicho su versión estandarizada $Z α$ $/ 2$ — junto con su "opuesto en la distribución" $X - α / 2$ . Estos puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen:

Dicho punto es el número tal que:

$\mathbb{P}[\bar{x} \ge X_{\alpha/2}] = \mathbb{P}[z \ge Z_{\alpha/2}] = \alpha/2$

Y en la versión estandarizada se cumple que:

$Z$ $- α / 2 = - Z α / 2$

Así:

$\mathbb{P}\left[-Z_{\alpha/2} \le \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}} \le Z_{\alpha/2}\right] = 1 - \alpha$

Haciendo operaciones es posible despejar $μ$ para obtener el intervalo:

$\mathbb{P}\left[\bar{x} - Z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \le \mu \le \bar{x} + Z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right] = 1 - \alpha$

Resultado el intervalo de confianza:

$(\bar{x} - Z_{\alpha/2}\frac{\sigma}{\sqrt{n}}, \bar{x} + Z_{\alpha/2}\frac{\sigma}{\sqrt{n}})$

Si $σ$ no es conocida y n es grande (p.e. ≥ 30):

$(\bar{x} - Z_{\alpha/2}\frac{s}{\sqrt{n}}, \bar{x} + Z_{\alpha/2}\frac{s}{\sqrt{n}})$ , donde s es la desviación típica de una muestra.

Aproximaciones para el valor $Z α$ $/ 2$ para los niveles de confianza estándar son 1,96 para $1 - α = 95%$ y 2,33 para $1 - α = 99%$ .

Error Probable

Medida de la variabilidad del muestreo, igual a 0,6745 veces el error típico. La mitad de una muestra distribuida normalmente queda dentro del intervalo definido por la media ± 0,6745 desviaciones típicas.

Cuando se mide una cantidad, ya directa, ya indirectamente, la medida que se obtiene no es necesariamente el valor exacto de tal medida, ya que el resultado obtenido estará afectado por errores debidos a multitud de factores. Algo en apariencia tan sencillo como cronometrar el período del péndulo en el apartado anterior sufrirá errores debidos a la precisión del cronómetro, los reflejos del cronometrador, las corrientes de aire, el número de medidas efectuadas... errores que se propagarán a cualquier cantidad derivada de ésta que queramos determinar, como por ejemplo velocidad o aceleración.

En estos casos es necesario estimar el error cometido al efectuar una medida o serie de medidas. El conjunto de reglas matemáticas dedicado a su estudio se conoce como teoría de errores, y resulta imprescindible tanto para sacar todo el partido posible a un conjunto de datos experimentales como para evaluar la fiabilidad de éstos. El estudio de la teoría de errores es una rama aparte de la matemática por derecho propio, y por su extensión no se desarrollará aquí. El lector queda avisado de que lo que sigue es tan sólo un conjunto rápido y necesariamente breve de las reglas fundamentales más usadas en el ámbito de la teoría de errores.

1 - Nociones previas.

Si se efectúa una medida directa de una cantidad física, el valor medido x por lo general diferirá del valor exacto x o. Se denomina error absoluto de la medida a la diferencia g = x-x o y error relativo al cociente g/x o. El error relativo resulta especialmente relevante porque nos relaciona el error cometido con el valor de lo medido. Un error de 1 mm resulta magnífico si se mide la longitud de una carretera de 100 km (representa una desviación de una parte por cada 100.000.000), adecuado si se mide una mesa de 2 m e inaceptable si se mide una hormiga de 2 mm. En los tres casos el error absoluto es el mismo, pero su cercanía relativa al valor exacto son distintas.

Por lo general, el valor de una medida se da estimando su valor más probable x y su error,) x. Escribir x±)x significa que cabe esperar razonablemente que el valor exacto de la cantidad valga cualquier cantidad entre x-)x y x+)x, con x como valor más probable. La traducción de "cabe esperar razonablemente" al lenguaje matemático queda fuera del presente desarrollo.

Existen dos tipos de errores: sistemáticos y accidentales. Los primeros actúan siempre de la misma forma para influir en la medida (por ejemplo, una balanza desajustada que tiende a marcar una masa 10 gr. superior a la real). Estas medidas, si se producen, producen un error constante. Por contra, los errores accidentales son de carácter aleatorio, lo que presupone que actúan con la misma frecuencia tanto con un signo como con el opuesto (esto es, se tiene igual probabilidad de obtener una medida 5 gr. superior al valor real como de obtenerla 5 gr. Por debajo).

No se puede conocer el valor exacto de una cantidad, puesto que siempre existen errores; tampoco se puede conocer el valor exacto de un error, puesto que dependen de procesos aleatorios y generalmente incontrolables (aparte de ser una contradicción en sus propios términos). Sin embargo, es preciso dar un valor de la medida con su error. La Teoría de Errores deduce ciertas reglas para ello.

2 - Errores asociados a una medida.

a) Medidas directas. Redondeo.

Supóngase que se efectúa una evaluación directa de una cantidad, x. Se suele en este caso tomar el propio valor de x como medición de dicha cantidad. Como error se supone la sensibilidad del aparato utilizado en la medición, esto es, el valor mínimo que el aparato es capaz de medir. Esto presupone implícitamente que los errores accidentales están fuera de nuestra manipulación, ya sea porque los hayamos eliminados, ya porque seamos ignorantes de su existencia, de manera que los únicos errores que aparecen son los de tipo aleatorio.

El error en sí es algo aproximado. Dar un valor de 24.5±0.3 mm. Significa esperar que el valor verdadero sea alguna cantidad entre 24.2 y 24.8 mm. Pero dar 24.500±0.302 mm., es lo mismo que decir que el valor exacto ha de estar entre 24.198 y 25.802 mm; no resulta razonable, ya que "ha de estar entre" no tiene una seguridad absoluta, sino tan sólo una cierta probabilidad.

Por ello, tanto el error como el valor más probable vienen redondeados convenientemente. Para el error, se supone que basta con dar una, a veces dos, cifras significativas (es decir, cifras que dan información relevante). Los criterios habituales son los siguientes:

- Si las dos primeras cifras significativas son inferiores a 25, se toman dichas cifras para el error. De no ser así, se toma solamente una cifra. Según eso, el error 0.113 queda convertido en 0.11, y el 6488.24 se transforma en 6000

- Si la primera cifra que se descarta es un cinco o más, la última cifra que se guarda se aumenta en una unidad. Esto es, el valor 0.362 se convierte en 0.4 y no en 0.3

-Una vez redondeado convenientemente el error, el valor de la medida se redondea hasta la misma cifra decimal.

Véanse unos cuantos ejemplos:

Medida

Error

Resultado final

464.2413

0.061

464.24±0.06

6.03

0.0005

6.0300±0.0005

46288

1553

46300±1600

3.218

0.124

3.2±0.1

0.018366

0.00783

0.018±0.008

b) Medidas indirectas. Propagación de errores.

A veces no se mide una cantidad directamente, sino por relación con otras cantidades.

Para medir, por ejemplo, el área de un rectángulo se miden sus lados a,b y se hace uso de la relación S=ab. Si tanto a como b tienen sus cotas de error, evidentemente también la superficie vendrá afectada de error. Cómo depende el error de una cantidad derivada de las medidas y errores fundamentales viene dado mediante la teoría de la propagación de errores.

Para ello se utiliza el cálculo diferencial. Sea y una función que depende de las variables independientes x

1, x

2...xn

Se puede obtener el valor del diferencial de la función y a partir de los diferenciales de las variables xi por medio de derivadas parciales: dy' My Mx 1 dx 1% My Mx 2dx 2%...%My Mx nd xn

En nuestro caso, y la función que nos da la cantidad medida indirectamente a partir de las medidas directas de las cantidades x1...xn (en rigor, xi es cualquier parámetro, variable o no, que venga dado con un margen de error; el número pi, por ejemplo, sería uno de ellos, ya que nunca se conoce con una exactitud infinita, si bien en estos casos se supone que se conoce con un número de cifras decimales tal que el redondeo debido a despreciar las demás cifras es despreciable). Si los errores son lo suficientemente pequeños, podemos considerarlos como diferenciales, ya que estos pueden interpretarse como variaciones infinitesimales. La ecuación que nos da el error de y,) y, es entonces:)y' MyMx1)x 1%MyMx2)x2%...%My Mxn)xn. Es posible que algunos de los términos que acompañan a los errores) xi sean positivos o otros sean negativos, en cuyo caso podría resultar que algunos errores cancelen a otros (por ejemplo, que la base del rectángulo sea mayor y la altura menor que sus respectivos valores reales).

Sin embargo, los errores pueden ser tanto por exceso como por defecto, por lo que hay que considerar la posibilidad de que en el peor de los casos los errores se sumen de manera que no sólo no se anulen, sino que se refuercen. Para evitarlo, se considera que las derivadas parciales aparecen en valor absoluto:

Ejemplo. Supongamos que se mide el radio r y la altura h de un cilindro, obteniendo un volumen V=Br 2 h. En tal caso, y=V, x1=r, x2=h y se tendría:)V'MVMr) r%MVMh) h' 2Brh) r%Br2) h

Si r = 12.6±0.3 mm, h = 35.12±0.06 mm

obtiene:)V'[email protected]@12.6mm@35.12mm@0.3mm%[email protected]mm)[email protected]mm' 834.1155mm 3 % 29.9256mm 3' 864.04102mm 3.

Vemos que la parte de error correspondiente a)r es mucho mayor que la de )h, lo quesignifica que para reducir el error del volumen es mucho más eficaz reducir el error en la determinación del radio que en la de la altura. Finalmente, el volumen es V=17516.425 mm 3, lo que tras los redondeos oportunos queda como: V'(17500±900) mm 3

3 - Errores asociados a un conjunto de medidas.

a) Valor de la medida y error asociado.

Resulta práctica habitual realizar varias medidas de una cantidad. Ello permite prevenir en la medida de lo posible los errores accidentales. La idea consiste en suponer (más bien confiar en) que dos errores del mismo valor absoluto, pero de signo contrario, tienen la misma frecuencia. Esto, es, si la medida exacta de la longitud de un objeto es 12.52 m, se tiene igual probabilidad de medir 12.55 m que de medir 12.49 m. Si se cumplen esta y otras condiciones determinadas, se puede aplicar la llamada estadística de Gauss, algunos de cuyos resultados se muestran a continuación.

Supongamos un conjunto de N medidas x1, x2,...xn obtenidas para una cantidad cuyo valor exacto es x. Para dar un valor representativo del conjunto, se toma el valor medio de dichas medidas, xo: x o'x 1% x2%...xNN / 1NjNi'1i

A cualquier medida xi se le adjudica un error gi igual a la diferencia entre dicha medida y el valor medio (que ahora se toma como exacto): gi= xi- xo. ¿Cuál es, entonces, el error asociado al conjunto de medidas? Puede hacerse un primer intento y definir el error medio como el valor medio de los errores (su suma dividida por N); sin embargo, se demuestra fácilmente que dicha cantidad es nula sea cuales sean los valores

xi: go'1NjNi' 1gi'1NjNi' 1(xi&xo)' 1NjNi' 1xi& 1NNxo'xo&xo'0

Este resultado, paradójico en apariencia, no es más que un reflejo del significado del término valor medio. Pare evitarlo, y puesto que los errores pueden serlo por defecto o por defecto, a veces se define el error medio Fm como la media aritmética de los valores absolutos de los errores: F m'jNi'1 * gi *N

En la práctica se usa más que el error medio el llamado error probable que es un error tal que la probabilidad de cometer un error superior a él, en valor absoluto, valga 1/2. Esto es, la mitad de las veces que se efectúe una medida se obtendrá un error inferior en valor absoluto al error probable. Esto se debe a motivos estadísticos, pero aquí se hará una deducción intuitiva.

Dicha deducción se base en el siguiente razonamiento: puesto que el valor medio de los errores sale cero porque dichos errores tienen signo (los valores medidos están por encima o por debajo del valor medio), eliminemos el signo. Ya se hizo en la ecuación anterior por medio de un valor absoluto. Sin embargo, la función valor absoluto es engorrosa desde el punto de vista analítico. Existe otra manera de convertir cualquier número real en un valor positivo: elevándolo al cuadrado. Así que podríamos usar como error del conjunto de medidas el valor medio de los cuadrados de los errores:

F N'j N i'1 g 2 iN

Sin embargo, en el proceso hemos reducido artificialmente el error, ya que cada error gi, ya pequeño de por sí, ha sido elevado al cuadrado. El arreglo es inmediato: si hemos elevado al cuadrado, saquemos la raíz cuadrada para compensar:

F N'1 Nj Ni'1g2i'1NjNi'1(xi&xo)2

Esta cantidad, que se puede obtener mediante la estadística de Gauss por procedimientos más rigurosos, es el llamado error cuadrático medio, y es el que habitualmente da como error de un conjunto de medidas siempre que éste no sea inferior al error instrumental, esto es, al error mínimo imputable a la sensibilidad del aparato (mínima marca en una regla, menor intensidad mensurable en un amperímetro, etc). De lo contrario, un conjunto de medidas tales como: 10.0, 10.0, 10.1, 10.0, 10.0 mm medidos con una regla milimetrada hasta 0.1 mm arrojaría un valor de 10.02 ± 0.04 mm, lo cual no es lógico estadísticamente hablando: con el aumento del número de medidas aumenta la verosimilitud, pero no el número de cifras decimales del resultado. El error cuadrático medio asociado a N medidas se designa como F N, y así suele venir indicado en las calculadoras científicas.

Si se desea afinar más la estadística del sistema, se define el error de manera diferente.

Esto se debe a que la expresión anterior es válida solamente si x o fuese el valor exacto de la medida; como no lo conocemos, hemos de sustituirlo por el valor medio. Ello puede dar discrepancias no despreciables cuando el número de medidas N es pequeño. Para el caso límite

N=1, suponer que la única medida tomada coincide con el valor exacto nos induciría a llegar a la absurda conclusión de que el error cuadrático de dicha observación es nulo. Si se admite que el conjunto de N medidas sigue la llamada ley de Gauss, puede demostrarse que al usar el valor medio en lugar del valor exacto, la ley correcta tiene la expresión:

F N&1'j Ni'1g2iN(N&1)'jNi'1(xi&xo)2N(N&1)

Puede verse fácilmente que el cociente entre las dos cantidades es igual a la raíz cuadrada de (N-1)/N, cantidad que tiende a la unidad para valores de N crecientes. En la práctica, dicha diferencia resulta poco relevante, ya que la operación de redondeo borra las diferencias entre ambos errores. Para el conjunto de datos (51.00, 51.00, 51.50, 52.5, 52.0, 50.50, 53.50), se obtiene x o =51.71428..., FN=0.95831...y F N-1=1.035099... Sea cual sea el error que se considere, los datos arrojarían un valor final de 52 ± 1 (nunca hay que olvidar que cualquier valor de error que se de será simplemente una estimación del error probable, nunca un valor exacto de tal error).

En la práctica, habida cuenta de la escasa diferencia entre ambos errores, se suele dar como resultado de un conjunto de medidas el valor medio x o y el error cuadrático medio F

N (a no ser que FN sea menor que el error nstrumental del aparato de medida, en cuyo caso se tomará éste último). Únicamente tiene interés para nosotros emplear F N-1 cuando el número de medidas no es muy grande y estamos interesados en obtener información estadística más completa del sistema.

b) Número de medidas

Si se hacen pocas determinaciones, el valor obtenido para la cantidad medida podrá estar afectado por importantes errores; si se efectúan demasiadas medidas, se está derrochando esfuerzo sin obtener mejoras sustanciales en precisión. En general, el valor del error asociado a un conjunto de medidas decrece de manera proporcional a la raíz cuadrada del número total de medidas. Es decir, el error asociado a 500 medidas es del orden de diez veces menor que el debido a solamente cinco medidas.

Es evidente, no obstante, que no se puede esperar una reducción del error a valores arbitrariamente pequeños aumentando el número de medidas, ya que toparemos en última instancia con errores sistemáticos, límites en la sensibilidad del instrumento, etc; de manera que con una regla dividida en milímetros no se puede apreciar más allá del milímetro, independientemente del número de medidas efectuado. ¿Cuál es el número de medidas adecuado para una observación estadísticamente significativa? Descartados los casos en que, por las características del experimento, solamente se pueda obtener una medición, el mínimo número de medidas admisible es de tres, ya que si hacemos una sola medida cabe la duda de saber si éste resultado es el verdadero, y si hacemos

Dos resulta arbitrario seleccionar entre ellas (¿está el valor exacto en un término medio, o hay una Medida afectada de error accidental y otra no?). El procedimiento recomendado aquí (no el único ni, necesariamente, el mejor) es el siguiente:

a) Se calcula la dispersión D, que es la diferencia entre los valores extremos (mayor y menor) de las medidas realizadas.

b) Si la dispersión es igual o menor que el error instrumental, es dicho error el que figurará como error del conjunto de medidas.

c) Si la dispersión es mayor que el error instrumental, se calcula la tasa de dispersión T d, que no es sino la dispersión relativa (respecto al valor medio) en tantos por ciento: d' 100@D x o Según sea el valor de T d se elige el número de medidas a realizar (la siguiente tabla es

orientativa):T d Nº medidas. menor del 2% bastan con las tres medidas entre 2% y 8% se toman 6 medidas entre 8% y 15% se toman 15 medidas mayor del 15% se toman 50 medidas (mínimo)

Por lo general, si la tasa de desviación es superior al 15% se suele descartar el conjunto de medidas y repetir el experimento de manera más cuidadosa y procurando minimizar cualquier tipo de error (aparatos más sensibles, muestras aisladas de las vibraciones, etc). En caso de que el carácter del experimento haga que las medidas difieran de modo natural entre sí, se efectuará un conjunto elevado de mediciones.

4 - Regresión lineal: mínimos cuadrados.

En un experimento típico, se cambia el valor de una variable independiente X para observar el comportamiento de otra variable Y dependiente de la anterior; por ejemplo, el cambio de la densidad del agua (Y) con la temperatura (X). Cuando hacemos una representación gráfica

Y(X) (Y en el eje vertical de ordenadas y X en el eje horizontal de abscisas), la curva obtenida tendrá una forma dada. En el laboratorio, al reproducir un experimento de este tipo, obtendríamos una gráfica idéntica a la arrojada por la teoría. Sin embargo, la existencia de muchas fuentes de indeterminación (no sólo errores sino también las simplificaciones hechas en la propia teoría, influencias de otros factores, etc) hacen que los datos experimentales no coincidan exactamente con la curva teórica, sino que tiendan a disponerse alrededor de ésta.

Surge entonces la pregunta de qué curva "ajusta" mejor los datos experimentales. Con "ajusta" se quiere decir, no que la curva pase exactamente por todos los puntos experimentales, sino que tienda a estar lo más cerca posible de todos ellos en conjunto.

El ajuste de datos experimentales a curvas es extremadamente importante, no sólo para poder comparar con la teoría, sino incluso para poder establecer la validez o no de la misma teoría. El caso general es complejo y laborioso, así que nos limitaremos a una curva en la que la dependencia entre X e Y es de tipo lineal (si se duplica X, se duplica Y). Supongamos que para cada valor Xi de la variable independiente se obtiene un valor Yi de la variable dependiente (aquí los subíndices i denotan distintos valores de X e Y, y no guardan relación alguna con los valores de una misma cantidad). El problema consiste en encontrar una curva del tipo Y = a + bX, (una recta, en este caso) que ajuste mejor el conjunto de datos; en concreto, se buscan los valores de a y b tales que la suma de distancias entre la recta y todos los puntos experimentales sea mínima.

Cálculo del Tamaño de la muestra

Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:

El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la población total.

El porcentaje de error que se pretende aceptar al momento de hacer la generalización.

El nivel de variabilidad que se calcula para comprobar la hipótesis.

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero también implica estudiar a la totalidad de los casos de la población.

Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser prácticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza menor. Comúnmente en las investigaciones sociales se busca un 95%. El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipótesis que sea falsa como si fuera verdadera, o la inversa: rechazar a hipótesis verdadera por considerarla falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamaño que la población, por lo que conviene correr un cierto riesgo de equivocarse.

Comúnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error.

La variabilidad es la probabilidad (o porcentaje) con el que se aceptó y se rechazó la hipótesis que se quiere investigar en alguna investigación anterior o en un ensayo previo a la investigación actual. El porcentaje con que se aceptó tal hipótesis se denomina variabilidad positiva y se denota por p, y el porcentaje con el que se rechazó se la hipótesis es la variabilidad negativa, denotada por q.

Hay que considerar que p y q son complementarios, es decir, que su suma es igual a la unidad: p+q=1. Además, cuando se habla de la máxima variabilidad, en el caso de no existir antecedentes sobre la investigación (no hay otras o no se pudo aplicar una prueba previa), entonces los valores de variabilidad es p=q=0.5.

Una vez que se han determinado estos tres factores, entonces se puede calcular el tamaño de la muestra como a continuación se expone.

Hablando de una población de alrededor de 10,000 casos, o mínimo esa cantidad, podemos pensar en la manera de calcular el tamaño de la muestra a través de las siguientes fórmulas. Hay que mencionar que estas fórmulas se pueden aplicar de manera aceptable pensando en instrumentos que no incluyan preguntas abiertas y que sean un total de alrededor de 30.

Vamos a presentar dos fórmulas, siendo la primera la que se aplica en el caso de que no se conozca con precisión el tamaño de la población, y es:

Donde: n es el tamaño de la muestra; Z es el nivel de confianza; p es la variabilidad positiva; q es la variabilidad negativa; E es la precisión o error.

Hay que tomar nota de que debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, hay que convertir todos esos valores a proporciones en el caso necesario.

También hay que tomar en cuenta que el nivel de confianza no es ni un porcentaje, ni la proporción que le correspondería, a pesar de que se expresa en términos de porcentajes. El nivel de confianza se obtiene a partir de la distribución normal estándar, pues la proporción correspondiente al porcentaje de confianza es el área simétrica bajo la curva normal que se toma como la confianza, y la intención es buscar el valor Z de la variable aleatoria que corresponda a tal área.

Por ejemplo: Si se quiere un porcentaje de confianza del 95%, entonces hay que considerar la proporción correspondiente, que es 0.95. Lo que se buscaría en seguida es el valor Z para la variable aleatoria z tal que el área simétrica bajo la curva normal desde -Z hasta Z sea igual a 0.95, es decir, P(-Z<z<Z)=0.95.

Utilizando las tablas, o la función DISTR.NORM.ESTAND.INV() del Excel, se puede calcular el valor de Z, que sería 1.96 (con una aproximación a dos decimales).

Esto quiere decir que P (-1.96<z<1.96)=0.95.

En el caso de que sí se conozca el tamaño de la población entonces se aplica la siguiente fórmula:

Donde: n es el tamaño de la muestra; Z es el nivel de confianza; p es la variabilidad positiva; q es la variabilidad negativa; N es el tamaño de la población; E es la precisión o el error.

La ventaja sobre la primera fórmula es que al conocer exactamente el tamaño de la población, el tamaño de la muestra resulta con mayor precisión y se pueden incluso ahorrarse recursos y tiempo para la aplicación y desarrollo de una investigación.

Por ejemplo: En el Colegio de Bachilleres, una institución de nivel medio superior, se desea realizar una investigación sobre los alumnos inscritos en primer y segundo años, para lo cual se aplicará un cuestionario de manera aleatoria a una muestra, pues los recursos económicos y el tiempo para procesar la información resultaría insuficiente en el caso de aplicársele a la población estudiantil completa.

En primera instancia, suponiendo que no se conoce el tamaño exacto de la población, pero con la seguridad de que ésta se encuentra cerca a los diez millares, se aplicará la primera fórmula.

Se considerará una confianza del 95%, un porcentaje de error del 5% y la máxima variabilidad por no existir antecedentes en la institución sobre la investigación y porque no se puede aplicar una prueba previa.

Primero habrá que obtener el valor de Z de tal forma que la confianza sea del 95%, es decir, buscar un valor de Z tal que P (-Z<z<Z)=0.95. Utilizando las tablas o las funciones de Excel se pueden obtener, o viendo (en este caso) el ejemplo anterior, resulta que Z=1.96.

De esta manera se realiza la sustitución y se obtiene:

Esto quiere decir que el tamaño de la muestra es de 385 alumnos.

Supongamos ahora que sí se conoce el tamaño de la población estudiantil y es de 9,408, entonces se aplicará la segunda fórmula. Utilizando los mismos parámetros la sustitución queda como:

Con lo que se tiene una cota mínima de 370 alumnos para la muestra y así poder realizar la investigación sin más costo del necesario, pero con la seguridad de que las condiciones aceptadas para la generalización (confiabilidad, variabilidad y error) se mantienen.

Error tipo I y Error tipo II

En un estudio de investigación, el error tipo I también mal llamado error tipo alfa (alfa es la probabilidad de que ocurra este error), es el error que se comete cuando el investigador rechaza la hipótesis nula (Ho) siendo ésta verdadera en la población. Es equivalente a encontrar un resultado falso positivo, porque el investigador llega a la conclusión de que existe una diferencia entre las hipótesis cuando en realidad no existe.

En un estudio de investigación, el error tipo II, también llamado error tipo beta (aunque beta es la probabilidad de que exista éste error), se comete cuando el investigador no rechaza la hipótesis nula siendo ésta falsa en la población. Es equivalente a la probabilidad de un resultado falso negativo, ya que el investigador llega a la conclusión de que ha sido incapaz de encontrar una diferencia que existe en la realidad.

Se acepta en un estudio que el valor del error beta debe estar entre el 5 y el 20%.

El poder o potencia del estudio representa la probabilidad de observar en la muestra una determinada diferencia o efecto, si existe en la población. Es el complementario del error tipo II (1-beta).

Nivel de Significación

Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamos dispuesto a correr el riesgo de cometerán error de tipo I, se llama nivel de significación. Esta probabilidad, denota a menudo por se, suele especificar antes de tomar la muestra, de manera que los resultados obtenidos no influyan en nuestra elección.

En la práctica, es frecuente un nivel de significación de 0,05 ó 0,01, si bien se une otros valores. Si por ejemplo se escoge el nivel de significación 0,05 (ó 5%) al diseñar una regla de decisión, entonces hay unas cinco (05) oportunidades entre 100 de rechazar la hipótesis cuando debiera haberse aceptado; Es decir, tenemos un 95% de confianza de que hemos adoptado la decisión correcta. En tal caso decimos que la hipótesis ha sido rechazada al nivel de significación 0,05, lo cual quiere decir que tal hipótesis tiene una probabilidad 0,05 de ser falsa.

Contraste de hipótesis entre un Estadístico y un Parámetro con muestras grandes

Otra operación común en el manejo de distribuciones muestrales es la que consiste en contrastar una hipótesis de partida a través de los resultados de una muestra obtenida de una población estadística. El procedimiento que se sigue consta de los pasos siguientes:

-Proponer una hipótesis que se considera como verdadera, llamada hipótesis nula. La inversa de la hipótesis nula se llama hipótesis alternativa.

-Definir las leyes de probabilidad de la población y de la muestra (en general, se considera una distribución normal).

-Determinar la zona de aceptación de la hipótesis nula, mediante intervalos de confianza.

-Fijar posibles zonas de rechazo, donde no se admite la hipótesis nula, que se conocen genéricamente como región crítica.

Cuando la región crítica está situada a los dos lados de la zona de aceptación de la hipótesis nula, el contraste se denomina bilateral o de dos colas; si está sólo a un lado de la región crítica, se llama unilateral o de una cola.

Regiones críticas y de aceptación en contraste de hipótesis bilateral (arriba) y unilateral (abajo), en el caso de la media.

Nivel de significación

En la contrastación de hipótesis puede producirse un riesgo de rechazo de la hipótesis para algún valor concreto del intervalo de confianza aunque la hipótesis sea válida en el resto del intervalo. Esta probabilidad se denomina riesgo de error o nivel de significación, y se denota por .

*Si se acepta la hipótesis, se considera que la diferencia entre el valor del parámetro contemplado en la hipótesis nula y el que le corresponde según la muestra es no significativa.

*Cuando se rechaza la hipótesis nula para un valor de  = 5%, la diferencia se dice que es significativa.

*Si la hipótesis nula se rechaza con un valor de  = 10%, se dice que la diferencia es muy significativa.

Muestras grandes para la media

En la determinación de intervalos de confianza para la media, si el valor de n es grande (n ³ 30) y se desconoce la desviación típica poblacional, puede sustituirse ésta por la desviación típica de la muestra.

Muestras grandes para la proporción

Ilustración gráfica de las zonas de aceptación y de rechazo en el contraste de hipótesis para la media.

Comportamiento de la variable tipificada en el contraste de hipótesis para la media.

En el cálculo de intervalos de confianza para las proporciones, cuando el valor de n es grande (n ³ 30) y no se conoce el parámetro p, puede sustituirse éste por el parámetro p’ = f / n de la muestra.

Contraste sobre la diferencia de las medias de 2 muestras grandes

Para este caso se pueden emplear las fórmulas anteriores para la definición de los intervalos de confianza, y así tipificar la diferencia de medias. Esto es postular: Ho: µ 1 = µ 2 Es decir, µ 2 1x x −) = 0: no hay diferencia entre las medias H 1: µ 1 ≠ µ 2 Es decir: µ (2 1x x −) ≠ 0: hay diferencia entre las medias.

Entonces siempre será un ensayo de dos colas. Y el estadígrafo Z de comparación es: Z = [ ( 2 1x x −) - (µ2 1x x −) ] / 222121nnσ+σ.

Aplicando la Ho a la ecuación anterior queda: Z = [(21xx −)] /222121nnσ+σ

Y si las muestras son de igual tamaño y desvío: Z = [(21xx −)] / [σ n2]

Ejemplo 1) Se realizaron 36 mediciones repetidas de glucosa, usando una solución calibrada con µ = 90 mg/dl, con dos marcas comerciales diferentes. Los resultados obtenidos para cada caso son: Marca A (media 95 mg/dl y desvío 8 mg/dl), Marca B (media 93 y desvío 7 mg/dl). Ensayar la hipótesis de que ambas marcas son equivalentes. H0: µA =µB. El uso de una marca u otra es indistinto H1: µA ≠ µB Hay diferencia entre ambas marcas:

Donde (21xx −) = 95 – 93 = 2 y σ1-2= 1,772

Entonces resulta:

Z = [(21xx −)] /222121nnσ+σ= 2 / 1,772 = 1,13 (ns)

El valor 2 cae dentro del CI 95% (- 3,5; + 3,5)

Como Z < 1,96 = zα/2 no se puede rechazar la hipótesis nula. Este test no arroja evidencia significativa, como para pensar que hay diferencias entre las marcas A y B.

Ejemplo 2) En una industria farmacéutica se cambió un dosificador líquido por uno nuevo. El anterior tenía un promedio histórico de 5,01 ml con un desvío de 0,08 ml en 100 pruebas de calidad. Al actual se le realizaron 50 pruebas arrojando una media de 5,048 ml y un desvío de 0,05 ml. Con esta información se debe decidir si ambos dosificadores son equivalentes.

H0: µN =µV Son equivalentes. H1: µN ≠ µV

Hay diferencia entre ambos.

Usando la fórmula general donde el supuesto principal es que las varianzas son diferentes, pero los valores esperados son equivalentes entonces resulta: σ1≈ DS1= 0,08 y σ

2≈ DS

2= 0,05 con sus tamaños muestrales de 100 y 50 respectivamente:

Z = [(5,048 – 5,01)] / 10008,05005,022+ Z = 3,56*** ∉ CI 99,9% (-3,29 ; +3,29) µN -µV

= 0,038 ∉ CI 99,9% (-0,035; +0,035)

Hay fuerte evidencia de que no son equivalentes.

Se ha probado que hay una diferencia del 1,2% entre ambos. Lo que significa que cada medicamento fabricado tendrá, en promedio, una cantidad mayor que la histórica lo que implicará un aumento de los costos de producción. Esta evidencia aconseja no usar el nuevo dosificador.

Distribución t de Student

Distribución t de Student
Función de densidad de probabilidad
Función de distribución de probabilidad
Parámetros	$\nu > 0\!$ grados de libertad (real)
Dominio	$x \in (-\infty; +\infty)\!$
Función de densidad (pdf)	$\frac{\Gamma((\nu+1)/2)} {\sqrt{\nu\pi}\,\Gamma(\nu/2)} (1+x^2/\nu)^{-(\nu+1)/2}\!$
Distribución de probabilidad (cdf)	$\frac{1}{2} + \frac{x \Gamma \left( (\nu+1)/2 \right) \,_2F_1 \left ( \frac{1}{2},(\nu+1)/2;\frac{3}{2};-\frac{x^2}{\nu} \right)} {\sqrt{\pi\nu}\,\Gamma (\nu/2)}$ donde $\,_2F_1$ es la función hipergeométrica
Media	$0$ para $ν > 1$ , indefinida para otros valores
Mediana	$0$
Moda	$0$
Varianza	$\frac{\nu}{\nu-2}\!$ para $ν > 2$ , indefinida para otros valores
Coeficiente de simetría	$0$ para $ν > 3$
Curtosis	$\frac{6}{\nu-4}\!$ para $ν > 4$ ,
Entropía	$\begin{matrix} \frac{\nu+1}{2}\left[ \psi(\frac{1+\nu}{2}) - \psi(\frac{\nu}{2}) \right] \\[0.5em] + \log{\left[\sqrt{\nu}B(\frac{\nu}{2},\frac{1}{2})\right]} \end{matrix}$ $ψ$ : función digamma, $B$ : función beta
Función generadora de momentos (mgf)	(No definida)
Función característica

En probabilidad y estadística, la distribución-t o distribución t de Student es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Ésta es la base del popular test de la t de Student para la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones.

La distribución t surge, en la mayoría de los estudios estadísticos prácticos, cuando la desviación típica de una población se desconoce y debe ser estimada a partir de los datos de una muestra.

Especificaciones de la distribución t de Student

Supongamos que X₁, ..., X_n son variables aleatorias independientes distribuidas normalmente, con media μ y varianza σ². Sea

$\overline{X}_n=(X_1+\cdots+X_n)/n$

la media muestral y

$s ^ 2(x) = \frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x}) ^ 2$

la varianza muestral. Entonces, está demostrado que

$Z=\frac{\overline{X}_n-\mu}{\sigma/\sqrt{n}}$

se distribuye según una normal de media 0 y varianza 1.

Gosset estudió una expresión relacionada,

$T=\frac{\overline{X}_n-\mu}{S_n/\sqrt{n}}$

y mostró que T tiene la siguiente función de densidad:

$f(t) = \frac{\Gamma((\nu+1)/2)}{\sqrt{\nu\pi\,}\,\Gamma(\nu/2)} (1+t^2/\nu)^{-(\nu+1)/2}$

Con $ν$ igual a n − 1.

La distribución de T se llama ahora la distribución-t.

El parámetro $ν$ se llama convencionalmente el número de grados de libertad. La distribución depende de $ν$ , pero no de $μ$ o $σ$ ; la independencia de $μ$ y $σ$ es lo que hace a la distribución t tan importante en la teoría y en la práctica. $Γ$ es la función gamma.

Grados de Libertad

En estadística, grados de libertad es un estimador del número de categorías independientes en un test particular o experimento estadístico. Se encuentran mediante la fórmula n-1, donde n=número de sujetos en la muestra (también pueden ser representados por k-1 donde k=número de grupos, cuando se realizan operaciones con grupos y no con sujetos individuales).

Cuando se trata de ajustar modelos estadísticos a un conjunto de datos, los residuos -expresados en forma de vector- se encuenttran habitualmente en un espacio de menor dimensión que aquél en el que se encontraban los datos originales. Los grados de libertad del error los determina, precisamente, el valor de esta menor dimensión.

Un ejemplo aclara el concepto. Supongamos que

$X_1,\dots,X_n\,$ son variables aleatorias, cada una de ellas con media μ, y que

$\overline{X}_n={X_1+\cdots+X_n \over n}$

es la "media muestral". Entonces las cantidades

$X_i-\overline{X}_n\,$

son los residuos, que pueden ser considerados estimaciones de los errores Xi − μ. La suma de los residuos (a diferencia de la suma de los errores, que no es conocida) es necesariamente 0. Esto significa que los residuos están restringidos a encontrarse en un espacio de dimensión n-1 ya que si se conoce el valor de n-1 de estos residuos la determinación del valor del residuo restante es inmediata. Así, se dice que "el error tiene n-1 grados de libertad".

Contraste de hipótesis entre un Estadístico y un Parámetro en muestras pequeñas

Supongamos que estamos en un contexto paramétrico. Es decir, x1, x2 ...... xn es un muestreo aleatorio simple de f siendo un parámetro desconocido. Llamaremos al espacio paramétrico, es decir, el conjunto de los valores posibles para. En los contrastes de hipótesis, lo que interesa es determinar si podemos admitir queo debemos admitir quedondey constituyen una partición de. Ambas hipótesis se tratan de forma diferente. A la primera se le conoce como hipótesis nula. A la segundacomo hipótesis alternativa. Se suele simbolizar:

La hipótesis nula no se considera probada pero es la que mantendremos a menos que los datos evidencien lo contrario. Luego el problema en general es si admitimos o no H0.

Hipótesis simples y compuestas

Llamaremos hipótesis simples a aquellas que especifican un único valor para el parámetro (por ejemplo m=m0).

Llamaremos hipótesis compuestas a las que especifican un intervalo de valores (por ejemplo: m>m0 ; a< m <b)

Se ha definido un contraste de hipótesis como: donde (espacio paramétrico) y Diremos que la hipótesis Hi es simple si contiene un único punto, y diremos que la hipótesis Hi es compuesta si contiene más de un valor.

En particular, si entonces el tamaño del contraste es igual a

Entonces si un contraste tiene hipótesis nula simple, el tamaño del contraste es el valor de la función de potencia en, y por tanto la probabilidad de rechazar la hipótesis nula si es cierta será.

Contrastes de hipótesis simples

Diremos que un contraste es de hipótesis simple cuando las hipótesis nulas y alternativas son de la forma.

En este caso. La función de potencia sólo tiene los valores y

Asociada a un contraste de hipótesis simples existen 2 tipos de error:

 rechazar H0 cuando es cierta. (Error de Tipo I)

 aceptar H0 cuando en realidad es falsa (Error de Tipo II)

Si es un contraste para frente a basada en una región crítica C, los dos tipos de errores tienen las siguientes probabilidades

(Probabilidad de error del tipo I)

(Probabilidad de error del tipo II)

El objetivo obvio es encontrar un contraste que minimice y es claro que podemos conseguir contrastes que hagan. Para ello basta con aceptar siempre que C = 0. Pero entonces: (todo el conjunto de resultados) = 1

Un contraste de hipótesis entre un estadístico y un parámetro en muestras sencillas, requiere una hipótesis que genere predicciones sin ambigüedad de los valores de una variable en una población. Esta hipótesis se denomina hipótesis nula, H0, y el objetivo del contraste es comprobar si podemos rechazarla. Para ello se define una medida de discrepancia entre los datos y la hipótesis y se estudia su distribución cuando H0 es cierta. Se denomina p-valor a la posibilidad de que la medida de discrepancia tome su valor mayor que el observado. Se fija un nivel de significación, que representa la probabilidad de rechazar H0 cuando es cierta. Este nivel permite definir una región de rechazo. Si la discrepancia está en ella, rechazaremos H0. En caso contrario, la asumiremos provisionalmente. Los contrastes pueden ser unilaterales o bilaterales, en función de cómo establezcamos la hipótesis alternativa. Para realizar un contraste sobre la proporción en una población tomamos como medida de discrepancia el error relativo de estimación de acuerdo con H0. Si el tamaño muestral es grande, este error relativo sigue una distribución t de Student, a partir de la cual se construye la región de rechazo.

Contrastes sobre la diferencia

Supongamos que tenemos dos muestras independientes tomadas sobre dos poblaciones, en la que estudiamos una variable de tipo dicotómico (Bernoulli):

$\begin{eqnarray*}\vec{X}_1 &{\equiv}& X_{11},X_{12},\dots,X_{1n_1} \\ \vec{X}_2 &{\equiv}& X_{21},X_{22},\dots,X_{2n_2} \end{eqnarray*}$

Si X₁ y X₂ contabilizan en cada caso el número de éxitos en cada muestra se tiene que cada una de ellas se distribuye como una variable aleatoria binomial:

$\begin{eqnarray*}X_1 &=& \sum_{i=1}^{n_1}X_{1i}\:{\leadsto}{ {{\bf B} \left( n_1... ...i=1}^{n_2}X_{2i}\:{\leadsto}{ {{\bf B} \left( n_2,p_2 \right)} } \end{eqnarray*}$

de modo que los estimadores de las proporciones en cada población tienen distribuciones que de un modo aproximado son normales (cuando n₁ y n₂ son bastante grandes)

$\begin{eqnarray*}\hat{P_1}=\frac{X_1}{n_1} {\: \stackrel{\approx}{\leadsto}\:} {... ...leadsto}\:} { {{\bf N} \left( p_2,\frac{p_2 q_2}{n_2} \right)} } \end{eqnarray*}$

El contraste que nos interesa realizar es el de si la diferencia entre las proporciones en cada población es una cantidad conocida $\Delta$

$\begin{displaymath}H_0\:\: :\: \: p_1-p_2 = \Delta \end{displaymath}$

Si H₀ fuese cierta se tendría que

$\begin{displaymath}\hat{P_1}-\hat{P_2}{\: \stackrel{\approx}{\leadsto}\:}{ {{\bf... ..._{\Delta},\frac{p_1 q_1}{n_1} + \frac{p_2 q_2}{n_2} \right)} } \end{displaymath}$

Desafortunadamente ni p₁ ni p₂ son conocidos de antemano y utilizamos sus estimadores, lo que da lugar a un error que es pequeño cuando los tamaños muestrales son importantes:

$\begin{displaymath}{ \mbox{\fbox{$\displaystyle \frac{(\hat{p_1}-\hat{p_2})-\De... ...{\approx}{\leadsto}\:}{ {{\bf N} \left( 0,1 \right)} } $ } } } \end{displaymath}$

Contraste bilateral

El contraste bilateral sobre la diferencia de proporciones es

$\begin{displaymath}\left\{ \begin{array}{l} H_0\: : \: p_1-p_2=\Delta \\ \mbox{\it } \\ H_1\: : \: p_1-p_2\neq \Delta \end{array}\right. \end{displaymath}$

Entonces se define

$\begin{displaymath}Z_{exp} = \frac{(\hat{p_1}-\hat{p_2})-\Delta}{ \sqrt{\display... ...rac{\hat{p}_1\hat{q}_1}{n_1} +\frac{\hat{p}_2\hat{q}_2}{n_2}}} \end{displaymath}$

y se rechaza la hipótesis nula si $Z_{exp}<-z_{1-\alpha/2}$ o si $Z_{exp}>z_{1-\alpha/2}$

Contrastes unilaterales

En el contraste

$\begin{displaymath}% \left\{ \begin{array}{l} H_0\: : \: p_1-p_2=\Delta \\ \mbo... ...it } \\ H_1\: : \: p_1-p_2< \Delta \end{array}\right. \right) \end{displaymath}$

se rechazará H₀ si $Z_{exp}<-z_{1-\alpha}$ . Para el test contrario

$\begin{displaymath}\left\{ \begin{array}{l} H_0\: : \: p_1-p_2=\Delta \\ \mbox{... ...it } \\ H_1\: : \: p_1-p_2> \Delta \end{array}\right. \right) \end{displaymath}$

se rechaza H₀ si $Z_{exp}>z_{1-\alpha}$ .

Aplicaciones de los contrastes de hipótesis

Los contrastes de hipótesis, como la inferencia estadística en general, son herramientas de amplio uso en la ciencia en general. En particular, la moderna Filosofía de la ciencia desarrolla el concepto de falsabilidad de las teorías científicas basándose en los conceptos de la inferencia estadística en general y de los contrastes de hipótesis. En este contexto, cuando se desea optar entre dos posibles teorías científicas para un mismo fenómeno (dos hipótesis) se debe realizar un contraste estadístico a partir de los datos disponibles sobre el fenómeno que permitan optar por una u otra.

Las técnicas de contraste de hipótesis son también de amplia aplicación en muchos casos, como: ensayos clínicos de nuevos medicamentos, control de calidad, encuestas, entre otros.

Infografía

www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.7/p2.html - 13k - es.wikipedia.org/wiki/Muestreo_en_estadística - 24k

www.uaq.mx/matematicas/estadisticas/xu5.html - 20k

www.cig.ensmp.fr/~hubert/glu/IN-ES-ST.HTM - 35k

www.universidadabierta.edu.mx/SerEst/Apuntes/VelascoRoberto_EstadistInferencial.htm - 456k

www.ugr.es/~aquiran/docencia/apuntes/errores.pdf

http://es.wikipedia.org/wiki/Teorema_del_l%C3%ADmite_central

http://es.wikipedia.org/wiki/Grados_de_libertad_%28estad%C3%ADstica%29