República Bolivariana de Venezuela
Ministerio de Educación Superior
Universidad Yacambú
Vicerrectorado estudios a distancia
Estadística Inferencial
Trabajo 7
Realizado por:
Gustavo Jaime
CI Nº 11962050
Barquisimeto; Noviembre 2007
Muestreo
Aleatorio
Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se
asigna un número a cada individuo de la población y 2) a través de algún medio
mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números
aleatorios generados con una calculadora u ordenador, etc)
se eligen tantos sujetos como sea necesario para completar el tamaño de muestra
requerido.
Este procedimiento, atractivo por su
simpleza, tiene poca o nula utilidad práctica cuando la población que estamos
manejando es muy grande.
Podemos aquí mencionar que para el caso
de que se estuviese estudiando una proporción dentro de la población (una
elección de candidato, la aceptación o rechazo de una propuesta en una
comunidad, la presencia o ausencia de una característica hereditaria), y el en
caso de un muestreo aleatorio simple, la estimación que se puede hacer de la
proporción buscada a partir de la proporción hallada en la muestra se obtiene
mediante la construcción de un intervalo de confianza:
= P ± tolerancia de la muestra
Donde es la proporción buscada
en la población y P es la proporción presente en la muestra.
Por otro lado, la tolerancia
de la muestra está relacionada directamente con el nivel de confianza y se obtiene a partir de la
distribución normal al igual que como se obtuvo para el cálculo del tamaño de las muestras. La representaremos
con Z para obtener la fórmula:
Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior,
numerar todos los elementos de la población, pero en lugar de extraer n números
aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un
número elegido al azar, y los elementos que integran la muestra son los que
ocupan los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es
decir se toman los individuos de k en k, siendo k el resultado de dividir el
tamaño de la población entre el tamaño de la muestra: k=N/n. El número i que
empleamos como punto de partida será un número al azar entre 1 y k.
El riesgo se este tipo de muestreo está
en los casos en que se dan periodicidades en la población ya que al elegir a
los miembros de la muestra con una periodicidad constante (k) podemos
introducir una homogeneidad que no se da en la población. Imaginemos que
estamos seleccionando una muestra sobre listas de 10 individuos en los que los
5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo
aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo
mujeres, no podría haber una representación de los dos sexos.
Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan
los anteriores ya que simplifican los procesos y suelen reducir el error
muestral para un tamaño dado de la muestra. Consiste en considerar categorías
típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a
alguna característica (se puede estratificar, por ejemplo, según la profesión,
el municipio de residencia, el sexo, el estado civil, etc).
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los
estratos de interés estarán representados adecuadamente en la muestra. Cada
estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos
que formarán parte de la muestra. En ocasiones las dificultades que plantean
son demasiado grandes, pues exige un conocimiento detallado de la población. (tamaño geográfico, sexos, edades,...).
Decisión
estadística
Constituye
una herramienta básica para la toma de decisiones, basadas en evidencia
científica. La manera de hacerlo es plantear las hipótesis posibles y luego
efectuarle una prueba o test estadístico.
Llamada en algunas obras: la docimasia estadística. Cuando una conclusión se
valida con un test estadístico se la llama de tipo cuantitativo,
en caso contrario la decisión adoptada es de tipo cualitativo, o sea,
una decisión tomada en forma subjetiva. El método consiste en definir una
probabilidad de aceptación del orden del 95% (o rechazo) de una hipótesis de
trabajo planteada, que permite calcular los valores críticos (o límites de
aceptación) de un estadígrafo calculado a partir de los valores medidos. La
importancia de este tema es muy grande. Basta decir que el objeto final de
Diferencia entre Estadística Descriptiva e Inferencial
Ambas
ramas (descriptiva e inferencial) comprenden la estadística
aplicada.
La estadística
descriptiva es una parte de la estadística que se dedica a analizar y
representar los datos. Este análisis es muy básico, pero fundamental en todo
estudio. Aunque hay tendencia a generalizar a toda la población las primeras
conclusiones obtenidas tras un análisis descriptivo, su poder inferencial es
mínimo y debería evitarse tal proceder. Otras ramas de la estadística se
centran en el contraste de
hipótesis y su generalización a la población.
Algunas de las técnicas
empleadas en este primer análisis de los datos se enumeran más abajo en el
listado de conceptos básicos. Básicamente, se lleva a cabo un estudio
calculando una serie de medidas de
tendencia central, para ver en qué medida los datos se agrupan o dispersan
en torno a un valor central.
*La estadística
descriptiva, que se dedica a los métodos de recolección,
descripción, visualización y resumen de datos originados a partir de los
fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente.
Ejemplos básicos de descriptores numéricos son la media
y la desviación estándar.
Resúmenes gráficos incluyen varios tipos de figuras y gráficos.
La inferencia
estadística es una parte de la Estadística que comprende los métodos y
procedimientos para deducir propiedades (hacer inferencias) de una población,
a partir de una pequeña parte de la misma (muestra).
La bondad de estas deducciones
se mide en términos probabilísticos, es decir, toda
inferencia se acompaña de su probabilidad de acierto.
La estadística inferencial
comprende:
La inferencia
estadística, que se dedica a la generación de los modelos, inferencias y predicciones asociadas a los
fenómenos en cuestión teniendo en cuenta lo aleatorio e incertidumbre en las
observaciones. Se usa para modelar patrones en los datos y extraer inferencias
acerca de la población de estudio. Estas inferencias pueden tomar la forma de
respuestas a preguntas si/no (prueba de hipótesis),
estimaciones de características numéricas (estimación), pronósticos de futuras observaciones,
descripciones de asociación (correlación) o modelamiento
de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento
incluyen ANOVA, series de tiempo y minería de datos.
Muestras
y Población
Algo importante que hay que mencionar
es que no siempre se trabaja con todos los datos. Esto por diversas razones,
que pueden ser desde prácticas hasta por economía. Por ejemplo, resultaría muy
costoso obtener los datos de todos
los seres humanos, o impráctico (y a la vez destructivo) obtener como datos el
tiempo en el que se funden las bombillas producidas por una cierta marca
realizando la medición de toda
la producción. El estudio conduciría a la empresa a la ruina, pues la
producción entera desaparecería.
Por esta razón se considera un
subconjunto del total de los casos, sujetos u objetos que se estudian y que se
les obtienen los datos. La población, entonces, es el total hipotético de los datos que se
estudian o recopilan. Ante la imposibilidad ocasional de conseguir a la
población, entonces se recurre a la muestra, que viene siendo un subconjunto de los datos de la
población, pero tal subconjunto tiene que contener datos que pueden servir para
posteriores generalizaciones de las conclusiones
Diferencias entre muestra y
población
|
|
Población |
Muestra |
|
|
|
|
|
Definición |
Colección de elementos considerados |
Parte o porción de la población seleccionada para
su estudio |
|
Características |
“Parámetros” |
“Estadísticas” |
|
Símbolos |
Tamaño de la población = N |
Tamaño de la muestra = n |
|
|
Media de la población = |
Media de la muestra = |
|
|
Desviación estándar de la población = |
Desviación estándar de la muestra = s |
Técnicas de Muestreo
Forman
parte de este tipo de muestreo todos aquellos métodos para los que puede
calcularse la probabilidad de extracción de cualquiera de las muestras
posibles. Este conjunto de técnicas de muestreo es el más aconsejable, aunque
en ocasiones no es posible optar por él. En este caso se habla de muestras
probabilísticas, pues no es razonable hablar de muestras representativas dado
que no conocemos las características de la población.
El
muestreo aleatorio simple puede ser de dos tipos:
Sin
reposición de los elementos: cada elemento extraído se descarta para la subsiguiente
extracción. Por ejemplo, si se extrae una muestra de una "población"
de bombillas para estimar la vida media de las bombillas que la integran, no
será posible medir más que una vez la bombilla seleccionada.
Con
reposición de los elementos: las observaciones se realizan con reemplazamiento
de los individuos, de forma que la población es idéntica en todas las
extracciones. En poblaciones muy grandes, la probabilidad de repetir una
extracción es tan pequeña que el muestreo puede considerarse sin reposición
aunque, realmente, no lo sea.
Para realizar
este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción
de números aleatorios
mediante ordenadores, calculadoras o tablas construidas al efecto.
Consiste
en la división previa de la población de estudio en grupos o clases que se
suponen homogéneos respecto a característica a estudiar. A cada uno de estos
estratos se le asignaría una cuota que determinaría el número de miembros del
mismo que compondrán la muestra.
Según la cantidad de elementos
de la muestra que se han de elegir de cada uno de los estratos, existen dos
técnicas de muestreo estratificado:
Asignación
proporcional: el tamaño de cada estrato en la muestra es proporcional a su tamaño en la
población.
Asignación óptima: la muestra recogerá
más individuos de aquellos estratos que tengan más variabilidad. Para ello es
necesario un conocimiento previo de la población.
Por
ejemplo, para un estudio de opinión, puede resultar interesante estudiar por
separado las opiniones de hombres y mujeres pues se estima que, dentro de cada
uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está
compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra que
contenga también esa misma proporción.
Se utiliza
cuando el universo es de gran tamaño o ha de extenderse en el tiempo. Primero
hay que identificar las unidades y relacionarlas con el calendario (cuando
proceda). Luego hay que calcular una constante, que se denomina coeficiente de
elevación K= N/n; donde N es el tamaño del universo y n el tamaño de la
muestra. Determinar en qué fecha se producirá la primera extracción, para ello
hay que elegir al azar un número entre 1 y K; de ahí en adelante tomar uno de
cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta
la periodicidad del fenómeno.
Cuando la
población se encuentra dividida, de manera natural, en grupos que se suponen
que contienen toda la variabilidad de la población, es decir, la representan
fielmente respecto a la característica a elegir, pueden seleccionarse sólo
algunos de estos grupos o conglomerados para la realización del estudio.
Dentro de
los grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las
personas a encuestar, y podría aplicársele el instrumento de medición a todas
las unidades, es decir, los miembros del grupo, o sólo se le
podría aplicar a algunos de ellos, seleccionados al azar. Este método tiene la
ventaja de simplificar la recogida de información muestral.
Cuando,
dentro de cada conglomerado, se extraen los individuos que formarán parte de la
muestra por m.a.s., el muestreo se llama bietápico.
Las ideas
de estratificación y conglomerados son opuestas. El primer método funciona
mejor cuanto más homogénea es la población respecto del estrato, aunque más
diferentes son éstos entre sí. En el segundo, ocurre lo contrario. Los
conglomerados deben presentar toda la variabilidad, aunque deben ser muy
parecidos entre sí.
Aquel para
el que no puede calcularse la probabilidad de extracción de una determinada
muestra.
Hay dos
tipos:
La
extracción de la muestra y su tamaño para ser representativa se valora de forma
subjetiva. Se basa en una buena estrategia y el buen juicio del investigador.
Se puede elegir las unidades del muestreo. Un caso frecuente es tomar elementos
que se juzgan típicos o representativos de la población, y suponer que los
errores en la selección se compensarán unos con otros. El problema que plantea
es que sin una comprobación de otro tipo, no es posible saber si los casos
típicos lo son en realidad, y tampoco se conoce como afecta a esos casos
típicos los posibles cambios que se producen.
Estadístico
Un estadístico es una medida cuantitativa, derivada de un conjunto de datos de
una muestra
con el objetivo de estimar o contrastar características de una población
o modelo estadístico.
Más formalmente un estadístico
es una función medible que dado una muestra estadística de valores, les asigna
un número que sirve para estimar los parámetros de la distribución de la que
procede la muestra. Así por ejemplo la media muestral de valores sirve para
estimar el valor esperado de una variable, la varianza muestral de una muestra
amplia sirve para estimar la varianza de la población, etc.
Parámetro
En Estadística, se llama parámetro a un valor
representativo de una población,
como la media aritmética,
una proporción o su desviación típica.
En Ciencias de
la computación, un parámetro
o argumento
es una variable que puede ser recibida por una subrutina.
Distribución en el
Muestreo:
Medias
El modelo de
Gauss para las distribuciones de medias muestrales se
puede aplicar para muestras de tamaño treinta o mayores (n ≥ 30) donde µ
e = µx
=X y σ
e = σ / n; por lo
tanto el estadígrafo Z para poder compararlo con el valor crítico de tablas Zα, será:Z
= n-Xσ/µ donde σ es desconocido y se lo
aproxima con DS.
Ejemplo
de calibración: Se realizaron 36 mediciones repetidas de una misma magnitud clínica: glucosa;
usando una solución calibrada con µ = 90 mg/dl, los resultados obtenidos arrojan una media de 95 mg/dl y un desvío estándar de 8 mg/dl. Ensayar la hipótesis de que el sistema de medición
está calibrado (en exactitud) con un nivel de confianza adecuado.
Aquí
conviene plantear la igualdad como una hipótesis nula.
Ho: µ = 90 mg/dl y el sistema está calibrado
en exactitud. H1: µ ≠ 90 mg/dl
y el sistema no está calibrado, tiene un error de tipo sistemático.
Varianzas
El modelo de
Gauss para las distribuciones de varianzas muestrales
se puede aplicar para muestras de tamaño cien o mayores (N ≥ 100), donde
µ e = µ σ2 =DS2 y SE (σ
2) = σ σ2= σ22/n.
Por lo
tanto, el estadígrafo Z para poder compararlo con el valor crítico de tablas Zα, será: Z = 2/n σσ
DS 222− donde σ es desconocido y se lo postula con Ho.
Ejemplo
de calibración: Continuando con el caso anterior, el investigador completa las 100
muestras obteniendo una nueva media de 94,6 mg/dl con un desvío de 9,65 mg/dl.
De los libros de texto surge que la dispersión aceptada para la determinación
de Glucosa viene dada por un co-eficiente de
variación del 10%. Se desea analizar si la dispersión encontrada en el
experimento es menor, o por lo menos igual que la aceptable.
El CV% = 10% significa: 0,1 = σ max
/ µ = σ max / 90. De allí surge σ max.= 9 mg/dl. Se plantean: H0:
σ ≤ 9 mg/dl y el
sistema tiene una dispersión aceptable. H1: σ > 9 mg/dl y el error casual es muy grande. El sistema no está
calibrado en precisión.
Por lo
tanto, se trata de un ensayo de una sola cola y el estadígrafo de comparación
se saca con: Z = 2 / σσ DS 222−=
2/100)9)9) (9,6522((−2= 1,06
Los valores
críticos de tablas son: Z 0,95= 1,645; Z 0,99 = 2,33 y Z 0,999 = 3,09
Como Z < Zα no se rechaza
Por lo
tanto, los resultados no fueron significativos. Esto es, no hay evidencia
suficiente como para pensar que la dispersión no sea aceptable. El error casual
no es significativo. Dicho en otros términos, la precisión del sistema de
medición es menor que la máxima admisible recomendada en los libros de texto.
La forma de expresarlo puede ser:
a.- no se rechaza la
hipótesis nula: Z = 1,06 (ns) y también con 95% CI
(-∞; +87,2);
b.- no hay evidencia que
pruebe una dispersión no aceptable.
Teorema del límite central
El Lema de Límite Central o Teorema Central del Límite indica que,
bajo condiciones muy generales, la distribución
de la suma de variables aleatorias
tiende a una Distribución Normal
(también llamada Distribución Gaussiana) cuando la
cantidad de variables es muy grande.
Teorema: Sea X1, X2, ..., Xn
una muestra aleatoria de una distribución con media μ y varianza σ2.
Entonces, si n es suficientemente grande, la variable aleatoria
tiene aproximadamente una
distribución normal con y
.
También se cumple que si
tiene aproximadamente una
distribución normal con y
.
Cuanto más grande sea el valor de n, mejor será la aproximación.
El Teorema
del Límite Central garantiza una distribución normal cuando n es
suficientemente grande.
Existen
diferentes versiones del teorema, en función de las condiciones utilizadas para
asegurar la convergencia. Una de las más simples establece que es suficiente
que las variables que se suman sean independientes,
idénticamente distribuidas,
con valor esperado y varianza finitas.
La
aproximación entre las dos distribuciones es, en general, mayor en el centro de
las mismas que en sus extremos o colas, motivo por el que se prefiere el nombre
"Teorema del Límite Central" ("central" califica al límite,
más que al teorema).
Este
teorema, perteneciente a
Estimación puntual y Estimación por intervalos
Estimación puntual
Consiste
en la estimación del valor del parámetro mediante un sólo valor, obtenido de
una fórmula determinada. Por ejemplo, si se pretende estimar la talla media de
un determinado grupo de individuos, puede extraerse una muestra y ofrecer como
estimación puntual la talla media de los individuos.
Consiste
en la obtención de un intervalo dentro del cual estará el valor del parámetro
estimado con una cierta probabilidad. En la estimación por intervalos se usan
los siguientes conceptos:
Si no se
conoce, puede obtenerse una aproximación en los datos aportados por la
literatura científica o en un estudio piloto. También hay métodos para calcular
el tamaño de la muestra que prescinde de este aspecto. Habitualmente se usa
como medida de esta variabilidad la desviación típica
poblacional y se denota σ.
Intervalos de confianza
Se llama intervalo de confianza en estadística a un intervalo
de valores alrededor de un parámetro muestral
en los que, con una probabilidad o nivel de confianza determinado, se situará
el parámetro
poblacional a estimar. Si α es el error aleatorio que se quiere cometer, la
probabilidad será de 1 − α. A menor nivel
de confianza el intervalo será más preciso, pero se cometerá un mayor error.
Para
comprender las siguientes fórmulas, es necesario conocer los conceptos de
variabilidad del parámetro, error, nivel de confianza, valor crítico y valor
α (véase Estimación por intervalos).
Un
intervalo de confianza es, pues, una expresión del tipo [θ1,
θ2] ó θ1 ≤ θ ≤ θ2,
donde θ es el parámetro a estimar. Este intervalo contiene al parámetro
estimado con una determinada certeza o nivel de confianza 1-α.
Al ofrecer
un intervalo de confianza se da por supuesto que los datos poblacionales se
distribuyen de un modo determinado. Es habitual que lo hagan mediante la distribución normal.
La construcción de intervalos de confianza se realiza usando la desigualdad de Chebyshev
Intervalo de confianza
para la media de una población
De una población
de media μ y desviación típica
σ se pueden tomar muestras
de n elementos. Cada una de estas muestras
tiene a su vez una media ().
Se puede demostrar que la media de todas las medias muestrales
coincide con la media poblacional:
Pero
además, si el tamaño de las muestras es lo suficientemente grande, las medias muestrales tienden a una distribución normal
(o gaussiana) con dicha media y una desviación típica
dada por la siguiente expresión:
Si estandarizamos:
En esta
distribución normal de medias se puede calcular el intervalo de confianza donde
se encontrará la media poblacional si sólo se conoce una media muestral (),
con una confianza determinada. Habitualmente se manejan valores de confianza
del 95% y 99%. A este valor se le llamará 1 − α
(debido a que α es el error que se cometerá, un
término opuesto).
Para ello
se necesita calcular el punto Xα / 2 —o mejor dicho su versión estandarizada Zα / 2— junto con su "opuesto en la
distribución" X − α / 2.
Estos puntos delimitan la probabilidad para el intervalo, como se muestra en la
siguiente imagen:
Dicho punto es el número tal
que:
Y en la versión estandarizada
se cumple que:
Z − α / 2 = − Zα / 2
Así:
Haciendo operaciones es
posible despejar μ para obtener el intervalo:
Resultado el intervalo de
confianza:
Si σ
no es conocida y n es grande (p.e. ≥ 30):
, donde s es la desviación típica de una
muestra.
Aproximaciones para el valor Zα / 2 para los niveles de confianza estándar son
1,96 para 1 − α = 95% y 2,33 para 1 − α = 99%.
Error
Probable
Medida de la variabilidad del muestreo,
igual a 0,6745 veces el error típico. La mitad de una muestra distribuida
normalmente queda dentro del intervalo definido por la media ± 0,6745
desviaciones típicas.
Cuando se
mide una cantidad, ya directa, ya indirectamente, la medida que se obtiene no
es necesariamente el valor exacto de tal medida, ya que el resultado obtenido
estará afectado por errores debidos a multitud de factores. Algo en apariencia
tan sencillo como cronometrar el período del péndulo en el apartado anterior
sufrirá errores debidos a la precisión del cronómetro, los reflejos del
cronometrador, las corrientes de aire, el número de medidas efectuadas...
errores que se propagarán a cualquier cantidad derivada de ésta que queramos
determinar, como por ejemplo velocidad o aceleración.
En estos
casos es necesario estimar el error cometido al efectuar una medida o serie de medidas.
El conjunto de reglas matemáticas dedicado a su estudio se conoce como teoría
de errores, y resulta imprescindible tanto para sacar todo el partido posible a
un conjunto de datos experimentales como para evaluar la fiabilidad de éstos.
El estudio de la teoría de errores es una rama aparte de la matemática por
derecho propio, y por su extensión no se desarrollará aquí. El lector queda
avisado de que lo que sigue es tan sólo un conjunto rápido y necesariamente
breve de las reglas fundamentales más usadas en el ámbito de la teoría de
errores.
1 - Nociones previas.
Si se
efectúa una medida directa de una cantidad física, el valor medido x por lo
general diferirá del valor exacto x o. Se denomina error absoluto de la medida a la diferencia g = x-x o y error relativo al cociente g/x o. El error relativo resulta especialmente relevante porque
nos relaciona el error cometido con el valor
de lo medido. Un error de
Por lo
general, el valor de una medida se da estimando su valor más probable x y
su error,) x. Escribir x±)x significa que cabe esperar razonablemente
que el valor exacto de la cantidad valga cualquier cantidad entre x-)x y
x+)x, con x como valor más probable. La traducción de "cabe
esperar razonablemente" al lenguaje matemático queda fuera del presente
desarrollo.
Existen dos
tipos de errores: sistemáticos y accidentales. Los primeros actúan siempre de
la misma forma para influir en la medida (por ejemplo, una balanza desajustada
que tiende a marcar una masa 10 gr. superior a la real). Estas medidas, si se
producen, producen un error constante. Por contra,
los errores accidentales son de carácter aleatorio, lo que presupone que actúan
con la misma frecuencia tanto con un signo como con el opuesto (esto es, se
tiene igual probabilidad de obtener una medida 5 gr. superior al valor real
como de obtenerla 5 gr. Por debajo).
No se puede
conocer el valor exacto de una cantidad, puesto que siempre existen errores; tampoco
se puede conocer el valor exacto de un error, puesto que dependen de
procesos aleatorios y generalmente incontrolables (aparte de ser una
contradicción en sus propios términos). Sin embargo, es preciso dar un valor de
la medida con su error.
2 - Errores asociados a
una medida.
a) Medidas directas.
Redondeo.
Supóngase que
se efectúa una evaluación directa de una cantidad, x. Se suele en este
caso tomar el propio valor de x como medición de dicha cantidad. Como error se supone la sensibilidad del aparato utilizado en
la medición, esto es, el valor mínimo que el aparato es capaz de medir. Esto
presupone implícitamente que los errores accidentales están fuera de nuestra manipulación,
ya sea porque los hayamos eliminados, ya porque seamos ignorantes de su existencia,
de manera que los únicos errores que aparecen son los de tipo aleatorio.
El error en sí es algo aproximado. Dar un valor de 24.5±
Por ello,
tanto el error como el valor más
probable vienen redondeados convenientemente. Para el error, se supone que basta con dar una, a veces dos,
cifras significativas (es decir, cifras que dan información relevante). Los
criterios habituales son los siguientes:
- Si las dos primeras
cifras significativas son inferiores a 25, se toman dichas cifras para el error. De no ser así, se toma solamente una cifra. Según
eso, el error 0.113 queda convertido
en 0.11, y el 6488.24 se transforma en 6000
- Si la primera cifra
que se descarta es un cinco o más, la última cifra que se guarda se aumenta en
una unidad. Esto es, el valor 0.362 se convierte en 0.4 y no en 0.3
-Una vez redondeado
convenientemente el error, el valor de la medida
se redondea hasta la misma cifra decimal.
Véanse unos cuantos
ejemplos:
Medida
Error
Resultado final
464.2413
0.061
464.24±0.06
6.03
0.0005
6.0300±0.0005
46288
1553
46300±1600
3.218
0.124
3.2±0.1
0.018366
0.00783
0.018±0.008
b) Medidas indirectas.
Propagación de errores.
A veces no se mide una
cantidad directamente, sino por relación con otras cantidades.
Para medir,
por ejemplo, el área de un rectángulo se miden sus lados a,b y se hace uso de la relación S=ab. Si tanto a como b tienen sus cotas de
error, evidentemente también la superficie vendrá
afectada de error. Cómo depende el error de una cantidad derivada de las medidas y errores
fundamentales viene dado mediante la teoría de la propagación de errores.
Para ello se
utiliza el cálculo diferencial. Sea y una función que depende de las
variables independientes x
1, x
2...xn
Se puede
obtener el valor del diferencial de la función y a partir de los diferenciales
de las variables xi por medio de
derivadas parciales: dy' My
Mx 1 dx 1% My Mx 2dx 2%...%My Mx nd xn
En nuestro
caso, y la función que nos da la cantidad medida indirectamente a partir
de las medidas directas de las cantidades x1...xn
(en rigor, xi es cualquier parámetro, variable
o no, que venga dado con un margen de error; el número pi, por ejemplo, sería uno de ellos, ya que nunca se conoce
con una exactitud infinita, si bien en estos casos se supone que se conoce con
un número de cifras decimales tal que el redondeo debido a despreciar las demás
cifras es despreciable). Si los errores son lo suficientemente pequeños, podemos
considerarlos como diferenciales, ya que estos pueden interpretarse como
variaciones infinitesimales. La ecuación que nos da el error de y,) y, es entonces:)y' MyMx1)x 1%MyMx2)x2%...%My
Mxn)xn. Es
posible que algunos de los términos que acompañan a los errores) xi sean positivos o otros sean negativos, en cuyo caso
podría resultar que algunos errores cancelen a otros (por ejemplo, que la base
del rectángulo sea mayor y la altura menor que sus respectivos valores reales).
Sin embargo,
los errores pueden ser tanto por exceso como por defecto, por lo que hay que
considerar la posibilidad de que en el peor de los casos los errores se sumen
de manera que no sólo no se anulen, sino que se refuercen. Para evitarlo, se
considera que las derivadas parciales aparecen en valor absoluto:
Ejemplo.
Supongamos que se mide el radio r y la altura h de un cilindro, obteniendo
un volumen V=Br 2 h. En tal
caso, y=V, x1=r, x2=h y se tendría:)V'MVMr)
r%MVMh) h' 2Brh) r%Br2) h
Si r = 12.6±
obtiene:)V'[email protected]@12.6mm@35.12mm@0.3mm%[email protected]mm)[email protected]mm'
834.1155mm 3 % 29.9256mm 3' 864.04102mm 3.
Vemos que la parte de error correspondiente a)r es
mucho mayor que la de )h, lo quesignifica que para
reducir el error del volumen es mucho
más eficaz reducir el error en la determinación del
radio que en la de la altura. Finalmente, el volumen es V=17516.425 mm 3, lo que tras los redondeos oportunos queda como: V'(17500±900)
mm 3
3 - Errores asociados a
un conjunto de medidas.
a) Valor de la medida y error asociado.
Resulta
práctica habitual realizar varias medidas de una cantidad. Ello permite prevenir
en la medida de lo posible los errores accidentales. La idea consiste en
suponer (más bien confiar en) que dos errores del mismo valor absoluto, pero de
signo contrario, tienen la misma frecuencia. Esto, es, si la medida exacta de
la longitud de un objeto es
Supongamos un
conjunto de N medidas x1, x2,...xn obtenidas
para una cantidad cuyo valor exacto es x. Para dar un valor
representativo del conjunto, se toma el valor medio de dichas medidas, xo: x o'x
1% x2%...xNN / 1NjNi'1i
A cualquier
medida xi se le adjudica un error gi igual a la
diferencia entre dicha medida y el valor medio (que ahora se toma como exacto):
gi= xi- xo. ¿Cuál es, entonces, el error asociado al conjunto de medidas? Puede hacerse un
primer intento y definir el error medio como el valor
medio de los errores (su suma dividida por N); sin embargo, se demuestra
fácilmente que dicha cantidad es nula sea cuales sean los valores
xi: go'1NjNi'
1gi'1NjNi' 1(xi&xo)'
1NjNi' 1xi& 1NNxo'xo&xo'0
Este
resultado, paradójico en apariencia, no es más que un reflejo del significado
del término valor medio. Pare evitarlo, y puesto que los errores pueden serlo
por defecto o por defecto, a veces se define el error medio Fm como la media aritmética de
los valores absolutos de los errores: F m'jNi'1
* gi *N
En la
práctica se usa más que el error medio el llamado error probable que es un error tal que la probabilidad de cometer un error superior a él, en valor absoluto, valga 1/2. Esto es, la mitad de las
veces que se efectúe una medida se obtendrá un error inferior en valor absoluto al error probable. Esto se debe a motivos estadísticos, pero aquí se
hará una deducción intuitiva.
Dicha
deducción se base en el siguiente razonamiento: puesto que el valor medio de
los errores sale cero porque dichos errores tienen signo (los valores medidos
están por encima o por debajo del valor medio), eliminemos el signo. Ya se hizo
en la ecuación anterior por medio de un valor absoluto. Sin embargo, la función
valor absoluto es engorrosa desde el punto de vista analítico. Existe otra
manera de convertir cualquier número real en un valor positivo: elevándolo al
cuadrado. Así que podríamos usar como error del conjunto de medidas
el valor medio de los cuadrados de los errores:
F N'j
N i'
Sin embargo,
en el proceso hemos reducido artificialmente el error, ya que cada error gi,
ya pequeño de por sí, ha sido elevado al cuadrado. El arreglo es inmediato: si
hemos elevado al cuadrado, saquemos la raíz cuadrada para compensar:
F N'1 Nj Ni'1g2i'1NjNi'1(xi&xo)2
Esta
cantidad, que se puede obtener mediante la estadística de Gauss por
procedimientos más rigurosos, es el llamado error cuadrático medio, y es el que habitualmente da como error de un conjunto de medidas siempre que éste no sea inferior al error instrumental, esto es, al error mínimo imputable a la sensibilidad del aparato
(mínima marca en una regla, menor intensidad mensurable en un amperímetro, etc). De lo contrario, un conjunto de medidas tales como:
10.0, 10.0, 10.1, 10.0,
Si se desea
afinar más la estadística del sistema, se define el error de manera diferente.
Esto se debe
a que la expresión anterior es válida solamente si x o fuese el valor exacto de
la medida; como no lo conocemos, hemos de sustituirlo por el valor medio. Ello
puede dar discrepancias no despreciables cuando el número de medidas N es
pequeño. Para el caso límite
N=1, suponer
que la única medida tomada coincide con el valor exacto nos induciría a llegar
a la absurda conclusión de que el error cuadrático de dicha observación es
nulo. Si se admite que el conjunto de N medidas sigue la llamada ley de Gauss,
puede demostrarse que al usar el valor medio en lugar del valor exacto, la ley
correcta tiene la expresión:
F N&1'j Ni'1g2iN(N&1)'jNi'1(xi&xo)2N(N&1)
Puede verse
fácilmente que el cociente entre las dos cantidades es igual a la raíz cuadrada
de (N-1)/N, cantidad que tiende a la unidad para valores de N crecientes. En la
práctica, dicha diferencia resulta poco relevante, ya que la operación de
redondeo borra las diferencias entre ambos errores. Para el conjunto de datos
(51.00, 51.00, 51.50, 52.5, 52.0, 50.50, 53.50), se obtiene x o =51.71428...,
FN=0.95831...y F N-1=1.035099... Sea cual sea el error que se considere, los
datos arrojarían un valor final de 52 ± 1 (nunca hay que olvidar que cualquier
valor de error que se de será simplemente una estimación del error probable,
nunca un valor exacto de tal error).
En la
práctica, habida cuenta de la escasa diferencia entre ambos errores, se suele
dar como resultado de un conjunto de medidas el valor medio x o y el
error cuadrático medio F
N (a no ser que FN sea
menor que el error nstrumental del aparato de medida,
en cuyo caso se tomará éste último). Únicamente tiene interés para nosotros
emplear F N-1 cuando el número de medidas no es muy grande y estamos
interesados en obtener información estadística más completa del sistema.
b) Número de medidas
Si se hacen
pocas determinaciones, el valor obtenido para la cantidad medida podrá estar afectado
por importantes errores; si se efectúan demasiadas medidas, se está derrochando
esfuerzo sin obtener mejoras sustanciales en precisión. En general, el valor
del error asociado a un conjunto de medidas decrece de manera proporcional a la
raíz cuadrada del número total de medidas. Es decir, el error asociado a 500
medidas es del orden de diez veces menor que el debido a solamente cinco
medidas.
Es evidente,
no obstante, que no se puede esperar una reducción del error a valores
arbitrariamente pequeños aumentando el número de medidas, ya que toparemos en
última instancia con errores sistemáticos, límites en la sensibilidad del
instrumento, etc; de manera que con una regla
dividida en milímetros no se puede apreciar más allá del milímetro,
independientemente del número de medidas efectuado. ¿Cuál es el número de
medidas adecuado para una observación estadísticamente significativa?
Descartados los casos en que, por las características del experimento,
solamente se pueda obtener una medición, el mínimo número de medidas admisible
es de tres, ya que si hacemos una sola medida cabe la duda de saber si éste
resultado es el verdadero, y si hacemos
Dos resulta
arbitrario seleccionar entre ellas (¿está el valor exacto en un término medio,
o hay una Medida afectada de error accidental y otra no?). El procedimiento
recomendado aquí (no el único ni, necesariamente, el mejor) es el siguiente:
a) Se calcula la
dispersión D, que es la diferencia entre los valores extremos (mayor y menor)
de las medidas realizadas.
b) Si la dispersión es
igual o menor que el error instrumental, es dicho error el que figurará como error
del conjunto de medidas.
c) Si la dispersión es
mayor que el error instrumental, se calcula la tasa de dispersión T d, que no
es sino la dispersión relativa (respecto al valor medio) en tantos por ciento: d'
100@D x o Según sea el valor de
T d se elige el número de medidas a realizar (la siguiente tabla es
orientativa):T d Nº medidas. menor del 2% bastan con las tres
medidas entre 2% y 8% se toman 6 medidas entre 8% y 15% se toman 15 medidas mayor
del 15% se toman 50 medidas (mínimo)
Por lo
general, si la tasa de desviación es superior al 15% se suele descartar el
conjunto de medidas y repetir el experimento de manera más cuidadosa y
procurando minimizar cualquier tipo de error (aparatos más sensibles, muestras
aisladas de las vibraciones, etc). En caso de que el
carácter del experimento haga que las medidas difieran de modo natural entre
sí, se efectuará un conjunto elevado de mediciones.
4 - Regresión lineal:
mínimos cuadrados.
En un
experimento típico, se cambia el valor de una variable independiente X para observar
el comportamiento de otra variable Y dependiente de la anterior; por ejemplo,
el cambio de la densidad del agua (Y) con la temperatura (X). Cuando hacemos
una representación gráfica
Y(X) (Y en el eje
vertical de ordenadas y X en el eje horizontal de abscisas), la curva obtenida tendrá
una forma dada. En el laboratorio, al reproducir un experimento de este tipo, obtendríamos
una gráfica idéntica a la arrojada por la teoría. Sin embargo, la existencia de
muchas fuentes de indeterminación (no sólo errores sino también las
simplificaciones hechas en la propia teoría, influencias de otros factores, etc) hacen que los datos experimentales no coincidan
exactamente con la curva teórica, sino que tiendan a disponerse alrededor de
ésta.
Surge entonces la
pregunta de qué curva "ajusta" mejor los datos experimentales. Con
"ajusta" se quiere decir, no que la curva pase exactamente por todos
los puntos experimentales, sino que tienda a estar lo más cerca posible de
todos ellos en conjunto.
El ajuste de
datos experimentales a curvas es extremadamente importante, no sólo para poder
comparar con la teoría, sino incluso para poder establecer la validez o no de
la misma teoría. El caso general es complejo y laborioso, así que nos
limitaremos a una curva en la que la dependencia entre X e Y es
de tipo lineal (si se duplica X, se duplica Y). Supongamos que
para cada valor Xi de la variable
independiente se obtiene un valor Yi de la
variable dependiente (aquí los subíndices i denotan distintos valores de X e
Y, y no guardan relación alguna con los valores de una misma cantidad).
El problema consiste en encontrar una curva del tipo Y = a + bX, (una recta, en este caso) que ajuste mejor el conjunto
de datos; en concreto, se buscan los valores de a y b tales que
la suma de distancias entre la recta y todos los puntos experimentales sea
mínima.
Cálculo
del Tamaño de la muestra
Para calcular el tamaño de una muestra
hay que tomar en cuenta tres factores:
El porcentaje de confianza con el cual
se quiere generalizar los datos desde la muestra hacia la población total.
El porcentaje de error que se pretende
aceptar al momento de hacer la generalización.
El nivel de variabilidad que se calcula
para comprobar la hipótesis.
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe
para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje
del 100% equivale a decir que no existe ninguna duda para generalizar tales
resultados, pero también implica estudiar a la totalidad de los casos de la
población.
Para evitar un costo muy alto para el
estudio o debido a que en ocasiones llega a ser prácticamente imposible el
estudio de todos los casos, entonces se busca un porcentaje de confianza menor.
Comúnmente en las investigaciones sociales se busca un 95%. El error o porcentaje de error equivale a elegir una probabilidad de aceptar
una hipótesis que sea falsa como si fuera verdadera, o la inversa: rechazar a
hipótesis verdadera por considerarla falsa. Al igual que en el caso de la
confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%,
entonces la muestra es del mismo tamaño que la población, por lo que conviene
correr un cierto riesgo de equivocarse.
Comúnmente se aceptan entre el 4% y el
6% como error, tomando en cuenta de que no son complementarios la
confianza y el error.
La variabilidad es la probabilidad (o
porcentaje) con el que se aceptó y se rechazó la hipótesis que se quiere
investigar en alguna investigación anterior o en un ensayo previo a la
investigación actual. El porcentaje con que se aceptó tal hipótesis se denomina
variabilidad positiva y se
denota por p, y el porcentaje con el que se rechazó se la hipótesis es
la variabilidad negativa,
denotada por q.
Hay que considerar que p y q
son complementarios, es decir, que su suma es igual a la unidad: p+q=1.
Además, cuando se habla de la máxima variabilidad, en el caso de no existir
antecedentes sobre la investigación (no hay otras o no se pudo aplicar una
prueba previa), entonces los valores de variabilidad es p=q=0.5.
Una vez que se han determinado estos
tres factores, entonces se puede calcular el tamaño de la muestra como a
continuación se expone.
Hablando de una población de alrededor
de 10,000 casos, o mínimo esa cantidad, podemos pensar en la manera de calcular
el tamaño de la muestra a través de las siguientes fórmulas. Hay que mencionar
que estas fórmulas se pueden aplicar de manera aceptable pensando en
instrumentos que no incluyan preguntas abiertas y que sean un total de
alrededor de 30.
Vamos a presentar dos fórmulas, siendo
la primera la que se aplica en el caso de que no
se conozca con precisión el tamaño de la población, y es:
Donde: n es el
tamaño de la muestra; Z es el nivel de confianza; p es
la variabilidad positiva; q es la variabilidad
negativa; E es la precisión o error.
Hay que tomar nota de que debido a que
la variabilidad y el error se pueden expresar por medio de porcentajes, hay que
convertir todos esos valores a proporciones en el caso necesario.
También hay que tomar en cuenta que el
nivel de confianza no es ni un porcentaje, ni la proporción que le
correspondería, a pesar de que se expresa en términos de porcentajes. El nivel
de confianza se obtiene a partir de la distribución normal estándar, pues la
proporción correspondiente al porcentaje de confianza es el área simétrica bajo
la curva normal que se toma como la confianza, y la intención es buscar el
valor Z de la variable aleatoria que corresponda a tal área.
|
Por ejemplo: Si se quiere un porcentaje de confianza del 95%, entonces hay que
considerar la proporción correspondiente, que es 0.95. Lo que se buscaría en
seguida es el valor Z para la variable aleatoria z tal que el
área simétrica bajo la curva normal desde -Z hasta Z sea igual
a 0.95, es decir, P(-Z<z<Z)=0.95. Utilizando las tablas, o la función DISTR.NORM.ESTAND.INV()
del Excel, se puede calcular el valor de Z, que sería 1.96 (con
una aproximación a dos decimales). Esto quiere decir que P (-1.96<z<1.96)=0.95. |
En el caso de que sí
se conozca el tamaño de la población entonces se aplica la siguiente
fórmula:
Donde: n es el
tamaño de la muestra; Z es el nivel de confianza; p es
la variabilidad positiva; q es la variabilidad
negativa; N es el tamaño de la población; E es
la precisión o el error.
La ventaja sobre la primera fórmula es que al
conocer exactamente el tamaño de la población, el tamaño de la muestra resulta
con mayor precisión y se pueden incluso ahorrarse recursos y tiempo para la
aplicación y desarrollo de una investigación.
|
Por ejemplo: En el Colegio de Bachilleres, una institución de nivel medio
superior, se desea realizar una investigación sobre los alumnos inscritos en
primer y segundo años, para lo cual se aplicará un cuestionario de manera
aleatoria a una muestra, pues los recursos económicos y el tiempo para
procesar la información resultaría insuficiente en el caso de aplicársele a
la población estudiantil completa. En primera instancia, suponiendo que no se conoce
el tamaño exacto de la población, pero con la seguridad de que ésta se
encuentra cerca a los diez millares, se aplicará la primera fórmula. Se considerará una confianza del 95%, un
porcentaje de error del 5% y la máxima variabilidad por no existir
antecedentes en la institución sobre la investigación y porque no se puede
aplicar una prueba previa. Primero habrá que obtener el valor de Z de
tal forma que la confianza sea del 95%, es decir, buscar un valor de Z
tal que P (-Z<z<Z)=0.95.
Utilizando las tablas o las funciones de Excel se pueden obtener, o
viendo (en este caso) el ejemplo anterior, resulta que Z=1.96. De esta manera se realiza la sustitución y se
obtiene: Esto quiere decir que el tamaño de la muestra es
de 385 alumnos. Supongamos ahora que sí se conoce el tamaño de la
población estudiantil y es de 9,408, entonces se aplicará la segunda fórmula.
Utilizando los mismos parámetros la sustitución queda como: Con lo que se tiene una cota mínima de 370
alumnos para la muestra y así poder realizar la investigación sin más costo
del necesario, pero con la seguridad de que las condiciones aceptadas para la
generalización (confiabilidad, variabilidad y error) se mantienen. |
Error tipo I y Error tipo II
En un
estudio de investigación, el
error tipo I también mal llamado error tipo alfa (alfa es la
probabilidad de que ocurra este error), es el error que se comete cuando el
investigador rechaza la hipótesis nula (Ho) siendo ésta verdadera
en la población.
Es equivalente a encontrar un resultado falso positivo,
porque el investigador llega a la conclusión de que existe una diferencia entre
las hipótesis cuando en realidad no existe.
En un
estudio de investigación, el
error tipo II, también llamado error tipo beta (aunque beta es la
probabilidad de que exista éste error), se comete cuando el investigador no
rechaza la hipótesis nula siendo
ésta falsa en la población.
Es equivalente a la probabilidad de un resultado falso negativo,
ya que el investigador llega a la conclusión de que ha sido incapaz de
encontrar una diferencia que existe en la realidad.
Se acepta
en un estudio que el valor del error beta debe estar entre el 5 y el 20%.
El poder
o potencia del estudio representa la probabilidad de observar en la muestra una determinada diferencia o
efecto, si existe en la población. Es el complementario del error tipo II
(1-beta).
Nivel de Significación
Al contrastar una cierta hipótesis, la máxima
probabilidad con la que estamos dispuesto a correr el riesgo de cometerán error de tipo I, se
llama nivel de significación. Esta probabilidad, denota a menudo por se, suele
especificar antes de tomar la muestra, de manera que los resultados obtenidos
no influyan en nuestra elección.
En la práctica, es frecuente un nivel de significación de
0,05 ó 0,01, si bien se une otros valores. Si por ejemplo se escoge el nivel de
significación 0,05 (ó 5%) al diseñar una regla de decisión, entonces hay unas
cinco (05) oportunidades entre 100 de rechazar la hipótesis cuando debiera
haberse aceptado; Es decir, tenemos un 95% de confianza de que hemos adoptado
la decisión correcta. En tal caso decimos que la hipótesis ha sido rechazada al
nivel de significación 0,05, lo cual quiere decir que tal hipótesis tiene una
probabilidad 0,05 de ser falsa.
Contraste de hipótesis entre
un Estadístico y un Parámetro con muestras grandes
Otra operación común en el manejo de distribuciones muestrales es la que consiste en contrastar una hipótesis de partida a través de los
resultados de una muestra obtenida de una población estadística. El
procedimiento que se sigue consta de los pasos siguientes:
-Proponer
una hipótesis que se considera como verdadera, llamada hipótesis nula. La inversa de la hipótesis nula se llama hipótesis alternativa.
-Definir
las leyes de probabilidad de la población y de la muestra (en general, se
considera una distribución normal).
-Determinar
la zona de aceptación de la
hipótesis nula, mediante intervalos de confianza.
-Fijar
posibles zonas de rechazo, donde no se admite la hipótesis nula, que se conocen
genéricamente como región crítica.
Cuando
la región crítica está situada a los dos lados de la zona de aceptación de la
hipótesis nula, el contraste se denomina bilateral o de dos colas; si está sólo a un lado de la región
crítica, se llama unilateral o
de una cola.
Regiones
críticas y de aceptación en contraste de hipótesis bilateral (arriba) y
unilateral (abajo), en el caso de la media.
Nivel de significación
En la contrastación de hipótesis puede producirse un
riesgo de rechazo de la hipótesis para algún valor concreto del intervalo de
confianza aunque la hipótesis sea válida en el resto del intervalo. Esta
probabilidad se denomina riesgo de
error o nivel de significación,
y se denota por .
*Si
se acepta la hipótesis, se considera que la diferencia entre el valor del
parámetro contemplado en la hipótesis nula y el que le corresponde según la
muestra es no significativa.
*Cuando
se rechaza la hipótesis nula para un valor de = 5%, la diferencia se
dice que es significativa.
*Si
la hipótesis nula se rechaza con un valor de = 10%, se dice que la
diferencia es muy significativa.
Muestras
grandes para la media
En
la determinación de intervalos de confianza para la media, si el valor de n es
grande (n ³ 30) y se desconoce la desviación típica poblacional, puede
sustituirse ésta por la desviación típica de la muestra.
Muestras
grandes para la proporción
Ilustración
gráfica de las zonas de aceptación y de rechazo en el contraste de hipótesis
para la media.
Comportamiento de la variable tipificada en el contraste
de hipótesis para la media.
En el cálculo de intervalos de confianza para las
proporciones, cuando el valor de n es grande (n ³ 30) y no se conoce el
parámetro p, puede sustituirse éste por el parámetro p’ = f / n de la muestra.
Contraste sobre la
diferencia de las medias de 2 muestras grandes
Para este
caso se pueden emplear las fórmulas anteriores para la definición de los
intervalos de confianza, y así tipificar la diferencia de medias. Esto es
postular: Ho: µ 1 = µ 2 Es decir, µ 2 1x x −) = 0: no hay diferencia
entre las medias H 1: µ 1 ≠ µ 2 Es decir: µ (2 1x x −) ≠ 0:
hay diferencia entre las medias.
Entonces
siempre será un ensayo de dos colas. Y el estadígrafo Z de comparación es: Z = [ ( 2 1x x −) - (µ2 1x x −) ] /
222121nnσ+σ.
Aplicando
Y si las muestras son de
igual tamaño y desvío: Z = [(21xx −)] / [σ n2]
Ejemplo
1) Se
realizaron 36 mediciones repetidas de glucosa, usando una solución calibrada
con µ = 90 mg/dl, con dos
marcas comerciales diferentes. Los resultados obtenidos para cada caso son: Marca A (media 95 mg/dl y desvío 8 mg/dl), Marca B (media 93 y desvío 7 mg/dl). Ensayar la hipótesis de que ambas marcas son
equivalentes. H0: µA =µB. El
uso de una marca u otra es indistinto H1: µA ≠ µB Hay diferencia entre ambas marcas:
Donde (21xx −) =
95 – 93 = 2 y σ1-2= 1,772
Entonces resulta:
Z = [(21xx −)]
/222121nnσ+σ= 2 / 1,772 = 1,13 (ns)
El valor 2 cae dentro
del CI 95% (- 3,5; + 3,5)
Como Z < 1,96 = zα/2 no se puede rechazar la hipótesis nula. Este test no arroja evidencia significativa, como para pensar
que hay diferencias entre las marcas A y B.
Ejemplo 2) En una industria
farmacéutica se cambió un dosificador líquido por uno nuevo. El anterior tenía
un promedio histórico de 5,01 ml con un desvío de
0,08 ml en 100 pruebas de calidad. Al actual se le
realizaron 50 pruebas arrojando una media de 5,048 ml
y un desvío de 0,05 ml. Con esta información se debe
decidir si ambos dosificadores son equivalentes.
H0: µN =µV Son equivalentes. H1: µN ≠ µV
Hay diferencia entre
ambos.
Usando la
fórmula general donde el supuesto principal es que las varianzas son
diferentes, pero los valores esperados son equivalentes entonces resulta:
σ1≈ DS1= 0,08 y σ
2≈ DS
2= 0,05 con sus tamaños muestrales de 100 y 50 respectivamente:
Z = [(5,048 – 5,01)] /
10008,05005,022+ Z = 3,56*** ∉ CI 99,9% (-3,29 ;
+3,29) µN -µV
= 0,038 ∉ CI 99,9% (-0,035;
+0,035)
Hay fuerte
evidencia de que no son equivalentes.
Se ha
probado que hay una diferencia del 1,2% entre ambos. Lo que significa que cada
medicamento fabricado tendrá, en promedio, una cantidad mayor que la histórica
lo que implicará un aumento de los costos de producción. Esta evidencia
aconseja no usar el nuevo dosificador.
Distribución t de Student
|
Distribución t de Student |
|
|
Parámetros |
|
|
|
|
|
Función de
densidad (pdf) |
|
|
|
|
|
0 para ν > 1,
indefinida para otros valores |
|
|
0 |
|
|
0 |
|
|
|
|
|
0 para ν > 3 |
|
|
|
|
|
ψ: función digamma, B: función beta |
|
|
(No definida) |
|
|
|
|
En probabilidad y estadística, la distribución-t o distribución t de Student es una distribución
de probabilidad que surge del problema de estimar la media de una
población
normalmente
distribuida cuando el tamaño de la
muestra es pequeño. Ésta es la base del popular test de la t de Student
para la determinación de las diferencias entre dos medias muestrales
y para la construcción del intervalo de
confianza para la diferencia entre las medias de dos poblaciones.
La
distribución t surge, en la mayoría de los estudios estadísticos
prácticos, cuando la desviación típica
de una población se desconoce y debe ser estimada a partir de los datos de una
muestra.
Especificaciones de la
distribución t de Student
Supongamos que X1, ..., Xn son variables aleatorias
independientes
distribuidas normalmente, con media μ y varianza σ2. Sea
la media muestral y
la varianza muestral.
Entonces, está demostrado que
se distribuye según una
normal de media 0 y varianza 1.
Gosset estudió una expresión
relacionada,
y mostró que T
tiene la siguiente función de densidad:
Con ν
igual a n − 1.
La distribución de T se
llama ahora la distribución-t.
El parámetro ν se llama convencionalmente el número de grados
de libertad. La distribución depende de ν , pero no de μ
o σ; la independencia de μ
y σ es lo que hace a la distribución t
tan importante en la teoría y en la práctica. Γ
es la función gamma.
Grados de Libertad
En estadística, grados de libertad es
un estimador del número de categorías independientes en un test
particular o experimento estadístico. Se encuentran mediante la fórmula n-1,
donde n=número de sujetos en la muestra (también pueden ser representados por
k-1 donde k=número de grupos, cuando se realizan operaciones con grupos y no
con sujetos individuales).
Cuando se
trata de ajustar modelos estadísticos a un conjunto de datos, los residuos
-expresados en forma de vector- se encuenttran habitualmente en un espacio de
menor dimensión que aquél en el que se encontraban los datos originales. Los
grados de libertad del error los determina, precisamente, el valor de esta
menor dimensión.
Un ejemplo aclara el concepto.
Supongamos que
son variables
aleatorias, cada una de ellas con media μ, y que
es la "media
muestral". Entonces las cantidades
son los residuos, que
pueden ser considerados estimaciones de los errores Xi
− μ. La suma de los residuos (a diferencia de la suma de los
errores, que no es conocida) es necesariamente 0. Esto significa que los
residuos están restringidos a encontrarse en un espacio de dimensión n-1 ya que
si se conoce el valor de n-1 de estos residuos la determinación del valor del
residuo restante es inmediata. Así, se dice que "el error tiene n-1 grados
de libertad".
Contraste de hipótesis entre un Estadístico y un
Parámetro en muestras pequeñas
Supongamos que estamos
en un contexto paramétrico. Es decir, x1, x2 ...... xn es un muestreo
aleatorio simple de f siendo un parámetro desconocido. Llamaremos al espacio paramétrico, es decir, el conjunto de los valores posibles
para. En los contrastes de hipótesis, lo que interesa es determinar si podemos
admitir queo debemos admitir quedondey
constituyen una partición de. Ambas hipótesis se tratan de forma diferente. A
la primera se le conoce como hipótesis nula. A la segundacomo
hipótesis alternativa. Se suele simbolizar:
La hipótesis nula no se
considera probada pero es la que mantendremos a menos que los datos evidencien
lo contrario. Luego el problema en general es si admitimos o no H0.
Hipótesis
simples y compuestas
Llamaremos
hipótesis simples a aquellas que especifican un único valor para el parámetro
(por ejemplo m=m0).
Llamaremos
hipótesis compuestas a las que especifican un intervalo de valores (por
ejemplo: m>m0 ;
a< m <b)
Se ha
definido un contraste de hipótesis como: donde (espacio paramétrico)
y Diremos que la hipótesis Hi es simple si contiene
un único punto, y diremos que la hipótesis Hi
es compuesta si contiene más de un valor.
En
particular, si entonces el tamaño del contraste es igual a
Entonces si
un contraste tiene hipótesis nula simple, el tamaño del contraste es el valor
de la función de potencia en, y por tanto la probabilidad de rechazar la
hipótesis nula si es cierta será.
Contrastes de hipótesis
simples
Diremos que
un contraste es de hipótesis simple cuando las hipótesis nulas y alternativas
son de la forma.
En este caso. La
función de potencia sólo tiene los valores y
Asociada a un contraste
de hipótesis simples existen 2 tipos de error:
rechazar H0 cuando es cierta. (Error
de Tipo I)
aceptar H0 cuando en realidad es falsa
(Error de Tipo II)
Si es un
contraste para frente a basada en una región crítica C, los dos tipos de
errores tienen las siguientes probabilidades
(Probabilidad de error
del tipo I)
(Probabilidad de error
del tipo II)
El objetivo
obvio es encontrar un contraste que minimice y es claro que podemos conseguir
contrastes que hagan. Para ello basta con aceptar siempre que C = 0. Pero
entonces: (todo el conjunto de resultados) = 1
Un
contraste de hipótesis entre un estadístico y un parámetro en muestras
sencillas, requiere una hipótesis que genere predicciones sin ambigüedad de los
valores de una variable en una población. Esta hipótesis se denomina hipótesis
nula, H0, y el objetivo del contraste es comprobar si podemos rechazarla. Para
ello se define una medida de discrepancia entre los datos y la hipótesis y se
estudia su distribución cuando H0 es cierta. Se denomina p-valor a la
posibilidad de que la medida de discrepancia tome su valor mayor que el
observado. Se fija un nivel de significación, que representa la probabilidad de
rechazar H0 cuando es cierta. Este nivel permite definir una región de rechazo.
Si la discrepancia está en ella, rechazaremos H0. En caso contrario, la
asumiremos provisionalmente. Los contrastes pueden ser unilaterales o
bilaterales, en función de cómo establezcamos la hipótesis alternativa. Para
realizar un contraste sobre la proporción en una población tomamos como medida
de discrepancia el error relativo de estimación de acuerdo con H0. Si el tamaño
muestral es grande, este error relativo sigue una distribución t de Student, a partir de la cual se construye la región de
rechazo.
Contrastes
sobre la diferencia
Supongamos que tenemos dos muestras independientes
tomadas sobre dos poblaciones, en la que estudiamos una variable de tipo
dicotómico (Bernoulli):
Si X1 y X2
contabilizan en cada caso el número de éxitos en cada muestra se tiene que cada
una de ellas se distribuye como una variable aleatoria binomial:
de modo que los estimadores de las proporciones en cada
población tienen distribuciones que de un modo aproximado son normales (cuando n1
y n2 son bastante grandes)
El contraste que nos interesa realizar
es el de si la diferencia entre las proporciones en cada población es una
cantidad conocida
Si H0 fuese cierta se
tendría que
Desafortunadamente ni p1
ni p2 son conocidos de antemano y utilizamos sus estimadores,
lo que da lugar a un error que es pequeño cuando los tamaños muestrales son importantes:
El contraste bilateral sobre la diferencia de
proporciones es
Entonces se define
y se rechaza la hipótesis nula si o
si
En el contraste
se rechazará H0 si .
Para el test contrario
se rechaza H0 si .
Aplicaciones de los contrastes
de hipótesis
Los
contrastes de hipótesis, como la inferencia
estadística en general, son herramientas de amplio uso en la ciencia
en general. En particular, la moderna Filosofía de la
ciencia desarrolla el concepto de falsabilidad de
las teorías científicas basándose en los conceptos de la inferencia
estadística en general y de los contrastes de hipótesis. En este
contexto, cuando se desea optar entre dos posibles teorías científicas para un
mismo fenómeno (dos hipótesis) se debe realizar un contraste estadístico a
partir de los datos disponibles sobre el fenómeno que permitan optar por una u
otra.
Las
técnicas de contraste de hipótesis son también de amplia aplicación en muchos
casos, como: ensayos clínicos de
nuevos medicamentos, control de calidad,
encuestas, entre otros.
Infografía
www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.7/p2.html - 13k -
es.wikipedia.org/wiki/Muestreo_en_estadística - 24k
www.uaq.mx/matematicas/estadisticas/xu5.html - 20k
www.cig.ensmp.fr/~hubert/glu/IN-ES-ST.HTM
- 35k
www.universidadabierta.edu.mx/SerEst/Apuntes/VelascoRoberto_EstadistInferencial.htm
- 456k
www.ugr.es/~aquiran/docencia/apuntes/errores.pdf
http://es.wikipedia.org/wiki/Teorema_del_l%C3%ADmite_central
http://es.wikipedia.org/wiki/Grados_de_libertad_%28estad%C3%ADstica%29