¿Diseñar
bien un experimento, antes...o tratar de salvar los datos después?
Es más económico y
suele proveer más información un experimento diseñado a priori .
En muchos casos es
imposible "salvar" los datos, es decir extraer conclusiones válidas
e interesantes de un conjunto de observaciones obtenidas en un
experimento mal diseñado
Las hipótesis son
imprescindibles cuando se desea ensayar la credibilidad de alguna
aseveración hecha a priori (p.ej.:" la media poblacional es 12
kg")
Cuando lo que se
quiere es describir la muestra o estimar características de la
población de la que fue extraída, no se plantean hipótesis
sino objetivos
Tanto las
hipótesis como los objetivos deben ser expresadosen
términos estadísticos
Para poder hacerlo,
es necesario:
Plantearse
claramente lo que se quiere saber, p.ej.:
¿Cuál es el
tipo de dispersión de los hormigueros en la faja
comprendida entre el Río de la Plata y el puente
sobre ruta 8, 200m a cada lado del Arroyo Pando?
La
adición de sales yodadas a la ración de vacas
lecheras en la cuenca lechera de Salto ¿mejora
la producción de leche?
Transformar
esas preguntas a formato estadístico
Objetivo: Estimar
el índice de Morisita a nivel de confianza
0.95, en un reticulado de 1 ha por unidad, en el área de
interés
Hipótesis
:
Ho:
m
s
R m
ns
; H 1 :m
s > m
ns
s =
adición de sales yodadas
ns =
NO adición
m
=
media diaria de producción de leche por vaca durante el
período de lactación
¿Cómo
elegir la prueba estadística de preferencia?
De
acuerdo al número de variables y la escala de medida podemos tener
pruebas estadísticas para:
Cinco conceptos a tener en cuenta en el momento de elegir el nivel
de significación
1
El
nivel de significación (a)
es la probabilidad de rechazar la Ho cuando ésta es verdadera. Es la
probabilidad de cometer un error tipo I
2
b
es la probabilidad de cometer un error tipo II (aceptar la Ho
cuando es falsa)
3
La
potencia de un test (1 -
b),
representa la probabilidad de rechazar la Ho cuando en realidad es falsa
(decisión correcta)
4
La
potencia está relacionada con la naturaleza de la prueba estadística
elegida y con la de la hipótesis alternativa (H1).
Cuando la diferencia entre el valor teórico y el valor observado es
grande (o bien "mayor que" o bien "menor que")
podría emplearse una prueba unilateral.
5
En
términos generales puede decirse que la potencia de un test aumenta, al
aumentar el tamaño de la muestra
En
la elección y aplicación de una prueba estadística determinada, en
general se asumen supuestos que deben cumplirse para que dicha prueba sea
válida.
Entre los supuestos más comunes, en los casos de aplicación de t ,
o de anova, por ejemplo, se encuentran los de normalidad,
independencia y homocedasticidad
Para
controlar la normalidad : Se puede utilizar un test de bondad de
ajuste (Chi cuadrado).
El
control de la independencia se hace a través del diseño
experimental, asegurando la aleatoriedad en la toma de la muestra. La
falta de aleatoriedad puede reflejarse en falta de independencia de los
datos o en heterogeneidad de la varianza o no normalidad de la
distribución.
La homocedasticidad puede testarse con un test de F de
igualdad de varianzas
Por supuesto existen formas
alternativas a veces más eficientes de testar estos supuestos.
En
términos muy generales , determinar el tamaño de muestra requiere
previamente el conocimiento de la varianza y la fijación por parte del
investigador del error máximo que está dispuesto a aceptar y de la
probabilidad admisible de excederlo.
En Estadística es muy poco lo que se puede hacer con 2 ovejas!!.
Pueden, sin embargo, ser útiles para la descripción de casos clínicos
(casuística) o para ...hacer un buen asado!
La afirmación de que
se requiere "torturar a la naturaleza" es de Francis Bacon.
Creemos que es exagerada si se toma fuera de contexto. Hay dos
formas básicas de forzar los datos:
Seleccionar las
hipótesis, el tipo de test o el nivel de significación (alfa) "a
priori", después del procesamiento estadístico
Plantearse modelos
muy complejos (muchas preguntas o preguntas excesivamente
ambiciosas) con pocas observaciones. Esto se llama
"exprimir" u "ordeñar" los datos. En
cualquiera de los dos casos es muy probable que nos contesten lo
que queremos escuchar, aunque sea falso