Naturaleza
y uso.
La prueba U de Mann-Whitney es una prueba no
paramétrica equivalente a la de Wilcoxon para dos muestras. Sus contrapartes
paramétricas son las pruebas t y anova. Se aplica para comparar la ubicación de
dos muestras sin necesidad de recurrir a la premisa de que existe una
distribución específica en los datos (como es el caso de la normal en el
anova). Por lo tanto, sirve en una amplia variedad de distribuciones. La prueba
U de Mann-Whitney es semigráfica y muy simple de aplicar.
Hipótesis
nula.
La hipótesis nula es que las dos muestras vienen de
poblaciones que tienen la misma ubicación.
Ejemplo.
|
Muestra 1 |
Muestra2 |
||
|
Y |
Rango |
Y |
Rango |
|
104 |
2 |
100 |
1 |
|
109 |
7 |
105 |
3 |
|
112 |
9 |
107 |
4.5 |
|
114 |
10 |
107 |
4.5 |
|
116 |
11.5 |
108 |
6 |
|
118 |
13.5 |
111 |
8 |
|
118 |
13.5 |
116 |
11.5 |
|
119 |
15 |
120 |
16 |
|
121 |
17.5 |
121 |
17.5 |
|
123 |
19.5 |
123 |
19.5 |
|
125 |
21 |
|
|
|
126 |
22.5 |
|
|
|
126 |
22.5 |
|
|
|
128 |
25 |
|
|
|
128 |
25 |
|
|
|
128 |
25 |
|
|
|
|
Suma de n1 = 259.5 |
|
Suma de n2 = 91.5 |
Procedimiento.
1. Haga una lista de las observaciones de cada muestra de menor a mayor. Una forma conveniente es ésta:
|
M2 |
|
|
|
|
|
|
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
* |
|
|
|
|
* |
|
* |
* |
|
|
* |
|
|
|
|
* |
|
|
|
* |
* |
|
* |
|
|
|
|
|
|
|
|
|
M1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
* |
|
|
|
|
|
|
|
* |
|
* |
|
|
|
|
|
|
|
|
* |
|
|
|
|
* |
|
|
* |
|
* |
|
* |
|
* |
* |
|
* |
|
* |
|
* |
* |
|
* |
|
|
|
|
|
100 |
|
|
|
|
|
|
|
|
|
110 |
|
|
|
|
|
|
|
|
|
120 |
|
|
|
|
|
|
|
|
|
130 |
2. Para cada observación en la muestra más pequeña, cuente el número de observaciones de la otra muestra que tienen menor valor (que están más a la izquierda). Cada empate cuenta como media unidad. En este caso encontramos: 0, 1, 1, 1, 1, 2, 4.5, 8, 8.5 y 9.5.
3. La suma C de este conteo es 36.5.
4. El estadístico U de Mann-Whitney es la cantidad mayor que resulte de comparar esta dos cantidades: el conteo C que aquí es 36.5, y n1n2-C que aquí es (16x10)-36.5 = 123.5
5. Al nivel alfa de 0.05, el estadístico U de Mann-Whitney se compara con el valor de la tabla de valores críticos. Siendo una prueba de dos colas, en este caso se compara 123.5 con U0.025[16,10] = 118. Si es de una sola cola se compara con U0.05[16,10] = 112.
Naturaleza
y uso.
La prueba de Kruskal-Wallis es una prueba no
paramétrica análoga al anova de una sola entrada para el caso general de a muestras de ni observaciones por muestra.
Hipótesis
nula.
La hipótesis nula es que las muestras vienen de
poblaciones que tienen la misma ubicación.
Ejemplo.
|
Muestra
1 |
Muestra
2 |
Muestra
3 |
Muestra
4 |
Muestra
5 |
|||||||
|
Y |
Rango |
Y |
Rango |
Y |
Rango |
Y |
Rango |
Y |
Rango |
||
|
75 |
48.5 |
57 |
7 |
58 |
14 |
58 |
14 |
62 |
31.5 |
||
|
67 |
42.5 |
58 |
14 |
61 |
27.5 |
59 |
19.5 |
66 |
40 |
||
|
70 |
46 |
60 |
23.5 |
56 |
2 |
58 |
14 |
65 |
37.5 |
||
|
75 |
48.5 |
59 |
19.5 |
58 |
14 |
61 |
27.5 |
63 |
34 |
||
|
65 |
37.5 |
62 |
31.5 |
57 |
7 |
57 |
7 |
64 |
35 |
||
|
71 |
47 |
60 |
23.5 |
56 |
2 |
56 |
2 |
62 |
31.5 |
||
|
67 |
42.5 |
60 |
23.5 |
61 |
27.5 |
58 |
14 |
65 |
|
||
|
67 |
42.5 |
57 |
7 |
60 |
23.5 |
57 |
7 |
65 |
37.5 |
||
|
76 |
50 |
59 |
19.5 |
57 |
7 |
57 |
7 |
62 |
31.5 |
||
|
68 |
45 |
61 |
27.5 |
58 |
14 |
59 |
19.5 |
67 |
42.5 |
||
|
|
SR = 450.0 |
|
SR = 196.5 |
|
SR = 138.5 |
|
SR = 131.5 |
|
SR = 358.5 |
||
Procedimiento.
1. Obtenga los rangos de todas las observaciones de menor a mayor después de juntarlas en una sola lista. En caso de empate, calcule el rango promedio. Por ejemplo, los 4 variatos Y = 59 tienen los rangos 18, 19, 20 y 21. Su rango promedio es 19.5.
2. Organice una tabla con los rangos correspondientes a cada observación en los grupos o muestras.
3. Sume los rangos de cada grupo.
4. Calcule la expresión siguiente: en la que Sni es la suma de todas las muestras, los valores 12 y 3 son constantes, y (SR)i es la suma de los rangos del grupo i. Para el ejemplo dado, H = 38.110.
|
tj |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
Tj |
6 |
24 |
60 |
120 |
210 |
336 |
504 |
720 |
990 |
5.
El estadístico H de esta expresión debe ser corregido dividiéndolo por el factor D cuando hay empates. D se obtiene de la
expresión indicada abajo, en la que Tj
depende de tj, el número
de empates por cada grupo de empates. La función es Tj = tj3 - tj. El valor
de Tj si hay 7 empates es 73 – 7 = 336.
Como la mayor parte de casos cae en el rango de 2 a 10 empates, se ofrece una
pequeña tabla para ese rango. En el ejemplo presentado, el primer grupo de
empates tiene 3 variatos, el segundo tiene 7, el tercero 7, el cuarto 4, etc.
De acuerdo con ello, sumamos 24+336+336+60+...+ 6. Para el caso presente, la
suma de todos los Tj es
1062.
6. D se
calcula entonces así: 1- (1062)/(49x50x51) = 0.99150.
7. El valor corregido de H es
38.437. Este valor se compara con el valor de c2 a(a-1) . En este caso, el valor de a para 0.005 es 14.860.
Interpretación.
Como el valor de H
= 38.437es mayor que el de c2 0.005(4) = 14.860, podemos rechazar la hipótesis nula y
concluir que hay diferencia entre los grupos.
Naturaleza
y uso.
La prueba que se describe aquí es análoga a las
pruebas paramétricas a posteriori del
anova. Es un procedimiento de análisis propuesto por los investigadores Dwass
y Gabriel que desarrolla el estadístico U
de Mann-Whitney para comparar pares de muestras. El estadístico U obtenido es contrastado con un valor
crítico. El cálculo es simple. Toma la mayor entre estas 2 cifras: C o (n2 – C), en las
que C es un valor que refleja la
ubicación relativa de una muestra con respecto a otra y n es el tamaño de la muestra. Procedemos a comparar todos los pares
posibles de muestras para aprovechar ciertas características de la prueba STP
en el caso no paramétrico, especialmente que al saber cuáles pares no son
distintos podemos construir grupos de muestras que no son diferentes entre sí
pero lo son con respecto a otros grupos.
Hipótesis
nula.
Las hipótesis nulas son que las dos muestras
comparadas vienen de poblaciones que tienen la misma ubicación.
Ejemplo.
|
Control
(C) |
|
|
|
|
|
|
|
|
|
|
|
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
* |
|
|
|
|
|
|
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
* |
|
* |
* |
|
* |
* |
|
|
|
* |
* |
|
|
2%
Glucosa (G) |
|
|
|
|
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
* |
|
* |
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
* |
* |
* |
* |
* |
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2%
Fructosa (F) |
|
|
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
* |
* |
* |
|
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
* |
* |
* |
|
* |
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1%
Glucosa + 1%
Fructosa (G
+ F) |
|
|
* |
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
* |
* |
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
* |
* |
* |
* |
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2%
Sacarosa (S) |
|
|
|
|
|
|
|
* |
|
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
* |
|
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
* |
* |
* |
* |
* |
* |
|
|
|
|
|
|
|
|
|
|
Medida
|
55 |
|
|
|
|
60 |
|
|
|
|
65 |
|
|
|
|
70 |
|
|
|
|
75 |
|
Usaremos los datos que ya se
presentaron en el resumen de la prueba de Kruskal-Wallis en que se comparan 5
grupos, uno sirve de control.
Procedimiento.
1. Para cada par de muestras se calcula U como se hizo en el
ejercicio anterior.
2. Para cada observación de una de las muestras, se cuenta en la otra el
número de observaciones que son menores. Cada empate cuenta ½.
3. Se obtiene la suma de cada una de las comparaciones (C).
4. La mayor de las cantidades C o
(n2 – C) sirve para preparar una tabla que contiene los
valores U.
5. El valor crítico de U se obtiene por la expresión:
que se aplica en el
ejemplo de los azúcares de la manera siguiente:
|
Resumen de valores U |
|||||
|
|
C |
G |
F |
G + F |
S |
|
C |
--- |
|
|
|
|
|
G |
100* |
--- |
|
|
|
|
F |
100* |
67 |
--- |
|
|
|
G + F |
100* |
73 |
50.5 |
--- |
|
|
S |
95* |
98.5* |
100* |
100* |
--- |
|
* indica que p < 0.05 |
|||||
. Este valor sirve
para comparar los valores de U.
Interpretación.
Por lo anterior, los datos se
pueden arreglar de esta manera: (G, F, G + F)
(S) (C). Es decir, que no hay
diferencia estadísticamente significativa entre las muestras G, F y G + F. Sí
la hay entre las muestras S y C, y de éstas con respecto a las demás, a nivel
de α = 0.05.