Prueba U de Mann-Whitney

Naturaleza y uso.

La prueba U de Mann-Whitney es una prueba no paramétrica equivalente a la de Wilcoxon para dos muestras. Sus contrapartes paramétricas son las pruebas t y anova. Se aplica para comparar la ubicación de dos muestras sin necesidad de recurrir a la premisa de que existe una distribución específica en los datos (como es el caso de la normal en el anova). Por lo tanto, sirve en una amplia variedad de distribuciones. La prueba U de Mann-Whitney es semigráfica y muy simple de aplicar.

Hipótesis nula.

La hipótesis nula es que las dos muestras vienen de poblaciones que tienen la misma ubicación.

Ejemplo.

Muestra 1		Muestra2
Y	Rango	Y	Rango
104	2	100	1
109	7	105	3
112	9	107	4.5
114	10	107	4.5
116	11.5	108	6
118	13.5	111	8
118	13.5	116	11.5
119	15	120	16
121	17.5	121	17.5
123	19.5	123	19.5
125	21
126	22.5
126	22.5
128	25
128	25
128	25
	Suma de n₁= 259.5		Suma de n₂= 91.5

Procedimiento.

1. Haga una lista de las observaciones de cada muestra de menor a mayor. Una forma conveniente es ésta:

100

110

120

130

2. Para cada observación en la muestra más pequeña, cuente el número de observaciones de la otra muestra que tienen menor valor (que están más a la izquierda). Cada empate cuenta como media unidad. En este caso encontramos: 0, 1, 1, 1, 1, 2, 4.5, 8, 8.5 y 9.5.

3. La suma C de este conteo es 36.5.

4. El estadístico U de Mann-Whitney es la cantidad mayor que resulte de comparar esta dos cantidades: el conteo C que aquí es 36.5, y n₁n₂-C que aquí es (16x10)-36.5 = 123.5

5. Al nivel alfa de 0.05, el estadístico U de Mann-Whitney se compara con el valor de la tabla de valores críticos. Siendo una prueba de dos colas, en este caso se compara 123.5 con U_0.025[16,10] = 118. Si es de una sola cola se compara con U_0.05[16,10] = 112.

Prueba de Kruskal-Wallis Para un Diseño de una Vía

Naturaleza y uso.

La prueba de Kruskal-Wallis es una prueba no paramétrica análoga al anova de una sola entrada para el caso general de a muestras de n_iobservaciones por muestra.

Hipótesis nula.

La hipótesis nula es que las muestras vienen de poblaciones que tienen la misma ubicación.

Ejemplo.

Muestra 1

Muestra 2

Muestra 3

Muestra 4

Muestra 5

Rango

48.5

31.5

42.5

27.5

19.5

23.5

37.5

48.5

19.5

27.5

37.5

31.5

23.5

31.5

42.5

23.5

27.5

37.5

42.5

23.5

37.5

19.5

31.5

27.5

19.5

42.5

SR = 450.0

SR = 196.5

SR = 138.5

SR = 131.5

SR = 358.5

Procedimiento.

1. Obtenga los rangos de todas las observaciones de menor a mayor después de juntarlas en una sola lista. En caso de empate, calcule el rango promedio. Por ejemplo, los 4 variatos Y = 59 tienen los rangos 18, 19, 20 y 21. Su rango promedio es 19.5.

2. Organice una tabla con los rangos correspondientes a cada observación en los grupos o muestras.

3. Sume los rangos de cada grupo.

4. Calcule la expresión siguiente: en la que Sn_i es la suma de todas las muestras, los valores 12 y 3 son constantes, y (SR)_ies la suma de los rangos del grupo i. Para el ejemplo dado, H = 38.110.

t_j	2	3	4	5	6	7	8	9	10
T_j	6	24	60	120	210	336	504	720	990

5. El estadístico H de esta expresión debe ser corregido dividiéndolo por el factor D cuando hay empates. D se obtiene de la expresión indicada abajo, en la que T_j depende de t_j, el número de empates por cada grupo de empates. La función es T_{j =}t_j³ - t_j. El valor de T_j si hay 7 empates es 7³ – 7 = 336. Como la mayor parte de casos cae en el rango de 2 a 10 empates, se ofrece una pequeña tabla para ese rango. En el ejemplo presentado, el primer grupo de empates tiene 3 variatos, el segundo tiene 7, el tercero 7, el cuarto 4, etc. De acuerdo con ello, sumamos 24+336+336+60+...+ 6. Para el caso presente, la suma de todos los T_j es 1062.

6. D se calcula entonces así: 1- (1062)/(49x50x51) = 0.99150.

7. El valor corregido de H es 38.437. Este valor se compara con el valor de c² _a_(a-1) . En este caso, el valor de a para 0.005 es 14.860.

Interpretación.

Como el valor de H = 38.437es mayor que el de c² _0.005(4) = 14.860, podemos rechazar la hipótesis nula y concluir que hay diferencia entre los grupos.

Comparaciones Múltiples No Paramétricas

Naturaleza y uso.

La prueba que se describe aquí es análoga a las pruebas paramétricas a posteriori del anova. Es un procedimiento de análisis propuesto por los investigadores Dwass y Gabriel que desarrolla el estadístico U de Mann-Whitney para comparar pares de muestras. El estadístico U obtenido es contrastado con un valor crítico. El cálculo es simple. Toma la mayor entre estas 2 cifras: C o (n² – C), en las que C es un valor que refleja la ubicación relativa de una muestra con respecto a otra y n es el tamaño de la muestra. Procedemos a comparar todos los pares posibles de muestras para aprovechar ciertas características de la prueba STP en el caso no paramétrico, especialmente que al saber cuáles pares no son distintos podemos construir grupos de muestras que no son diferentes entre sí pero lo son con respecto a otros grupos.

Hipótesis nula.

Las hipótesis nulas son que las dos muestras comparadas vienen de poblaciones que tienen la misma ubicación.

Ejemplo.

Control (C)

2% Glucosa (G)

2% Fructosa (F)

1% Glucosa +

1% Fructosa

(G + F)

2% Sacarosa (S)

Medida

Usaremos los datos que ya se presentaron en el resumen de la prueba de Kruskal-Wallis en que se comparan 5 grupos, uno sirve de control.

Procedimiento.

1. Para cada par de muestras se calcula U como se hizo en el ejercicio anterior.

2. Para cada observación de una de las muestras, se cuenta en la otra el número de observaciones que son menores. Cada empate cuenta ½.

3. Se obtiene la suma de cada una de las comparaciones (C).

4. La mayor de las cantidades C o (n² – C) sirve para preparar una tabla que contiene los valores U.

5. El valor crítico de U se obtiene por la expresión: que se aplica en el ejemplo de los azúcares de la manera siguiente:

Resumen de valores U
	C	G	F	G + F	S
C	---
G	100*	---
F	100*	67	---
G + F	100*	73	50.5	---
S	95*	98.5*	100*	100*	---
* indica que p < 0.05

. Este valor sirve para comparar los valores de U.

Interpretación.

Por lo anterior, los datos se pueden arreglar de esta manera: (G, F, G + F) (S) (C). Es decir, que no hay diferencia estadísticamente significativa entre las muestras G, F y G + F. Sí la hay entre las muestras S y C, y de éstas con respecto a las demás, a nivel de α = 0.05.