Prueba U de Mann-Whitney

 

Naturaleza y uso.

La prueba U de Mann-Whitney es una prueba no paramétrica equivalente a la de Wilcoxon para dos muestras. Sus contrapartes paramétricas son las pruebas t y anova. Se aplica para comparar la ubicación de dos muestras sin necesidad de recurrir a la premisa de que existe una distribución específica en los datos (como es el caso de la normal en el anova). Por lo tanto, sirve en una amplia variedad de distribuciones. La prueba U de Mann-Whitney es semigráfica y muy simple de aplicar.

 

Hipótesis nula.

La hipótesis nula es que las dos muestras vienen de poblaciones que tienen la misma ubicación.

 

Ejemplo.

Muestra 1

Muestra2

Y

Rango

Y

Rango

104

2

100

1

109

7

105

3

112

9

107

4.5

114

10

107

4.5

116

11.5

108

6

118

13.5

111

8

118

13.5

116

11.5

119

15

120

16

121

17.5

121

17.5

123

19.5

123

19.5

125

21

 

 

126

22.5

 

 

126

22.5

 

 

128

25

 

 

128

25

 

 

128

25

 

 

 

Suma de n1 = 259.5

 

Suma de n2 = 91.5

 

 

Procedimiento. 

1.       Haga una lista de las observaciones de cada muestra de menor a mayor. Una forma conveniente es ésta:

M2

 

 

 

 

 

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

 

 

*

 

*

*

 

 

*

 

 

 

 

*

 

 

 

*

*

 

*

 

 

 

 

 

 

 

M1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

 

 

 

 

 

*

 

*

 

 

 

 

 

 

*

 

 

 

 

*

 

 

*

 

*

 

*

 

*

*

 

*

 

*

 

*

*

 

*

 

 

 

100

 

 

 

 

 

 

 

 

 

110

 

 

 

 

 

 

 

 

 

120

 

 

 

 

 

 

 

 

 

130

 

2.       Para cada observación en la muestra más pequeña, cuente el número de observaciones de la otra muestra que tienen menor valor (que están más a la izquierda). Cada empate cuenta como media unidad. En este caso encontramos: 0, 1, 1, 1, 1, 2, 4.5, 8, 8.5 y 9.5.

3.       La suma C de este conteo es 36.5.

4.       El estadístico U de Mann-Whitney es la cantidad mayor que resulte de comparar esta dos cantidades: el conteo C que aquí es 36.5, y n1n2-C que aquí es  (16x10)-36.5 = 123.5

5.       Al nivel alfa de 0.05, el estadístico U de Mann-Whitney se compara con el valor de la tabla de valores críticos. Siendo una prueba de dos colas, en este caso se compara 123.5 con U0.025[16,10] = 118. Si es de una sola cola se compara con U0.05[16,10] = 112.


Prueba de Kruskal-Wallis Para un Diseño de una Vía

 

Naturaleza y uso.

La prueba de Kruskal-Wallis es una prueba no paramétrica análoga al anova de una sola entrada para el caso general de a muestras de ni observaciones por muestra.

 

Hipótesis nula.

La hipótesis nula es que las muestras vienen de poblaciones que tienen la misma ubicación.

 

Ejemplo.

Muestra 1

Muestra 2

Muestra 3

Muestra 4

Muestra 5

Y

Rango

Y

Rango

Y

Rango

Y

Rango

Y

Rango

75

48.5

57

7

58

14

58

14

62

31.5

67

42.5

58

14

61

27.5

59

19.5

66

40

70

46

60

23.5

56

2

58

14

65

37.5

75

48.5

59

19.5

58

14

61

27.5

63

34

65

37.5

62

31.5

57

7

57

7

64

35

71

47

60

23.5

56

2

56

2

62

31.5

67

42.5

60

23.5

61

27.5

58

14

65

 
37.5

67

42.5

57

7

60

23.5

57

7

65

37.5

76

50

59

19.5

57

7

57

7

62

31.5

68

45

61

27.5

58

14

59

19.5

67

42.5

 

SR = 450.0

 

SR = 196.5

 

SR = 138.5

 

SR = 131.5

 

SR = 358.5

 

Procedimiento.

1.       Obtenga los rangos de todas las observaciones de menor a mayor después de juntarlas en una sola lista. En caso de empate, calcule el rango promedio. Por ejemplo, los 4 variatos Y = 59 tienen los rangos 18, 19, 20 y 21. Su rango promedio es 19.5.

2.       Organice una tabla con los rangos correspondientes a cada observación en los grupos o muestras.

3.       Sume los rangos de cada grupo.

4.       Calcule la expresión siguiente: en la que Sni es la suma de todas las muestras, los valores 12 y 3 son constantes, y (SR)i es la suma de los rangos del grupo i. Para el ejemplo dado, H = 38.110.

tj

2

3

4

5

6

7

8

9

10

Tj

6

24

60

120

210

336

504

720

990

5.       El estadístico H de esta expresión debe ser corregido dividiéndolo por el factor D cuando hay empates. D se obtiene de la expresión indicada abajo, en la que Tj depende de tj, el número de empates por cada grupo de empates. La función es Tj = tj3 - tj. El valor de Tj  si hay 7 empates es 73 – 7 = 336. Como la mayor parte de casos cae en el rango de 2 a 10 empates, se ofrece una pequeña tabla para ese rango. En el ejemplo presentado, el primer grupo de empates tiene 3 variatos, el segundo tiene 7, el tercero 7, el cuarto 4, etc. De acuerdo con ello, sumamos 24+336+336+60+...+ 6. Para el caso presente, la suma de todos los Tj es 1062.

6.       D se calcula entonces así: 1- (1062)/(49x50x51) = 0.99150.

7.       El valor corregido de H es 38.437. Este valor se compara con el valor de c2 a(a-1) . En este caso, el valor de a para 0.005 es 14.860.

 

Interpretación.

Como el valor de H = 38.437es mayor que el de c2 0.005(4) = 14.860, podemos rechazar la hipótesis nula y concluir que hay diferencia entre los grupos.

 


Comparaciones Múltiples No Paramétricas

 

Naturaleza y uso.

La prueba que se describe aquí es análoga a las pruebas paramétricas a posteriori del anova. Es un procedimiento de análisis propuesto por los investigadores Dwass y Gabriel que desarrolla el estadístico U de Mann-Whitney para comparar pares de muestras. El estadístico U obtenido es contrastado con un valor crítico. El cálculo es simple. Toma la mayor entre estas 2 cifras: C o (n2 – C), en las que C es un valor que refleja la ubicación relativa de una muestra con respecto a otra y n es el tamaño de la muestra. Procedemos a comparar todos los pares posibles de muestras para aprovechar ciertas características de la prueba STP en el caso no paramétrico, especialmente que al saber cuáles pares no son distintos podemos construir grupos de muestras que no son diferentes entre sí pero lo son con respecto a otros grupos.

 

Hipótesis nula.

Las hipótesis nulas son que las dos muestras comparadas vienen de poblaciones que tienen la misma ubicación.

 

Ejemplo.

Control (C)

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

 

 

 

 

 

*

 

 

 

 

 

 

 

 

 

 

 

*

 

*

*

 

*

*

 

 

 

*

*

2% Glucosa (G)

 

 

 

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

*

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

*

*

*

*

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2% Fructosa (F)

 

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

*

*

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

*

*

 

*

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1% Glucosa +

1% Fructosa

(G + F)

 

 

*

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

*

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

*

*

*

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2% Sacarosa (S)

 

 

 

 

 

 

 

*

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

*

*

*

*

*

 

 

 

 

 

 

 

 

 

Medida

55

 

 

 

 

60

 

 

 

 

65

 

 

 

 

70

 

 

 

 

75

 

Usaremos los datos que ya se presentaron en el resumen de la prueba de Kruskal-Wallis en que se comparan 5 grupos, uno sirve de control.

 

Procedimiento.

1.    Para cada par de muestras se calcula U como se hizo en el ejercicio anterior.

2.    Para cada observación de una de las muestras, se cuenta en la otra el número de observaciones que son menores. Cada empate cuenta ½.

3.    Se obtiene la suma de cada una de las comparaciones (C).

4.    La mayor de las cantidades C o (n2 – C) sirve para preparar una tabla que contiene los valores U.

5.    El valor crítico de U se obtiene por la expresión:  que se aplica en el ejemplo de los azúcares de la manera siguiente:

 

Resumen de valores U

 

C

G

F

G + F

S

C

---

 

 

 

 

G

100*

---

 

 

 

F

100*

67

---

 

 

G + F

100*

73

50.5

---

 

S

95*

98.5*

100*

100*

---

* indica que p < 0.05

 . Este valor sirve para comparar los valores de U.

 

Interpretación.

Por lo anterior, los datos se pueden arreglar de esta manera: (G, F, G + F)   (S)  (C). Es decir, que no hay diferencia estadísticamente significativa entre las muestras G, F y G + F. Sí la hay entre las muestras S y C, y de éstas con respecto a las demás, a nivel de α = 0.05.

Hosted by www.Geocities.ws

1