La Confusión en Medio de la Interpretación Verdadera; Error Tipo I (Nivel de Significancia), Error Tipo II y el Valor P.

Héctor Fabio Mueses M. Colegio Odontológico Colombiano,Sede Cali. Marzo de 2003 (correo electrónico)

Palabras Claves: Error tipo I, Error Tipo II, Valor P, Hipótesis Nula, Estadístico de prueba.


En muchas ocasiones nos encontramos en medio de la confusión al momento de interpretar el valor p, el error tipo I y en ciertos casos el error tipo II; en algunas situaciones se habla del valor p como si se tratara del error tipo I. El presente escrito abordara el concepto de los mencionados anteriormente y se aclarará la diferencia entre valor p y error Tipo I o nivel de significancia.

Para comenzar, describiremos los tipos de errores que se pueden cometer al realizar estadística inferencial ( se pretende generalizar los resultados obtenidos en la muestra a la población o universo).

Cuando probamos hipótesis podemos tener alguno de los siguientes resultados:

Figura 1. Región de rechazo y aceptación en la distribución normal.

En la figura 1. Se observa que en cada lado de la curva de distribución normal, hay dos pequeñas colas, las cuales son definidas como región de rechazo; es, en esta región donde se acepta la hipótesis alterna (Hipótesis de trabajo) y se rechaza la hipótesis nula (Hipótesis nula: se plantea en términos de igualdad y es la hipótesis que deseamos rechazar. Ej. Efectividad A = Efectividad B), a la región de rechazo también se le conoce como región crítica. Ahora si un investigador informa que sus resultados son estadísticamente significativos, quiere decir que, según la prueba estadística, sus hallazgos podrían ser válidos y replicables con nuevas muestras de sujetos. Polit - Hungler, 2000.

En el caso de probar hipótesis, el error tipo I o alfa es establecido por el investigador antes de realizar el proceso de prueba de hipótesis inferenciales. Los valores más comunes de significancia son de 0.05, 0.01, 0.001, estos valores dependen de la rigurosidad que establezca el investigador para su análisis.

Ahora, para determinar el concepto de valor p, iniciemos con la definición clásica; es el valor de probabilidad o "significancia" de los resultados. El valor p mide la probabilidad de obtener un valor para el estadístico tan extremo como el realmente observado si la hipótesis nula fuera cierta. Smith et al, 1998.

Con lo anterior podemos ilustrar de manera clara que es realmente el valor p; supongamos que la diferencia observada en la evaluación de efectividad de dos fármacos (tradicional y uno nuevo) es de 15 por ciento a favor del nuevo. Un valor p de 0.02 indicará que, si el nuevo fármaco no ha tenido un verdadero efecto, habría solamente una oportunidad del 2% de obtener una diferencia de 15% o mayor.

Ahora teniendo claro la interpretación del valor p, demos la definición de lo que es, de la siguiente manera: es la probabilidad asociada a un estadístico de prueba calculado a partir de los datos obtenidos en una investigación, e indica la probabilidad de obtener un valor tan extremo como el estadístico de prueba calculado en cualquier dirección, cuando la hipótesis nula es verdadera. Significa que existe una probabilidad menor que alfa (error tipo I) de que el resultado obtenido sea atribuible al azar, o una certeza del (1-alfa) de que el resultado obtenido por la intervención sea verdadero.

De acuerdo a la definición de valor p, nos queda claro que este valor no es igual al valor alfa o error tipo I, la primera diferencia se observa al momento en que el investigador fija la zona de rechazo o el nivel de significancia alfa, mientras que el valor p viene dado por el estadístico de prueba calculado a partir de los datos de la investigación y puede ser superior, inferior o igual al valor alfa y no es controlado por el investigador, ya que, es un valor asociado al estadístico de prueba. El valor p para una prueba puede definirse también como el valor más pequeño del error tipo I o alfa por el cual la hipótesis nula se puede rechazar. Si el valor p tiende a ser pequeño, menos fuerza tendrá la hipótesis nula como una explicación de los datos observados. Además el nivel alfa para algunos autores es definido como un nivel de la probabilidad de equivocarse y se fija antes de probar hipótesis inferenciales, es un valor de certeza respecto a no equivocarse. Así, el nivel de significancia representa áreas de riesgo o confianza en la distribución muestral. Hernández et al, 2000.

En lugar de decir que un valor observado de la estadística de prueba es significativo o no significativo a un valor alfa, muchos autores en sus obras de investigación prefieren informar la probabilidad exacta de obtener un valor tanto o más extremo que el observado, si la hipótesis nula es verdadera. En este momento los autores darán el valor calculado de la estadística de prueba junto con el valor p asociado a esta.

Cabe recordar o dar a conocer para quienes no conocen muy bien del tema, que el nivel de significancia establece el límite de la región de rechazo, por tanto la hipótesis nula en un estudio se rechaza cuando el valor p asociado a la prueba estadística utilizada para contrastar la hipótesis, es inferior al valor alfa establecido por el investigador (valor p < nivel de significancia).

Para terminar, se recomienda utilizar el valor p al momento de referirnos a la significancia estadística, cuando empleamos frases como: "existe diferencia significativa", "existe relación significativa", "es significativamente diferente de cero". Conclusiones de este tipo deben ir acompañadas del valor p asociado a la prueba, más que del nivel de significancia establecido por el investigador. El valor p como parte de los resultados de una investigación proporciona más información al lector que afirmaciones del tipo: "la hipótesis nula se rechaza en el nivel 0.05 de significancia", "los resultados no son significativos a un nivel de 0.05". Mientras que el informar el valor p asociado a una prueba permite al lector saber con exactitud que tan probable o no es el valor calculado de la prueba estadística realizada dado que la hipótesis nula es verdadera.


BIBLIOGRAFIA.

Daniel, Wayne W. Bioestadística base para el análisis de las ciencias de la salud, UTEHA, Noriega Editores, 1996. pp. 256.

Smith, Peter G & Morrow, Richard H. Ensayos de campo de intervenciones en salud en países en desarrollo. 2° edición. OPS, 1998. pp. 256-257.

Polit, Denise F. & Hungler, Bernadette p. Hungler. Investigación científica en ciencias de la salud. 6° edición. McGraw-Hill Interamericana. 2000. pp. 90-91.

Hernández, S. Roberto. Fernández, C. Carlos. Baptista, L. Pilar. Metodología de la investigación. 2° edición. McGraw-Hill. 2000. pp. 368-371.

Ramon, T. Josep. M. Métodos de investigación en odontología. Masson, S.A. 2000. pp. 126-127.

 

Volver a la página principal

 

 

 

1