Prueba de Shapiro-Wilk

Foto del autor
Escrito por:Hugo Parrales

Doctor en Medicina. Investigador y docente Universitario. Amante de las matemáticas y apasionado de la Informática.

La Prueba de Shapiro-Wilk es una de las pruebas de normalidad mas utilizadas en el campo de la investigacion y la bioestadística. En este articulo te explicamos como aplicarla paso a paso para que obtengas un A+ en tu Investigacion.

¿Que es la Prueba de Shapiro-Wilk?

La prueba de Shapiro-Wilk es una prueba estadística utilizada para evaluar si un conjunto de datos sigue una distribución normal.

La distribución normal, también conocida como distribución gaussiana, es una distribución estadística simétrica y acampanada que se utiliza con frecuencia en análisis estadísticos debido a sus propiedades matemáticas y su aparición en muchos fenómenos naturales.

Cuando aplicas la prueba de Shapiro-Wilk a un conjunto de datos, la prueba te dice si es probable que esos números provengan de una población que tiene una distribución normal o no. En otras palabras, la prueba ayuda a responder la pregunta de si los datos se comportan de manera «normal» o si son diferentes de lo que esperaríamos.

Utilidad de la Prueba de Shapiro-Wilk

La prueba de Shapiro-Wilk se utiliza para verificar la hipótesis nula de que los datos provienen de una población con una distribución normal.

La hipótesis nula (H0) es que los datos son normales, mientras que la hipótesis alternativa (H1) es que los datos no siguen una distribución normal.

El procedimiento de la prueba genera un valor de prueba W y se compara con un valor crítico para determinar si se rechaza o no la hipótesis nula. Si el valor de prueba W es significativamente menor de lo esperado bajo la suposición de normalidad, se rechaza la hipótesis nula, lo que sugiere que los datos no siguen una distribución normal.

Interpretación de Shapiro-Wilk

La interpretación de la prueba de Shapiro-Wilk suele basarse en el valor de prueba W que se obtiene y en comparación con un valor crítico. Aquí hay una guía general para interpretar los resultados:

  1. Hipótesis nula (H0): La hipótesis nula en la prueba de Shapiro-Wilk es que los datos siguen una distribución normal.
  2. Valor de prueba (W): La prueba produce un valor de prueba W. Si el valor de W es cercano a 1, sugiere que los datos se ajustan bien a una distribución normal.
  3. Comparación con valor crítico: El valor de prueba se compara con un valor crítico. Si el valor de prueba es menor que el valor crítico, se rechaza la hipótesis nula, lo que significa que hay evidencia para decir que los datos no siguen una distribución normal.
  4. Conclusión:
    • Rechazo de H0: Si se rechaza la hipótesis nula, se interpreta que los datos no siguen una distribución normal.
    • No rechazo de H0: Si no se puede rechazar la hipótesis nula, no hay suficiente evidencia para afirmar que los datos no son normales.

¿Y el valor de p?

La prueba de Shapiro-Wilk no proporciona directamente un valor de p en la interpretación estándar. En cambio, se compara el valor de prueba W con un valor crítico que depende del tamaño de la muestra. Si el valor de prueba W es significativamente menor que el valor crítico, se rechaza la hipótesis nula de que los datos provienen de una distribución normal.

Para obtener el valor de p asociado con la prueba de Shapiro-Wilk, puedes recurrir a software estadístico o herramientas en línea. Estos programas calcularán automáticamente el valor de p para ti. El valor de p indica la probabilidad de obtener un valor de prueba al menos tan extremo como el observado, asumiendo que la hipótesis nula es verdadera.

En la interpretación convencional, si el valor de p es menor que un nivel de significancia predefinido (como 0.05), se rechaza la hipótesis nula. Un valor de p pequeño sugiere evidencia en contra de la normalidad de los datos.

Como calcular la Prueba de Shapiro-Wilk paso a paso

Supongamos que tienes un conjunto de datos que representa las alturas de una muestra de personas y deseas saber si estas alturas siguen una distribución normal. Aquí hay un ejemplo hipotético:

Altura de personas en cm
165
170
175
160
180
168
172
185
162
177
Tabla ejemplo con datos de altura de personas en cm

Calcula el estadístico de prueba W:

En este ejemplo utilizaremos el programa de Jamovi para el cálculo de W de la Prueba de Shapiro-Wilk:

Calcular Shapiro-Wilk en Jamovi

Para calcular el valor de W en Jamovi debemos seguir los siguientes pasos:

  1. Vamos a la opción de «Exploracion»
  2. Ahora hacemos clic en «Descriptivas»
  3. Hacemos clic en la opción de Normalidad «Shapiro-Wilk»
Prueba de Shapiro-Wilk en Jamovi

Como puedes ver en este caso el valor de W de Shapiro-Wilk es de 0.98 y el valor de p de Shapiro-Wilk es de 0.96

Si analizamos los datos en un gráfico Q-Q podremos observar que la mayoría de los datos se encuentran en la linea de normalidad:

Grafico Q-Q de normalidad

Interpretación de la Normalidad

Ahora que ya conocemos el valor de W y el valor de p de la Prueba de Shapiro-Wilk podemos interpretar los resultados.

Recuerda que cuando el valor de p sea inferior a 0.05 existen diferencias con la distribución normal. Mientras que si el valor de p de la Prueba de Shapiro-Wilk es mayor a 0.05 se asume que la distribución es normal.

En este ejemplo el valor de p es de 0.96, un valor por encima de 0.05. Por lo que se puede concluir que esta serie de datos muestra un patrón de distribución normal.

Estos resultados sugieren que no hay evidencia suficiente para rechazar la hipótesis nula de que los datos siguen una distribución normal.

La interpretación sería que, según la prueba de Shapiro-Wilk, los datos de alturas en esta muestra podrían ser consistentes con una distribución normal.

¿Cual es el siguiente paso?

El siguiente paso es ahora utilizar pruebas parametricas o no parametricas para confirmar o rechazar la Hipótesis de la investigacion.

Si la distribución es normal utilizaremos pruebas parametricas, mientras que si la distrubucion no cumple el supuesto de normalidad utilizaremos pruebas no parametricas.

En este ejemplo las alturas en cm si tienen una distrubicion normal, por lo que podrían aplicarse pruebas como:

  1. Prueba t de Student:
    • Puedes usar la prueba t de Student si tus datos cumplen con la asunción de normalidad o si tienes un tamaño de muestra lo suficientemente grande para que los intervalos de confianza sean robustos ante desviaciones de la normalidad.
  2. ANOVA (Análisis de Varianza):
    • Si estás comparando las medias de más de dos grupos, puedes considerar ANOVA. Sin embargo, ANOVA también asume normalidad y homogeneidad de varianzas.

En los casos donde no se cumpla el supuesto de normalidad, podríamos usar pruebas no parametricas como;

  1. Prueba de Mann-Whitney:
    • Se utiliza para comparar dos grupos independientes. No asume normalidad y es robusta ante desviaciones de la misma.
  2. Prueba de Wilcoxon (Prueba de Rangos con Signos):
    • Es una alternativa no paramétrica a la prueba t para muestras relacionadas. Se utiliza si no se cumplen los supuestos de normalidad.
  3. Kruskal-Wallis:
    • Es el equivalente no paramétrico de ANOVA y se utiliza cuando estás comparando las medianas de más de dos grupos.
  4. Prueba de Friedman:
    • Es el equivalente no paramétrico de ANOVA para datos relacionados.

Esperamos que con esta explicación entiendas mejor el tema de Normalidad y la Prueba de Shapiro-Wilk. No dejes de explorar el resto del contenido para sacar un A+ en tu investigacion.

Deja un comentario