Prueba de Chi-Cuadrado

Foto del autor
Escrito por:Hugo Parrales

Doctor en Medicina. Investigador y docente Universitario. Amante de las matemáticas y apasionado de la Informática.

La prueba de Chi-Cuadrado es una herramienta estadística poderosa utilizada en diversos campos para evaluar la asociación entre variables categóricas. En este articulo te explicare que es la prueba de Chi-Cuadrado y como puedes usarla en tu investigación.

¿Qué es la Prueba de Chi-Cuadrado?

La prueba de Chi-Cuadrado prueba de significancia. Es una técnica estadística no paramétrica que evalúa si hay una asociación significativa entre variables categóricas. Se basa en la comparación de las frecuencias observadas en una tabla de contingencia con las frecuencias esperadas bajo la hipótesis nula de independencia entre las variables.

En términos simples es una formula que nos indica si nuestra Hipótesis es cierta o no mediante la correlación de 2 variables de nuestra investigación.

La prueba de Chi-Cuadrado es una prueba de significancia para comprobar Hipótesis. Por lo tanto, es indispensable ya tener las Hipótesis de nuestra Investigación. Ademas es recomendable ya haber realizado la Operacionalizacion de variables.

Utilidad de la Prueba de Chi-Cuadrado

La versatilidad de la prueba de chi-cuadrado la hace invaluable en diversas áreas, desde la medicina hasta las ciencias sociales.

Se utiliza para analizar datos de encuestas, estudios epidemiológicos, genética, entre otros. Además, es particularmente útil cuando las variables de interés son nominales o categóricas.

Tipos de Chi-Cuadrado

Existen dos tipos principales de pruebas de chi-cuadrado que se utilizan comúnmente en estadística: la prueba de independencia y la prueba de homogeneidad. Ambas pruebas se aplican a tablas de contingencia que involucran variables categóricas. A continuación, se describen estos dos tipos de pruebas:

Prueba de Independencia

La prueba de independencia de chi-cuadrado se utiliza para determinar si hay una asociación significativa entre dos variables categóricas. En otras palabras, se investiga si la ocurrencia de una categoría en una variable está relacionada de alguna manera con la ocurrencia de una categoría en otra variable. El supuesto nulo es que las dos variables son independientes.

¿El supuesto nulo?

En términos sencillos, el supuesto nulo en la prueba de independencia de chi-cuadrado significa que no hay relación o asociación significativa entre dos variables categóricas. En otras palabras, se asume que los valores o categorías de una variable no están influenciados o relacionados de ninguna manera con los valores o categorías de la otra variable.

Si aun es difícil de comprender, no te preocupes te lo explico con un ejemplo:

Imagina que tenemos dos cajas de bloques diferentes, una con bloques rojos y la otra con bloques azules. El supuesto nulo en la prueba de independencia sería como decir que no importa cuántos bloques tienes en una caja, no tiene nada que ver con cuántos bloques tienes en la otra caja.

El caso contrario es decir que si tienen relacion y si hay mas bloques rojos en una de las cajas afecta la cantidad de bloques azules en la otra.

La prueba de chi-cuadrado ayuda a entender si hay algo más sucediendo entre las dos cajas o si son realmente independientes.

Ejemplo de Prueba de Independencia

Imaginemos que estamos estudiando la relación entre el nivel de actividad física y la incidencia de enfermedades cardíacas en dos grupos de personas: personas activas y personas sedentarias. Queremos saber si hay alguna asociación significativa entre estos dos factores.

Hipótesis Nula (H0): El nivel de actividad física y la incidencia de enfermedades cardíacas son independientes entre sí.

Hipótesis Alternativa (H1): El nivel de actividad física y la incidencia de enfermedades cardíacas están asociados de alguna manera.

Recolectamos datos y creamos una tabla de contingencia que muestra la relación entre el nivel de actividad física y la incidencia de enfermedades cardíacas:

Actividad fisicaSedentaria
Enfermedad Cardiaca2030
Sin enfermedad cardiaca4010

Ahora, aplicamos la prueba de independencia de chi-cuadrado para ver si hay alguna asociación significativa. La prueba nos dirá si la incidencia de enfermedades cardíacas está relacionada de alguna manera con el nivel de actividad física.

Si el resultado de la prueba de independencia es significativo, podríamos concluir que hay una asociación real entre el nivel de actividad física y la incidencia de enfermedades cardíacas (Es decir confirmamos la Hipótesis Alternativa). Si no es significativo, podríamos decir que no hay evidencia suficiente para sugerir una asociación (Lo que confirmaría la Hipótesis Nula)

La prueba de independencia de chi-cuadrado nos ayuda a entender si dos variables categóricas están relacionadas o si son independientes entre sí.

Prueba de Homogeneidad

La prueba de homogeneidad de chi-cuadrado se utiliza para comparar la distribución de frecuencias de una variable categórica a través de diferentes grupos o poblaciones. La hipótesis nula es que las distribuciones de las variables categóricas son homogéneas en todos los grupos o poblaciones.

¿No queda claro verdad? Tranquilo con el siguiente ejemplo lo entenderás:

Ejemplo de Prueba de Homogeneidad

Vamos a imaginar una investigación sobre preferencias de mascotas en dos vecindarios diferentes, A y B. En el vecindario A, muchas personas tienen perros, y en el vecindario B, hay una mezcla de personas que tienen gatos y perros. Queremos saber si la preferencia por tener perros o gatos es similar en ambos vecindarios.

Hipótesis Nula (H0): La preferencia por tener perros o gatos es la misma en ambos vecindarios.

Hipótesis Alternativa (H1): La preferencia por tener perros o gatos es diferente en al menos uno de los vecindarios.

Ahora, recolectamos datos y creamos una tabla de contingencia que muestra cuántas personas en cada vecindario tienen perros y cuántas tienen gatos y ahora aplicamos una

MascotaVecindario AVecindario B
Perros3020
Gatos1030

Con estos datos podríamos ahora calcular Chi-Cuadrado.

Si el resultado de la prueba de homogeneidad es significativo, podríamos concluir que hay una diferencia real en las preferencias de mascotas entre los dos vecindarios (Es decir confirmamos la Hipótesis Alternativa) Si no es significativo, podríamos decir que no hay evidencia suficiente para sugerir que las preferencias son diferentes. (Lo que confirma la Hipótesis Nula)

En resumen, la prueba de homogeneidad nos ayuda a entender si hay alguna diferencia importante en las preferencias de mascotas entre dos grupos, en este caso, dos vecindarios.

Como se interpreta el resultado de la Prueba de Chi-Cuadrado

La interpretación del resultado de la prueba de chi-cuadrado implica evaluar el valor del estadístico de chi-cuadrado (χ2) y el valor p asociado.

  1. Estadístico de Chi-cuadrado (χ2χ2):
    • Un valor mayor de χ2 indica una mayor discrepancia entre las frecuencias observadas y esperadas.
    • Cuanto mayor sea el valor de χ2, mayor será la evidencia en contra de la hipótesis nula.
  2. Valor p:
    • El valor p indica la probabilidad de obtener un estadístico de chi-cuadrado tan extremo como el observado, asumiendo que la hipótesis nula es verdadera.
    • Un valor p pequeño (generalmente < 0.05) sugiere que hay evidencia suficiente para rechazar la hipótesis nula.
    • Un valor p grande (> 0.05) sugiere que no hay suficiente evidencia para rechazar la hipótesis nula.

En resumen:

  • Esto es lo que debes recordar:
    • Si el valor p es menor que el nivel de significancia elegido (por ejemplo, 0.05), se rechaza la hipótesis nula.
    • Si el valor p es mayor que el nivel de significancia, no se puede rechazar la hipótesis nula.

Suena complicado lo se… 🙁 pero no te preocupes lo entenderás con un ejemplo:

Ejemplo de interpretación de Prueba de Chi-Cuadrado

Supongamos que realizamos una prueba de independencia entre el nivel de actividad física y la incidencia de enfermedades cardíacas, y obtenemos un valor de χ2 de 15.6 con 1 grado de libertad y un valor p de 0.0001.

  • χ2 = 15.6: Indica la magnitud de la discrepancia entre las frecuencias observadas y esperadas.
  • Grados de libertad df = 1: Indica el número de restricciones en el modelo (filas menos uno por columnas menos uno).
  • Valor p = 0.0001: Es la probabilidad de obtener un χ2 tan extremo como el observado si la hipótesis nula es verdadera.

Nos concentraremos en el valor de p no te preocupes de momento por el grado de libertad.

Dado que el valor p (0.0001) es menor que el nivel de significancia comúnmente utilizado de 0.05, tendríamos evidencia suficiente para rechazar la hipótesis nula. En este caso, podríamos concluir que hay una asociación significativa entre el nivel de actividad física y la incidencia de enfermedades cardíacas.

¿Cómo realizar una prueba de Chi-Cuadrado?

Para realizar la prueba de Chi-Cuadrado debemos seguir los siguientes pasos:

  • El primer paso es definir la Hipótesis nula y la Hipótesis alternativa
  • El siguiente paso es definir el valor de alfa. El valor de alfa es senescencia el riesgo que deseamos correr en la investigación para tener una conclusión errónea. Por lo general el valor de alfa es 0.05 para pruebas de independencia.
  • Establece ahora 2 variables categóricas y realiza una tabla cruzada
  • Calcula los valores esperados
  • Aplica la formula de Chi-Cuadrado
  • Interpreta la prueba de Chi-Cuadrado y saca conclusiones

Prueba de Chi-Cuadrado en Excel

Microsoft Excel es uno de los programas mas utilizados para el analisis de datos en las investigaciones. Por ello te mostraremos como aplicar la prueba de Chi-Cuadrado en Excel:

Para este ejemplo usaremos los datos del caso de relación entre enfermedades cardiacas y actividad física:

Prueba Chi-Cuadrado

Como calcular los valores esperados

Para poder aplicar la Prueba de Chi-Cuadrado necesitamos calcular los valores esperados, para ello utilizamos la siguiente formula:

Formula valores esperados Chi-Cuadrado

En Excel los valores esperados pueden calcularse empleando una formula en la que multiplicamos las celdas con los totales de cada fila x el total de la columna y se divide con el total de la última columna:

Valores esperados en Excel para Chi-Cuadrado

En este ejemplo la tabla de valores esperados quedaría de la siguiente forma:

Ahora que ya tenemos los valores reales y los valores esperados podemos aplicar la Prueba de Chi-Cuadrado

Formula de Chi-Cuadrado en Excel

La formula o función de Chi-Cuadrado en Excel es la siguiente: PRUEBA.CHICUAD

La forma de utilizar es PRUEBA.CHICUAD(RANGO REAL; RANGO ESPERADO)

En nuestro ejemplo quedaria asi:

Formula PRUEBA.CHICUAD

Siendo entonces que el resutlado que obtenmos es el siguiente:

Interpretación y comprobación de Hipotesis con Chi-Cuadrado

Cómo puedes ver en este ejemplo el valor de p es de 0.00004456 es decir un valor que es menor a 0.05. Es decir que en este caso hay evidencia para rechazar la Hipotesis nula.

Si recuerdas nuestras Hipótesis en este ejemplo eran:

Hipótesis Nula (H0): El nivel de actividad física y la incidencia de enfermedades cardíacas son independientes entre sí.

Hipótesis Alternativa (H1): El nivel de actividad física y la incidencia de enfermedades cardíacas están asociados de alguna manera.

Por lo que mediante la Prueba de Chi-Cuadrado podemos determinar qué se rechaza la Hipótesis Nula al tener un valor de p menor a 0.05. Lo que nos indica que sí hay sí hay una correlación significativa entre el nivel de actividad FISICA y la incidencia de las enfermedades cardiacas. (Se confirma nuestra Hipótesis Alternativa)

Espero que con este mega articulo y guía de la Prueba de Chi-Cuadrado entiendas mejor de que va esta prueba y como te puede ayudar en tu investigación para sacar un A+ 🙂

1 comentario en «Prueba de Chi-Cuadrado»

Deja un comentario