1

A pesar de los esfuerzos realizados año tras año por los profesores de estadística, existe una tendencia generalizada y errónea que consiste en confundir correlación con causación. Antes de abordar el tema es necesario definir ambos conceptos:

  • Correlación: indica la fuerza y la dirección de una relación (lineal) entre dos variables.
  • Causación: indica que un evento es el resultado de la ocurrencia de otro.

Una causación necesariamente implica una correlación, sin embargo, una correlación puede o no implicar una causación. Por ejemplo, en un popular estudio (http://psycnet.apa.org/psycinfo/1996-05957-011) se evidenció una correlación entre ver telenovelas (A) y presentar trastornos alimenticios (B). Ante este resultado (A correlaciona con B) se pueden desprender diferentes hipótesis:

  • La primera hipótesis que podríamos plantear es que la observación reiterada de unos cánones de belleza irreales provoca trastornos alimenticios (A causa B).
  • Otra hipótesis posible sería que las personas con predisposición a sufrir una baja autoimagen corporal sientan predilección hacia las telenovelas porque éstas, de algún modo, les resulten reconfortantes (B causa A).
  • Finamente, podría plantearse que ninguna variable sea la causa de la otra, sino que un rasgo común, como una sobrevaloración de la imagen corporal en el contexto de esas personas, sea la causa de las otras dos variables (C causa A y B).

Lo importante aquí es que, aunque sea lícito plantar cualquiera de estas tres hipótesis a tenor de los resultados del estudio, ninguna de ellas puede ser aceptada o rechazada con dichos resultados. Partiendo de una correlación entre variables NUNCA se puede concluir una relación de causa. Prueba de ello es la página http://tylervigen.com/spurious-correlations en la que podemos encontrar correlaciones espurias (relación entre dos acontecimientos sin relación lógica) como, por ejemplo, la correlación entre el número de personas ahogadas por caer en una piscina y el número de películas en las que Nicolas Cage aparece:

2

 

¿Cómo se puede establecer entonces una relación de causa?

La forma más adecuada (la única estrictamente correcta para muchos especialistas) es mediante un estudio de tipo experimental. En este tipo de estudios se selecciona a dos grupos de personas equivalentes en todas las variables extrañas que pudieran influir en los resultados (edad, inteligencia, estatus socioeconómico, nivel educativo, preocupación por la imagen corporal, etc.). Acto seguido, se les asigna una situación experimental diferente a cada uno. Por ejemplo, que un grupo (experimental) vea telenovelas y que el otro grupo (control) vea programas de deporte. Si, tras un periodo de exposición, en las personas que han observado telenovelas apareciesen trastornos de alimentación y en las personas que han observado programas de deporte no, entonces podríamos concluir que observar telenovelas es la causa de esos trastornos de alimentación.

Existen problemas éticos por los que este tipo de estudios tienen limitaciones en cuanto a su aplicación. No sería ético seleccionar dos grupos equivalentes y obligar a uno  de ellos a fumar, mientras que se lo impedimos al otro grupo, para comprobar si fumar realmente causa cáncer de pulmón. En estas situaciones no se puede aplicar un estudio experimental y la única alternativa son los estudios observacionales, en los que establecer una relación de causación frente a una mera correlación resulta más complicado. Con los datos obtenidos en un estudio observacional sólo se puede establecer una relación de causa si los efectos encontrados son frecuentes y tienen un una intensidad extremadamente alta. Además, se tiene que cumplir el requisito de que no exista ninguna otra hipótesis alternativa que sea capaz de explicar los datos en mayor grado que la hipótesis de la causación.