What is a nonsense correlation in neuroscience?

¿Qué son las Correlaciones Sin Sentido?

Valoración: 4.16 (7129 votos)

Imagina que un neurocientífico observa la actividad cerebral de un ratón y, sorprendentemente, descubre que el patrón de disparo de muchas de sus neuronas parece estar extrañamente correlacionado con las fluctuaciones del precio de una criptomoneda en tiempo real. ¿Significa esto que los ratones son expertos en el mercado financiero? Absolutamente no. Este escenario, aunque basado en un hallazgo satírico real de 2021 por Guido Meijer, ilustra un problema estadístico común y a menudo subestimado en la investigación: las correlaciones sin sentido.

Las correlaciones sin sentido, también conocidas como correlaciones espurias o volátiles, ocurren cuando dos variables que en realidad no tienen una relación causal directa muestran una correlación estadística significativa. La explicación más frecuente es que ambas variables están influenciadas por una tercera variable, a menudo el tiempo. Si dos cosas cambian de manera constante o predecible a lo largo del tiempo, parecerán correlacionadas incluso si una no causa la otra, ni comparten una causa común más allá del simple paso del tiempo.

What is a nonsense correlation in neuroscience?
Nonsense correlations are an altogether too common issue in systems neuroscience that can crop up whenever researchers incorrectly assume that samples in a study are statistically independent. Simultaneously recorded neurons are not statistically independent, nor are successive time points or trials in a recording.Aug 12, 2024

Piensa en ejemplos fuera de la neurociencia. Se ha observado una fuerte correlación entre la disminución de los matrimonios de la Iglesia de Inglaterra y el aumento de la esperanza de vida a lo largo del siglo XX. ¿Sugiere esto que casarse por la iglesia acorta la vida? No. Ambas son tendencias sociales que evolucionaron con el tiempo debido a múltiples factores independientes.

Otro ejemplo clásico es la correlación entre el precio promedio de una casa en una ciudad a lo largo de décadas y el tamaño de la población de un país lejano durante el mismo período. Ambas variables tienden a aumentar con el tiempo debido a fuerzas económicas y demográficas globales y locales, pero no hay una relación causal directa entre el precio de una casa en Edimburgo en 1950 y la población de la India en el mismo año.

Índice de Contenido

El Peligro Oculto en la Neurociencia de Sistemas

Este tipo de correlación falsa es un problema particularmente insidioso en la neurociencia de sistemas, donde los investigadores a menudo trabajan con datos complejos que evolucionan con el tiempo. ¿Por qué es tan común aquí? Porque en la neurociencia, a menudo violamos una suposición fundamental de muchas pruebas estadísticas estándar: la independencia estadística de las muestras.

Cuando registramos la actividad de múltiples neuronas simultáneamente, sus patrones de disparo no son independientes; pueden estar influenciados por el mismo estado cerebral, las mismas entradas sensoriales o incluso el mismo ruido de fondo. De manera similar, puntos de tiempo sucesivos o ensayos consecutivos en un experimento no son independientes. El estado del animal, su nivel de atención, fatiga o aprendizaje pueden cambiar lentamente a lo largo de una sesión experimental, correlacionando así los datos a lo largo del tiempo.

Además, factores técnicos como la deriva del electrodo (donde la posición de un electrodo de registro se mueve ligeramente con el tiempo) o el movimiento cerebral pueden introducir correlaciones lentas y artificiales en las tasas de disparo neuronal registradas. Estos factores técnicos no tienen nada que ver con el estímulo o la tarea que se está estudiando, pero pueden generar patrones que *parecen* correlacionarse con variables experimentales que también cambian lentamente.

Considera un experimento típico de toma de decisiones en ratones donde la probabilidad de un estímulo (por ejemplo, aparecer a la izquierda o derecha) cambia en bloques de ensayos. Si una neurona se registra durante los primeros 100 ensayos (un bloque donde el estímulo aparece predominantemente a la izquierda) y luego se pierde la señal debido a la deriva del electrodo, un análisis estadístico ingenuo que asuma independencia entre ensayos podría mostrar una fuerte correlación entre el disparo de esa neurona y la "preferencia por la izquierda" del bloque. Sin embargo, esta correlación es sin sentido; simplemente refleja que la neurona estuvo presente durante un tipo de bloque y ausente durante otros, sin una relación funcional real con la regla del bloque.

Identificando la Trampa: Cuando las Muestras No Son Independientes

La señal de advertencia más importante de que podrías estar en riesgo de encontrar correlaciones sin sentido es si tus datos contienen variables que cambian lentamente con el tiempo o si tus "muestras" (como ensayos sucesivos o neuronas registradas simultáneamente) no son verdaderamente independientes entre sí. Si aplicas pruebas estadísticas diseñadas para datos independientes a datos que presentan estas dependencias temporales o espaciales, corres un alto riesgo de obtener resultados engañosos.

What is nonsense correlation with example?
A term used to describe a situation where two variables (X and Y, say) are correlated without being causally related to one another. The usual explanation is that they are both related to a third variable, Z. Often the third variable is time.

Un p-valor bajo obtenido de un análisis tradicional (como una correlación de Pearson o un t-test simple) no garantiza que una relación sea real si las suposiciones de independencia del método no se cumplen. La estadística, cuando se usa incorrectamente, puede "probar" casi cualquier cosa, lo cual subraya la importancia crítica de usar los métodos adecuados para el tipo de datos que tenemos.

La Solución: Abrazando la Aleatoriedad con Estadísticas Robustas

Afortunadamente, existen métodos estadísticos robustos que pueden manejar la falta de independencia en los datos y proteger a los investigadores de caer en la trampa de las correlaciones sin sentido. El primer paso, y quizás el más crucial, es simplemente preocuparse por la validez estadística. Si un científico no está activamente pensando si sus métodos son apropiados para sus datos, es probable que no lo sean.

Uno de los enfoques más poderosos y relativamente sencillos para evitar las correlaciones sin sentido, especialmente en experimentos bien controlados, son las pruebas de aleatorización. Estas pruebas son casi a prueba de fallos y requieren que al menos una parte del experimento haya sido aleatorizada por el experimentador.

En una prueba de aleatorización, el experimentador controla ciertas variables (como el tipo de estímulo en cada ensayo, el orden de las condiciones, etc.) según una regla probabilística conocida. Se mide un conjunto de variables de respuesta (como la actividad neuronal o el comportamiento). Se define una estadística de prueba que resume la relación entre las variables controladas y las variables medidas (por ejemplo, la correlación entre la actividad neuronal y el tipo de estímulo).

La clave de la prueba de aleatorización es que no asume independencia en los datos de respuesta. En cambio, genera una "distribución nula" simulando lo que ocurriría bajo la hipótesis nula (que las variables controladas no tienen efecto sobre las variables medidas) *re-aleatorizando* repetidamente solo las variables que el experimentador controló, siguiendo las mismas reglas probabilísticas del experimento original, mientras se mantienen intactas las variables medidas.

Por ejemplo, volviendo al experimento de bloques de decisiones: para probar si la actividad neuronal realmente responde al tipo de bloque (izquierda vs. derecha), no asumimos que los ensayos neuronales son independientes. En su lugar, generamos muchas "pseudosessiones" creando secuencias de tipos de bloque completamente nuevas, aleatorizadas según las mismas probabilidades utilizadas en el experimento real, pero manteniendo la secuencia *original* de actividad neuronal tal cual fue registrada (con sus derivas y dependencias temporales). Luego, calculamos nuestra estadística de prueba (por ejemplo, la correlación entre la actividad neuronal y el tipo de bloque) para cada una de estas pseudosessiones.

Si la actividad neuronal real no tiene relación con el tipo de bloque, entonces la correlación observada en el experimento real debería ser similar a las correlaciones que encontramos en estas pseudosessiones aleatorizadas. La pseudosession mantiene las dependencias temporales y las derivas en los datos neuronales, pero rompe cualquier relación *verdadera* con la variable experimental (el tipo de bloque). Si la estadística de prueba real cae fuera del rango típico de las estadísticas de las pseudosessiones (por ejemplo, en el 95% superior), podemos rechazar la hipótesis nula y concluir que hay una relación real, una que no es simplemente una correlación sin sentido inducida por dependencias temporales.

Why is correlation said to be nonsense?
“We call it 'volatile correlation', but it was first known as 'nonsense-correlation. ' That's when two time series are independent, yet high correlation is observed. It's 'volatile' because its distribution is both heavily dispersed and is frequently large in absolute value.”

Las pruebas de aleatorización son potentes porque no hacen suposiciones sobre la distribución o independencia de los datos de respuesta; solo requieren que las variables experimentales hayan sido aleatorizadas. Esto las convierte en una defensa robusta contra las correlaciones sin sentido.

Otras Estrategias y Consideraciones

Para situaciones donde las variables no fueron generadas aleatoriamente (por ejemplo, correlacionar la actividad cerebral con el comportamiento espontáneo de un animal), existen otros métodos. La "prueba de permutación de sesión", por ejemplo, puede comparar la correlación entre la actividad cerebral y el comportamiento dentro de una sesión con un conjunto nulo creado permutando o mezclando trazas de comportamiento completas entre diferentes sesiones de registro. Esto ayuda a controlar las dependencias temporales dentro de cada sesión.

Además de usar estadísticas robustas, el diseño experimental es una primera línea de defensa crucial. Aleatorizar todo lo que sea posible en un experimento (el orden de los estímulos, los intervalos entre ensayos, la entrega de recompensas, etc.) no solo facilita el análisis estadístico válido, sino que también puede permitir probar hipótesis que ni siquiera habías considerado al principio.

Un Legado Estadístico

La problemática de las correlaciones sin sentido no es nueva. Fue estudiada a fondo por primera vez en 1926 por el estadístico británico Udny Yule, quien notó las altas correlaciones entre cantidades no relacionadas que variaban con el tiempo. Él acuñó el término "nonsense-correlation". Aunque el fenómeno se conocía empíricamente, su base matemática precisa fue confirmada mucho más tarde por investigadores como Philip Ernst, Lawrence Shepp y Abraham Wyner, quienes demostraron que incluso dos procesos completamente independientes que varían con el tiempo (como los procesos de Wiener) pueden mostrar altas correlaciones espurias debido a su propia "auto-correlación" temporal.

La estadística a menudo se considera una tarea posterior o un detalle menor, y la preocupación por la validez estadística como algo pedante. Sin embargo, no usar estadísticas válidas es una receta para obtener resultados engañosos. Si un estudio presenta conclusiones llamativas basadas en métodos estadísticos cuestionables, hay una razón particular para ser escéptico.

Un consejo final: no uses métodos que no entiendas completamente. Las pruebas de aleatorización son conceptualmente simples. Otros métodos, como el bootstrap, pueden parecer simples, pero fallan en ciertas circunstancias (particularmente con datos dependientes). Si no sabes cuándo un método funciona y cuándo falla, es mejor apegarse a algo que realmente domines o buscar la guía de un estadístico.

Comparando Enfoques Estadísticos

CaracterísticaMétodos Tradicionales (Cuidado)Métodos Robustos (Recomendado)
Suposición ClaveA menudo asumen independencia de las muestras.No asumen independencia; manejan dependencias.
Sensibilidad a Derivas TemporalesAlta, pueden generar correlaciones espurias.Baja, diseñados para mitigar este efecto.
Riesgo de Correlación Sin SentidoSignificativo si no se cumplen las suposiciones.Reducido si se aplican correctamente.
AplicabilidadDatos genuinamente independientes, análisis simples.Datos de series temporales, datos neuronales simultáneos, experimentos aleatorizados.
EjemplosCorrelación de Pearson (simple), t-test (sin ajustes).Pruebas de aleatorización, Pruebas de permutación, Modelos lineales generalizados mixtos (con estructura de covarianza adecuada).

Preguntas Frecuentes (FAQ)

  • ¿Qué causa una correlación sin sentido?
    Generalmente, ocurre cuando dos variables no relacionadas comparten una tendencia similar a lo largo del tiempo o están influenciadas por una tercera variable no considerada. En neurociencia, la falta de independencia entre puntos de datos sucesivos o neuronas simultáneas (debido a derivas, estados internos, etc.) es una causa común.
  • ¿Por qué son un problema en neurociencia?
    La neurociencia de sistemas a menudo trabaja con datos de series temporales y registros simultáneos, donde la independencia es una suposición inválida. Esto puede llevar a identificar erróneamente correlaciones entre la actividad cerebral y variables experimentales o conductuales que no existen en realidad, llevando a conclusiones falsas.
  • ¿Basta con ver un p-valor bajo para confiar en una correlación?
    No. Un p-valor bajo solo es válido si se cumplen las suposiciones del test estadístico utilizado. Si el test asume independencia y tus datos no lo son (por ejemplo, tienes derivas temporales), un p-valor bajo puede ser el resultado de una correlación sin sentido, no de una relación real.
  • ¿Qué es una prueba de aleatorización?
    Es un método estadístico robusto que evalúa la significancia de una estadística de prueba comparándola con una "distribución nula" generada re-aleatorizando las variables experimentales controladas, en lugar de asumir distribuciones teóricas o independencia de los datos de respuesta. Son especialmente útiles con datos dependientes.
  • ¿Cómo diseño mi experimento para evitar esto?
    La clave es la aleatorización. Aleatoriza el orden de los estímulos, las condiciones, los intervalos entre ensayos, etc. Esto ayuda a romper las correlaciones artificiales inducidas por el tiempo o el orden, y permite el uso de métodos estadísticos más robustos como las pruebas de aleatorización.

En conclusión, la búsqueda de correlaciones es fundamental en la ciencia, pero debemos ser conscientes de las trampas estadísticas. Las correlaciones sin sentido representan un riesgo real, especialmente en campos como la neurociencia donde los datos a menudo presentan dependencias complejas. Al entender por qué ocurren, preocuparnos activamente por la validez estadística, utilizar métodos robustos como las pruebas de aleatorización y diseñar experimentos cuidadosamente, los investigadores pueden aumentar enormemente la fiabilidad de sus hallazgos y asegurarse de que las correlaciones que reportan reflejen relaciones genuinas, no meras coincidencias temporales.

Si quieres conocer otros artículos parecidos a ¿Qué son las Correlaciones Sin Sentido? puedes visitar la categoría Neurociencia.

Foto del avatar

Jesús Porta Etessam

Soy licenciado en Medicina y Cirugía y Doctor en Neurociencias por la Universidad Complutense de Madrid. Me formé como especialista en Neurología realizando la residencia en el Hospital 12 de Octubre bajo la dirección de Alberto Portera y Alfonso Vallejo, donde también ejercí como adjunto durante seis años y fui tutor de residentes. Durante mi formación, realicé una rotación electiva en el Memorial Sloan Kettering Cancer Center.Posteriormente, fui Jefe de Sección en el Hospital Clínico San Carlos de Madrid y actualmente soy jefe de servicio de Neurología en el Hospital Universitario Fundación Jiménez Díaz. Tengo el honor de ser presidente de la Sociedad Española de Neurología, además de haber ocupado la vicepresidencia del Consejo Español del Cerebro y de ser Fellow de la European Academy of Neurology.A lo largo de mi trayectoria, he formado parte de la junta directiva de la Sociedad Española de Neurología como vocal de comunicación, relaciones internacionales, director de cultura y vicepresidente de relaciones institucionales. También dirigí la Fundación del Cerebro.Impulsé la creación del grupo de neurooftalmología de la SEN y he formado parte de las juntas de los grupos de cefalea y neurooftalmología. Además, he sido profesor de Neurología en la Universidad Complutense de Madrid durante más de 16 años.

Subir