La investigación científica avanza a pasos agigantados, y una de las claves para acelerar este progreso es la capacidad de compartir y reutilizar los datos generados. En el campo de la neurociencia, donde los conjuntos de datos de neuroimagen son a menudo complejos y de gran tamaño, esta necesidad se vuelve aún más apremiante. Asegurar la reproducibilidad de los hallazgos y maximizar el impacto de las inversiones públicas en ciencia dependen fundamentalmente de la apertura y la accesibilidad de los datos. Es aquí donde surge OpenNeuro, un archivo de datos diseñado específicamente para abordar estos desafíos en el ámbito de la neuroimagen, facilitando la compartición abierta y el reuso de una amplia gama de tipos de datos cerebrales.

OpenNeuro es un archivo de datos fundamental dentro de la iniciativa BRAIN (Brain Research Through Advancing Innovative Neurotechnologies) que permite a los investigadores compartir abiertamente datos de diversos tipos de neuroimagen, adhiriéndose rigurosamente a los principios FAIR (Findable, Accessible, Interoperable, Reusable - Encontrable, Accesible, Interoperable, Reutilizable) para la compartición de datos. La plataforma destaca la importancia crucial del estándar BIDS (Brain Imaging Data Structure) como facilitador esencial para una curación, compartición y reuso efectivos de los datos. Actualmente, OpenNeuro alberga más de 600 conjuntos de datos, incluyendo información de más de 20,000 participantes, abarcando múltiples especies, modalidades de medición y una amplia gama de fenotipos. El impacto de estos datos compartidos es innegable, reflejado en un número creciente de publicaciones que reutilizan estos datasets, superando ya las 150.
- La Evolución de OpenNeuro: Del OpenfMRI a la Apertura Total
- Principios Fundamentales de OpenNeuro
- Gestión de Datos en OpenNeuro
- Open Source
- Proceso de Envío y Acceso a Datos
- Soporte al Usuario
- OpenNeuro y Otros Proyectos de Datos: Una Comparación Simplificada
- Preguntas Frecuentes sobre OpenNeuro
- ¿Qué tipos de datos de neuroimagen puedo encontrar o subir a OpenNeuro?
- ¿Son gratuitos los datos disponibles en OpenNeuro?
- ¿Cómo se protege la privacidad de los participantes en los datos compartidos?
- ¿Es necesario que mis datos cumplan con algún estándar para subirlos a OpenNeuro?
- ¿Cómo puedo acceder a los datos de OpenNeuro?
- ¿Debo citar los datos de OpenNeuro que utilizo en mis investigaciones?
- Conclusión
La Evolución de OpenNeuro: Del OpenfMRI a la Apertura Total
La idea de compartir datos de neuroimagen no es nueva. Pioneros como Gazzaniga y Van Horn establecieron un centro de datos de fMRI ya en 1999. La compartición de datos se consolidó aún más con iniciativas como la International Neuroimaging Data Sharing Initiative y grandes proyectos prospectivos como el Human Connectome Project (HCP), el NKI-Rockland sample, el estudio Adolescent Brain Cognitive Development (ABCD) y el UK Biobank. Estos proyectos a gran escala han demostrado el inmenso valor de los datos compartidos. Sin embargo, su alcance científico es inherentemente limitado, ya que cada uno se centra en un número restringido de tareas de imagen y tipos de medición.
Existe una vasta cantidad de conjuntos de datos de neuroimagen más pequeños, la llamada 'cola larga', recopilados para preguntas de investigación específicas. Poner estos datos a disposición es vital para garantizar la reproducibilidad y permitir la agregación de mediciones diversas para abordar nuevas preguntas científicas. OpenNeuro, que evolucionó del archivo OpenfMRI (inicialmente centrado solo en datos de fMRI humanos basados en tareas), aborda este desafío proporcionando a los investigadores una plataforma fácil para compartir una amplia gama de tipos de datos de neuroimagen de manera que cumpla con los principios FAIR.
Principios Fundamentales de OpenNeuro
Los principios que rigen OpenNeuro se basan en la experiencia de OpenfMRI y en los desarrollos más recientes en ciencia abierta.
Restricciones Mínimas para la Compartición
Los archivos de datos varían en cuanto a la restrictividad de sus acuerdos de uso. Mientras algunos requieren revisión de la pregunta científica e inclusión de autores corporativos, OpenNeuro se sitúa en el polo opuesto. Por defecto, libera los datos bajo una dedicación de Dominio Público Creative Commons Zero (CC0). Esto significa que no hay restricciones legales sobre quién puede usar los datos ni para qué propósito. Si bien no es un requisito legal, se espera que los investigadores citen los datos según las pautas proporcionadas en cada conjunto de datos. La principal motivación detrás de esta política es maximizar la accesibilidad de los datos para el mayor número posible de investigadores y ciudadanos científicos.
Compartición de Datos Centrada en Estándares: El Poder de BIDS
Para que los datos compartidos sean verdaderamente útiles para el descubrimiento eficiente, el reuso y la reproducibilidad, se requieren estándares claros para la organización de datos y metadatos. Estos estándares clarifican la estructura de los datos para los usuarios, reduciendo la necesidad de soporte por parte de los propietarios de datos y la curación por parte de los repositorios. También permiten la validación automatizada, el preprocesamiento y el análisis.
Muchos proyectos de compartición de datos anteriores se basaban en esquemas organizativos personalizados, lo que podía llevar a malentendidos y requerir una reorganización sustancial para adaptarse a flujos de trabajo de análisis comunes. La necesidad de un estándar claramente definido para datos de neuroimagen surgió de las experiencias en el proyecto OpenfMRI, donde el esquema personalizado era ad hoc y limitado.
Por ello, OpenNeuro se centró desde el principio en desarrollar un estándar de organización de datos más robusto e implementable en un validador automatizado. Se involucró a una gran comunidad de investigadores para establecer el estándar que eventualmente se convirtió en el Brain Imaging Data Structure (BIDS). BIDS es ahora un estándar comunitario muy exitoso para una amplia y creciente gama de tipos de datos de neuroimagen. Define esquemas para la organización de archivos y carpetas, la nomenclatura y la organización de metadatos. Su diseño se inspiró en las estructuras utilizadas en muchos laboratorios, facilitando la transición.
Una característica clave de BIDS es su extensibilidad, permitiendo a los miembros de la comunidad proponer extensiones para nuevos tipos de datos (MEG, EEG, PET, etc.). Además, se ha desarrollado un estándar para los resultados del procesamiento ('BIDS Derivatives'). Aunque BIDS y OpenNeuro son proyectos independientes, su relación es altamente sinérgica. Todos los datos cargados en OpenNeuro deben pasar una validación BIDS, garantizando que todos los datos en el archivo cumplen con las especificaciones BIDS en el momento de la carga. A su vez, el equipo de OpenNeuro ha contribuido significativamente al estándar y validador BIDS.
La adopción de BIDS maximiza la compatibilidad con herramientas de procesamiento y análisis y, crucialmente, minimiza el potencial de mala interpretación de los datos. OpenNeuro, al adoptar BIDS, se aleja de estructuras de datos específicas de proyectos o bases de datos diseñadas por el propietario o distribuidor, avanzando hacia un modelo de representación uniforme y claro acordado por la comunidad de investigación.
Adhesión a los Principios FAIR
Los principios FAIR (Encontrable, Accesible, Interoperable, Reutilizable) proporcionan un marco crucial para guiar el desarrollo de recursos de datos abiertos. OpenNeuro implementa cada uno de estos principios:
- Encontrable (Findable): Cada conjunto de datos tiene metadatos (del dataset BIDS y proporcionados por el remitente) y un identificador único persistente (DOI). Los metadatos BIDS son indexados y los metadatos a nivel de dataset se exponen según el estándar schema.org para ser indexados por recursos externos como Google Dataset Search.
- Accesible (Accessible): Los datos y metadatos pueden recuperarse mediante varios métodos (Amazon S3, herramienta de línea de comandos de OpenNeuro, DataLad) a través de protocolos estándar (http/https). Los metadatos también son accesibles programáticamente vía API web. Los metadatos permanecen disponibles incluso si los datos deben ser eliminados. No se requiere autenticación para acceder a los datos.
- Interoperable (Interoperable): Los datos y metadatos utilizan el estándar BIDS para asegurar una representación accesible y la interconexión con flujos de trabajo de análisis, como las BIDS Apps. Se trabaja continuamente para usar formatos más ricos y enlazar a ontologías o vocabularios FAIR relevantes.
- Reutilizable (Reusable): Los datos se liberan con un acuerdo de uso claro (por defecto, CC0). El uso del estándar BIDS asegura que los datos y metadatos sean consistentes con los estándares comunitarios del campo.
Gestión de Datos en OpenNeuro
Versionado y Preservación de Datos
OpenNeuro rastrea todos los cambios en los conjuntos de datos almacenados, permitiendo a los investigadores informar de manera inequívoca la versión exacta de los datos utilizados en cualquier análisis. Preserva todas las versiones de los datos mediante la creación de 'instantáneas' (snapshots) que señalan un punto específico en el tiempo del ciclo de vida de un dataset. La gestión de datos y las instantáneas están soportadas por DataLad, un sistema de gestión de datos distribuido, libre y de código abierto.
Protección de la Privacidad y Confidencialidad
Existe una relación directa entre la apertura de los datos y su potencial de reuso. Sin embargo, la apertura plantea preocupaciones sobre los riesgos para la privacidad y confidencialidad de los participantes en investigación con sujetos humanos. Éticamente, los investigadores deben minimizar los riesgos para los participantes y maximizar los beneficios de su participación. Compartir datos aumenta el potencial de utilidad, por lo que los investigadores están éticamente obligados a compartir datos humanos a menos que los riesgos superen los beneficios.
Los riesgos se abordan generalmente mediante la desidentificación de los datos. Bajo HIPAA en EE.UU., la desidentificación se logra eliminando 18 identificadores personales, a menos que se sepa que los datos restantes podrían reidentificarse ('método de puerto seguro'). En neuroimagen, un desafío particular es la estructura facial presente en algunas imágenes (como la resonancia magnética estructural). Es posible reconstruir estructuras faciales e incluso reidentificar individuos. Por ello, todos los datos de resonancia magnética compartidos a través de OpenNeuro deben tener las características faciales eliminadas (defacing) antes de la carga, además de los 18 identificadores HIPAA. Se permite una excepción si el investigador tiene permiso explícito para compartir sin defacing (usualmente si los datos fueron recolectados por ellos mismos).
Actualmente, un curador humano examina los datos para asegurar que se cumple este requisito. En el futuro, se planea implementar una herramienta automatizada de detección facial. El consentimiento verdaderamente informado requiere que los sujetos sean conscientes de que sus datos pueden ser compartidos públicamente y que la confidencialidad absoluta no puede garantizarse en el futuro. Por ello, se recomienda usar un formulario de consentimiento basado en el Open Brain Consent, que incluye lenguaje sobre la intención de compartir y su impacto potencial. Cabe destacar que, por ahora, OpenNeuro no puede compartir datos recogidos en países cubiertos por GDPR debido a los requisitos de acuerdos de uso más restrictivos.
Open Source
El código completo de OpenNeuro está disponible bajo una licencia de software libre permisiva (Licencia MIT) en GitHub. Esto permite a cualquier investigador reutilizar parte o la totalidad del código o incluso ejecutar su propia instancia de la plataforma. Esta apertura en el código refuerza la transparencia y la colaboración.
Proceso de Envío y Acceso a Datos
El proceso para compartir un dataset en OpenNeuro implica preparar los datos según el estándar BIDS y luego cargarlos en la plataforma, donde pasan una validación BIDS. Una vez compartidos, los datos pueden ser accedidos mediante varios mecanismos:
- Descarga Web: Cada instantánea tiene un enlace para descargar el dataset completo.
- DataLad: Permite instalar una copia completa de un dataset, difiriendo la descarga del contenido de los archivos hasta que se necesiten. Las instantáneas versionadas de OpenNeuro se implementan como etiquetas git, facilitando la recuperación o comparación de versiones específicas.
- Herramienta de Línea de Comandos de OpenNeuro: Proporciona acceso a la última instantánea de todos los datasets y suele ser más estable que las descargas por navegador para datasets grandes.
- Amazon S3: La última instantánea y todas las versiones anteriores pueden obtenerse utilizando clientes de AWS o directamente vía https.
Soporte al Usuario
OpenNeuro ofrece varios mecanismos de soporte:
- Soporte para Datasets Individuales: En cada página de dataset hay un foro de discusión. El propietario del dataset es notificado por email de las preguntas. Los usuarios pueden 'seguir' un dataset para recibir notificaciones de nuevos comentarios.
- Soporte del Sitio: Un helpdesk permite enviar preguntas específicas sobre el sitio. Para preguntas generales, se recomienda usar el foro de preguntas y respuestas Neurostars.org, para que las respuestas beneficien a toda la comunidad.
OpenNeuro y Otros Proyectos de Datos: Una Comparación Simplificada
Aunque OpenNeuro se alinea con la tendencia de compartir datos en neurociencia, difiere en su enfoque en comparación con algunos grandes proyectos.
| Característica | OpenNeuro | Grandes Proyectos (Ej. HCP, ABCD, UK Biobank) | Archivos Restringidos (Ej. ADNI) |
|---|---|---|---|
| Enfoque Principal | Archivo para 'cola larga' y datasets diversos; basado en comunidad | Generación de grandes datasets prospectivos con alcance limitado | Archivos para datasets específicos de enfermedades/condiciones; acceso controlado |
| Tipos de Datos | Amplia gama (MRI, EEG, MEG, PET, etc.) | Principalmente neuroimagen (fMRI, estructural, etc.), pero dentro del proyecto específico | Varía según el proyecto (ej. MRI, PET, datos clínicos para ADNI) |
| Acuerdo de Uso | Por defecto CC0 (Dominio Público) | Varía (puede ser más abierto que ADNI, pero a menudo requiere registro o acuerdos) | Altamente restrictivo (revisión científica, coautoría) |
| Estándar de Organización | Estrictamente BIDS | Inicialmente esquemas personalizados, algunos adoptando o influyendo en BIDS post-hoc | Varía, a menudo esquemas personalizados |
| Validación de Datos | Validación BIDS automática en la carga | Procesos de control de calidad internos, menos basados en estándares comunitarios abiertos | Procesos internos de control de calidad |
Esta tabla simplificada resalta cómo OpenNeuro se distingue por su enfoque en la comunidad, su adopción estricta de BIDS y su política de máxima apertura (CC0), facilitando la reutilización a gran escala de datos diversos.
Preguntas Frecuentes sobre OpenNeuro
Aquí respondemos algunas preguntas comunes sobre OpenNeuro:
¿Qué tipos de datos de neuroimagen puedo encontrar o subir a OpenNeuro?
OpenNeuro soporta una amplia gama de tipos de datos de neuroimagen gracias a su adhesión al estándar BIDS. Actualmente incluye datos de resonancia magnética (MRI, incluyendo fMRI, estructural, arterial spin labeling), electroencefalografía (EEG), magnetoencefalografía (MEG) y tomografía por emisión de positrones (PET). La extensibilidad de BIDS permite la incorporación futura de nuevos tipos de datos.
¿Son gratuitos los datos disponibles en OpenNeuro?
Sí. Por defecto, los datos en OpenNeuro se publican bajo una dedicación de Dominio Público CC0 (Creative Commons Zero). Esto significa que los datos son esencialmente libres de usar para cualquier propósito, sin restricciones legales. Se espera que los usuarios sigan las normas comunitarias y citen los conjuntos de datos que utilizan, pero legalmente no hay barreras para el acceso y reuso.
¿Cómo se protege la privacidad de los participantes en los datos compartidos?
OpenNeuro toma medidas para proteger la privacidad. Todos los datos de resonancia magnética deben pasar por un proceso de 'defacing' para eliminar las características faciales antes de ser cargados. Además, se deben eliminar los 18 identificadores personales especificados por HIPAA. Aunque se realiza una revisión manual, se planea implementar validación automatizada en el futuro. Se recomienda a los investigadores obtener consentimiento informado explícito para la compartición de datos, idealmente usando un formulario como el Open Brain Consent.
¿Es necesario que mis datos cumplan con algún estándar para subirlos a OpenNeuro?
Sí, es un requisito fundamental. Todos los datos cargados en OpenNeuro deben estar organizados y formateados según el estándar Brain Imaging Data Structure (BIDS) y pasar la validación BIDS antes de ser aceptados en el archivo. Esto garantiza la consistencia, la interoperabilidad y la facilidad de reuso de todos los datos en la plataforma.
¿Cómo puedo acceder a los datos de OpenNeuro?
Hay varias formas de acceder a los datos. Puedes descargar datasets directamente desde la página web. Para colecciones más grandes o un acceso más programático, puedes usar la herramienta DataLad, la herramienta de línea de comandos de OpenNeuro, o acceder directamente a través de Amazon S3. DataLad es particularmente útil porque permite descargar solo los metadatos o partes específicas del dataset.
¿Debo citar los datos de OpenNeuro que utilizo en mis investigaciones?
Aunque la licencia CC0 no lo exige legalmente, es una expectativa fuerte y una norma comunitaria en la investigación científica. Cada dataset en OpenNeuro proporciona pautas de citación. Citar los datos es crucial para dar crédito a los investigadores que los recopilaron y para permitir que otros encuentren y verifiquen tus resultados.
Conclusión
OpenNeuro representa un paso significativo hacia la ciencia abierta en neurociencia. Al proporcionar un archivo robusto y fácil de usar que se adhiere estrictamente al estándar BIDS y a los principios FAIR, facilita la compartición y reutilización de una gran cantidad de datos de neuroimagen. Esto no solo mejora la reproducibilidad de la investigación, sino que también potencia nuevos descubrimientos al permitir que investigadores de todo el mundo accedan y analicen colecciones de datos diversas. Con una base de datos en constante crecimiento y planes futuros para mejorar la automatización y la integración con otras iniciativas de ciencia abierta, OpenNeuro se consolida como una herramienta esencial para la comunidad global de neurociencia.
Si quieres conocer otros artículos parecidos a OpenNeuro: Datos Abiertos para el Cerebro puedes visitar la categoría Neurociencia.
