What is open neuro?

OpenNeuro: Datos Abiertos para el Cerebro

Valoración: 4.02 (2517 votos)

La investigación científica avanza a pasos agigantados, y una de las claves para acelerar este progreso es la capacidad de compartir y reutilizar los datos generados. En el campo de la neurociencia, donde los conjuntos de datos de neuroimagen son a menudo complejos y de gran tamaño, esta necesidad se vuelve aún más apremiante. Asegurar la reproducibilidad de los hallazgos y maximizar el impacto de las inversiones públicas en ciencia dependen fundamentalmente de la apertura y la accesibilidad de los datos. Es aquí donde surge OpenNeuro, un archivo de datos diseñado específicamente para abordar estos desafíos en el ámbito de la neuroimagen, facilitando la compartición abierta y el reuso de una amplia gama de tipos de datos cerebrales.

What is open neuro?
Here, we describe OpenNeuro, a BRAIN Initiative data archive that provides the ability to openly share data from a broad range of brain imaging data types following the FAIR principles for data sharing.

OpenNeuro es un archivo de datos fundamental dentro de la iniciativa BRAIN (Brain Research Through Advancing Innovative Neurotechnologies) que permite a los investigadores compartir abiertamente datos de diversos tipos de neuroimagen, adhiriéndose rigurosamente a los principios FAIR (Findable, Accessible, Interoperable, Reusable - Encontrable, Accesible, Interoperable, Reutilizable) para la compartición de datos. La plataforma destaca la importancia crucial del estándar BIDS (Brain Imaging Data Structure) como facilitador esencial para una curación, compartición y reuso efectivos de los datos. Actualmente, OpenNeuro alberga más de 600 conjuntos de datos, incluyendo información de más de 20,000 participantes, abarcando múltiples especies, modalidades de medición y una amplia gama de fenotipos. El impacto de estos datos compartidos es innegable, reflejado en un número creciente de publicaciones que reutilizan estos datasets, superando ya las 150.

Índice de Contenido

La Evolución de OpenNeuro: Del OpenfMRI a la Apertura Total

La idea de compartir datos de neuroimagen no es nueva. Pioneros como Gazzaniga y Van Horn establecieron un centro de datos de fMRI ya en 1999. La compartición de datos se consolidó aún más con iniciativas como la International Neuroimaging Data Sharing Initiative y grandes proyectos prospectivos como el Human Connectome Project (HCP), el NKI-Rockland sample, el estudio Adolescent Brain Cognitive Development (ABCD) y el UK Biobank. Estos proyectos a gran escala han demostrado el inmenso valor de los datos compartidos. Sin embargo, su alcance científico es inherentemente limitado, ya que cada uno se centra en un número restringido de tareas de imagen y tipos de medición.

Existe una vasta cantidad de conjuntos de datos de neuroimagen más pequeños, la llamada 'cola larga', recopilados para preguntas de investigación específicas. Poner estos datos a disposición es vital para garantizar la reproducibilidad y permitir la agregación de mediciones diversas para abordar nuevas preguntas científicas. OpenNeuro, que evolucionó del archivo OpenfMRI (inicialmente centrado solo en datos de fMRI humanos basados en tareas), aborda este desafío proporcionando a los investigadores una plataforma fácil para compartir una amplia gama de tipos de datos de neuroimagen de manera que cumpla con los principios FAIR.

Principios Fundamentales de OpenNeuro

Los principios que rigen OpenNeuro se basan en la experiencia de OpenfMRI y en los desarrollos más recientes en ciencia abierta.

Restricciones Mínimas para la Compartición

Los archivos de datos varían en cuanto a la restrictividad de sus acuerdos de uso. Mientras algunos requieren revisión de la pregunta científica e inclusión de autores corporativos, OpenNeuro se sitúa en el polo opuesto. Por defecto, libera los datos bajo una dedicación de Dominio Público Creative Commons Zero (CC0). Esto significa que no hay restricciones legales sobre quién puede usar los datos ni para qué propósito. Si bien no es un requisito legal, se espera que los investigadores citen los datos según las pautas proporcionadas en cada conjunto de datos. La principal motivación detrás de esta política es maximizar la accesibilidad de los datos para el mayor número posible de investigadores y ciudadanos científicos.

Compartición de Datos Centrada en Estándares: El Poder de BIDS

Para que los datos compartidos sean verdaderamente útiles para el descubrimiento eficiente, el reuso y la reproducibilidad, se requieren estándares claros para la organización de datos y metadatos. Estos estándares clarifican la estructura de los datos para los usuarios, reduciendo la necesidad de soporte por parte de los propietarios de datos y la curación por parte de los repositorios. También permiten la validación automatizada, el preprocesamiento y el análisis.

Muchos proyectos de compartición de datos anteriores se basaban en esquemas organizativos personalizados, lo que podía llevar a malentendidos y requerir una reorganización sustancial para adaptarse a flujos de trabajo de análisis comunes. La necesidad de un estándar claramente definido para datos de neuroimagen surgió de las experiencias en el proyecto OpenfMRI, donde el esquema personalizado era ad hoc y limitado.

Por ello, OpenNeuro se centró desde el principio en desarrollar un estándar de organización de datos más robusto e implementable en un validador automatizado. Se involucró a una gran comunidad de investigadores para establecer el estándar que eventualmente se convirtió en el Brain Imaging Data Structure (BIDS). BIDS es ahora un estándar comunitario muy exitoso para una amplia y creciente gama de tipos de datos de neuroimagen. Define esquemas para la organización de archivos y carpetas, la nomenclatura y la organización de metadatos. Su diseño se inspiró en las estructuras utilizadas en muchos laboratorios, facilitando la transición.

Una característica clave de BIDS es su extensibilidad, permitiendo a los miembros de la comunidad proponer extensiones para nuevos tipos de datos (MEG, EEG, PET, etc.). Además, se ha desarrollado un estándar para los resultados del procesamiento ('BIDS Derivatives'). Aunque BIDS y OpenNeuro son proyectos independientes, su relación es altamente sinérgica. Todos los datos cargados en OpenNeuro deben pasar una validación BIDS, garantizando que todos los datos en el archivo cumplen con las especificaciones BIDS en el momento de la carga. A su vez, el equipo de OpenNeuro ha contribuido significativamente al estándar y validador BIDS.

La adopción de BIDS maximiza la compatibilidad con herramientas de procesamiento y análisis y, crucialmente, minimiza el potencial de mala interpretación de los datos. OpenNeuro, al adoptar BIDS, se aleja de estructuras de datos específicas de proyectos o bases de datos diseñadas por el propietario o distribuidor, avanzando hacia un modelo de representación uniforme y claro acordado por la comunidad de investigación.

Adhesión a los Principios FAIR

Los principios FAIR (Encontrable, Accesible, Interoperable, Reutilizable) proporcionan un marco crucial para guiar el desarrollo de recursos de datos abiertos. OpenNeuro implementa cada uno de estos principios:

  • Encontrable (Findable): Cada conjunto de datos tiene metadatos (del dataset BIDS y proporcionados por el remitente) y un identificador único persistente (DOI). Los metadatos BIDS son indexados y los metadatos a nivel de dataset se exponen según el estándar schema.org para ser indexados por recursos externos como Google Dataset Search.
  • Accesible (Accessible): Los datos y metadatos pueden recuperarse mediante varios métodos (Amazon S3, herramienta de línea de comandos de OpenNeuro, DataLad) a través de protocolos estándar (http/https). Los metadatos también son accesibles programáticamente vía API web. Los metadatos permanecen disponibles incluso si los datos deben ser eliminados. No se requiere autenticación para acceder a los datos.
  • Interoperable (Interoperable): Los datos y metadatos utilizan el estándar BIDS para asegurar una representación accesible y la interconexión con flujos de trabajo de análisis, como las BIDS Apps. Se trabaja continuamente para usar formatos más ricos y enlazar a ontologías o vocabularios FAIR relevantes.
  • Reutilizable (Reusable): Los datos se liberan con un acuerdo de uso claro (por defecto, CC0). El uso del estándar BIDS asegura que los datos y metadatos sean consistentes con los estándares comunitarios del campo.

Gestión de Datos en OpenNeuro

Versionado y Preservación de Datos

OpenNeuro rastrea todos los cambios en los conjuntos de datos almacenados, permitiendo a los investigadores informar de manera inequívoca la versión exacta de los datos utilizados en cualquier análisis. Preserva todas las versiones de los datos mediante la creación de 'instantáneas' (snapshots) que señalan un punto específico en el tiempo del ciclo de vida de un dataset. La gestión de datos y las instantáneas están soportadas por DataLad, un sistema de gestión de datos distribuido, libre y de código abierto.

Protección de la Privacidad y Confidencialidad

Existe una relación directa entre la apertura de los datos y su potencial de reuso. Sin embargo, la apertura plantea preocupaciones sobre los riesgos para la privacidad y confidencialidad de los participantes en investigación con sujetos humanos. Éticamente, los investigadores deben minimizar los riesgos para los participantes y maximizar los beneficios de su participación. Compartir datos aumenta el potencial de utilidad, por lo que los investigadores están éticamente obligados a compartir datos humanos a menos que los riesgos superen los beneficios.

Los riesgos se abordan generalmente mediante la desidentificación de los datos. Bajo HIPAA en EE.UU., la desidentificación se logra eliminando 18 identificadores personales, a menos que se sepa que los datos restantes podrían reidentificarse ('método de puerto seguro'). En neuroimagen, un desafío particular es la estructura facial presente en algunas imágenes (como la resonancia magnética estructural). Es posible reconstruir estructuras faciales e incluso reidentificar individuos. Por ello, todos los datos de resonancia magnética compartidos a través de OpenNeuro deben tener las características faciales eliminadas (defacing) antes de la carga, además de los 18 identificadores HIPAA. Se permite una excepción si el investigador tiene permiso explícito para compartir sin defacing (usualmente si los datos fueron recolectados por ellos mismos).

Actualmente, un curador humano examina los datos para asegurar que se cumple este requisito. En el futuro, se planea implementar una herramienta automatizada de detección facial. El consentimiento verdaderamente informado requiere que los sujetos sean conscientes de que sus datos pueden ser compartidos públicamente y que la confidencialidad absoluta no puede garantizarse en el futuro. Por ello, se recomienda usar un formulario de consentimiento basado en el Open Brain Consent, que incluye lenguaje sobre la intención de compartir y su impacto potencial. Cabe destacar que, por ahora, OpenNeuro no puede compartir datos recogidos en países cubiertos por GDPR debido a los requisitos de acuerdos de uso más restrictivos.

Open Source

El código completo de OpenNeuro está disponible bajo una licencia de software libre permisiva (Licencia MIT) en GitHub. Esto permite a cualquier investigador reutilizar parte o la totalidad del código o incluso ejecutar su propia instancia de la plataforma. Esta apertura en el código refuerza la transparencia y la colaboración.

Proceso de Envío y Acceso a Datos

El proceso para compartir un dataset en OpenNeuro implica preparar los datos según el estándar BIDS y luego cargarlos en la plataforma, donde pasan una validación BIDS. Una vez compartidos, los datos pueden ser accedidos mediante varios mecanismos:

  • Descarga Web: Cada instantánea tiene un enlace para descargar el dataset completo.
  • DataLad: Permite instalar una copia completa de un dataset, difiriendo la descarga del contenido de los archivos hasta que se necesiten. Las instantáneas versionadas de OpenNeuro se implementan como etiquetas git, facilitando la recuperación o comparación de versiones específicas.
  • Herramienta de Línea de Comandos de OpenNeuro: Proporciona acceso a la última instantánea de todos los datasets y suele ser más estable que las descargas por navegador para datasets grandes.
  • Amazon S3: La última instantánea y todas las versiones anteriores pueden obtenerse utilizando clientes de AWS o directamente vía https.

Soporte al Usuario

OpenNeuro ofrece varios mecanismos de soporte:

  • Soporte para Datasets Individuales: En cada página de dataset hay un foro de discusión. El propietario del dataset es notificado por email de las preguntas. Los usuarios pueden 'seguir' un dataset para recibir notificaciones de nuevos comentarios.
  • Soporte del Sitio: Un helpdesk permite enviar preguntas específicas sobre el sitio. Para preguntas generales, se recomienda usar el foro de preguntas y respuestas Neurostars.org, para que las respuestas beneficien a toda la comunidad.

OpenNeuro y Otros Proyectos de Datos: Una Comparación Simplificada

Aunque OpenNeuro se alinea con la tendencia de compartir datos en neurociencia, difiere en su enfoque en comparación con algunos grandes proyectos.

CaracterísticaOpenNeuroGrandes Proyectos (Ej. HCP, ABCD, UK Biobank)Archivos Restringidos (Ej. ADNI)
Enfoque PrincipalArchivo para 'cola larga' y datasets diversos; basado en comunidadGeneración de grandes datasets prospectivos con alcance limitadoArchivos para datasets específicos de enfermedades/condiciones; acceso controlado
Tipos de DatosAmplia gama (MRI, EEG, MEG, PET, etc.)Principalmente neuroimagen (fMRI, estructural, etc.), pero dentro del proyecto específicoVaría según el proyecto (ej. MRI, PET, datos clínicos para ADNI)
Acuerdo de UsoPor defecto CC0 (Dominio Público)Varía (puede ser más abierto que ADNI, pero a menudo requiere registro o acuerdos)Altamente restrictivo (revisión científica, coautoría)
Estándar de OrganizaciónEstrictamente BIDSInicialmente esquemas personalizados, algunos adoptando o influyendo en BIDS post-hocVaría, a menudo esquemas personalizados
Validación de DatosValidación BIDS automática en la cargaProcesos de control de calidad internos, menos basados en estándares comunitarios abiertosProcesos internos de control de calidad

Esta tabla simplificada resalta cómo OpenNeuro se distingue por su enfoque en la comunidad, su adopción estricta de BIDS y su política de máxima apertura (CC0), facilitando la reutilización a gran escala de datos diversos.

Preguntas Frecuentes sobre OpenNeuro

Aquí respondemos algunas preguntas comunes sobre OpenNeuro:

¿Qué tipos de datos de neuroimagen puedo encontrar o subir a OpenNeuro?

OpenNeuro soporta una amplia gama de tipos de datos de neuroimagen gracias a su adhesión al estándar BIDS. Actualmente incluye datos de resonancia magnética (MRI, incluyendo fMRI, estructural, arterial spin labeling), electroencefalografía (EEG), magnetoencefalografía (MEG) y tomografía por emisión de positrones (PET). La extensibilidad de BIDS permite la incorporación futura de nuevos tipos de datos.

¿Son gratuitos los datos disponibles en OpenNeuro?

Sí. Por defecto, los datos en OpenNeuro se publican bajo una dedicación de Dominio Público CC0 (Creative Commons Zero). Esto significa que los datos son esencialmente libres de usar para cualquier propósito, sin restricciones legales. Se espera que los usuarios sigan las normas comunitarias y citen los conjuntos de datos que utilizan, pero legalmente no hay barreras para el acceso y reuso.

¿Cómo se protege la privacidad de los participantes en los datos compartidos?

OpenNeuro toma medidas para proteger la privacidad. Todos los datos de resonancia magnética deben pasar por un proceso de 'defacing' para eliminar las características faciales antes de ser cargados. Además, se deben eliminar los 18 identificadores personales especificados por HIPAA. Aunque se realiza una revisión manual, se planea implementar validación automatizada en el futuro. Se recomienda a los investigadores obtener consentimiento informado explícito para la compartición de datos, idealmente usando un formulario como el Open Brain Consent.

¿Es necesario que mis datos cumplan con algún estándar para subirlos a OpenNeuro?

Sí, es un requisito fundamental. Todos los datos cargados en OpenNeuro deben estar organizados y formateados según el estándar Brain Imaging Data Structure (BIDS) y pasar la validación BIDS antes de ser aceptados en el archivo. Esto garantiza la consistencia, la interoperabilidad y la facilidad de reuso de todos los datos en la plataforma.

¿Cómo puedo acceder a los datos de OpenNeuro?

Hay varias formas de acceder a los datos. Puedes descargar datasets directamente desde la página web. Para colecciones más grandes o un acceso más programático, puedes usar la herramienta DataLad, la herramienta de línea de comandos de OpenNeuro, o acceder directamente a través de Amazon S3. DataLad es particularmente útil porque permite descargar solo los metadatos o partes específicas del dataset.

¿Debo citar los datos de OpenNeuro que utilizo en mis investigaciones?

Aunque la licencia CC0 no lo exige legalmente, es una expectativa fuerte y una norma comunitaria en la investigación científica. Cada dataset en OpenNeuro proporciona pautas de citación. Citar los datos es crucial para dar crédito a los investigadores que los recopilaron y para permitir que otros encuentren y verifiquen tus resultados.

Conclusión

OpenNeuro representa un paso significativo hacia la ciencia abierta en neurociencia. Al proporcionar un archivo robusto y fácil de usar que se adhiere estrictamente al estándar BIDS y a los principios FAIR, facilita la compartición y reutilización de una gran cantidad de datos de neuroimagen. Esto no solo mejora la reproducibilidad de la investigación, sino que también potencia nuevos descubrimientos al permitir que investigadores de todo el mundo accedan y analicen colecciones de datos diversas. Con una base de datos en constante crecimiento y planes futuros para mejorar la automatización y la integración con otras iniciativas de ciencia abierta, OpenNeuro se consolida como una herramienta esencial para la comunidad global de neurociencia.

Si quieres conocer otros artículos parecidos a OpenNeuro: Datos Abiertos para el Cerebro puedes visitar la categoría Neurociencia.

Foto del avatar

Jesús Porta Etessam

Soy licenciado en Medicina y Cirugía y Doctor en Neurociencias por la Universidad Complutense de Madrid. Me formé como especialista en Neurología realizando la residencia en el Hospital 12 de Octubre bajo la dirección de Alberto Portera y Alfonso Vallejo, donde también ejercí como adjunto durante seis años y fui tutor de residentes. Durante mi formación, realicé una rotación electiva en el Memorial Sloan Kettering Cancer Center.Posteriormente, fui Jefe de Sección en el Hospital Clínico San Carlos de Madrid y actualmente soy jefe de servicio de Neurología en el Hospital Universitario Fundación Jiménez Díaz. Tengo el honor de ser presidente de la Sociedad Española de Neurología, además de haber ocupado la vicepresidencia del Consejo Español del Cerebro y de ser Fellow de la European Academy of Neurology.A lo largo de mi trayectoria, he formado parte de la junta directiva de la Sociedad Española de Neurología como vocal de comunicación, relaciones internacionales, director de cultura y vicepresidente de relaciones institucionales. También dirigí la Fundación del Cerebro.Impulsé la creación del grupo de neurooftalmología de la SEN y he formado parte de las juntas de los grupos de cefalea y neurooftalmología. Además, he sido profesor de Neurología en la Universidad Complutense de Madrid durante más de 16 años.

Subir