Los modelos de redes neuronales artificiales se han convertido en herramientas potenciales cruciales para mejorar nuestra comprensión de las complejas funciones cerebrales. Para lograr este objetivo, es fundamental que estos modelos posean un alto grado de realismo neurobiológico. Sin embargo, a pesar de los avances dramáticos en los últimos años, que incluso les permiten alcanzar un rendimiento similar al humano en tareas perceptuales y cognitivas complejas, su similitud con aspectos de la anatomía y fisiología cerebral real aún presenta imperfecciones significativas.

Este artículo profundiza en los diferentes tipos de modelos de redes neuronales, incluyendo redes localistas, autoasociativas, heteroasociativas, profundas y de cerebro completo. Además, identificaremos los aspectos bajo los cuales se puede mejorar su plausibilidad biológica. Estos aspectos abarcan desde la elección de las neuronas modelo y los mecanismos de plasticidad sináptica y aprendizaje, hasta la implementación de la inhibición y el control, junto con propiedades neuroanatómicas como la estructura de las áreas y la conectividad local y de largo alcance. Destacaremos avances recientes en el desarrollo de teorías cognitivas con fundamentos biológicos y en la explicación mecanicista, basada en estos modelos neuronales restringidos por el cerebro, de cuestiones hasta ahora no abordadas sobre la naturaleza, localización y desarrollo ontogenético y filogenético de las funciones cerebrales superiores.
Tipos de Modelos de Redes Neuronales
Existen diversas arquitecturas de redes neuronales que utilizan diferentes tipos de componentes de procesamiento, codificación y reglas de aprendizaje. La elección de las características de la red a menudo está impulsada por la eficiencia del procesamiento, incluyendo la minimización de errores, la velocidad de aprendizaje y el uso efectivo de los recursos computacionales. Aunque la plausibilidad neurobiológica se utiliza frecuentemente como fuente de inspiración, las redes neuronales artificiales generalmente no están diseñadas para parecerse estructural y funcionalmente a partes específicas del cerebro. A continuación, exploramos algunos tipos clave:
Redes Localistas
Un paso importante para abordar el sustrato neural fue dado por los llamados modelos localistas de cognición y lenguaje. Estos modelos llenaron las 'cajas' de los diagramas abstractos (que representaban módulos cognitivos) con neuronas artificiales únicas que se consideraba que representaban localmente entidades cognitivas como características perceptuales, fonemas, formas de palabras, características de significado, conceptos, etc. La relación 1:1 entre las implementaciones computacionales-algorítmicas tipo neurona artificial y las entidades postuladas por las teorías cognitivas facilitó la conexión entre ambos tipos de modelos. Sin embargo, la noción de que las neuronas individuales por sí solas llevan a cabo funciones cognitivas importantes es controvertida hoy en día y difícil de conciliar con la evidencia de la investigación en neurociencia. Esto no niega la gran especificidad de las respuestas de algunas neuronas, sino que resalta la visión ahora dominante de que incluso estas células muy específicas no actúan de forma aislada, sino que forman parte de asambleas celulares que representan conceptos familiares, objetos u otras entidades. Una limitación adicional de los modelos localistas fue que no abordaron sistemáticamente los mecanismos subyacentes a la formación de nuevas representaciones y sus conexiones.
Redes Autoasociativas (o Redes Atractoras)
Observaciones neuroanatómicas sugieren que la corteza se caracteriza por una amplia conectividad intrínseca y recurrente entre sus neuronas y, por lo tanto, puede ser vista como una memoria asociativa. Esta posición inspiró una familia de redes neuronales artificiales llamadas redes autoasociativas o redes atractoras. Estos modelos implementan neuronas con conexiones entre sus miembros, de modo que cada neurona se interconecta con varias o incluso todas las otras neuronas incluidas en el conjunto. Esto contrasta con las redes heteroasociativas, donde las conexiones se dan entre subpoblaciones de neuronas de la red sin conexiones dentro de cada pool neuronal.
Para simular el efecto del aprendizaje en las redes autoasociativas, se incluyen reglas de aprendizaje que cambian los pesos de conexión entre las neuronas como consecuencia de su actividad previa. Por ejemplo, el aprendizaje hebbiano no supervisado, con fundamento biológico, que fortalece las conexiones entre neuronas coactivadas, se aplica frecuentemente y lleva a la formación de asambleas celulares fuertemente conectadas dentro de un pool de neuronas autoasociativas débilmente conectadas. Estas asambleas celulares pueden funcionar como correlatos de red distribuidos o representaciones de estados perceptuales, cognitivos o 'mixtos' dependientes del contexto perceptual-cognitivo. Por lo tanto, las observaciones de que las neuronas corticales trabajan juntas en grupos y que las representaciones se distribuyen a través de estos grupos pueden ser acomodadas por este tipo de red artificial, junto con mecanismos de aprendizaje, superando así las principales deficiencias de las redes localistas.
Características cognitivamente relevantes adicionales de las redes autoasociativas incluyen la capacidad de una asamblea celular para activarse completamente después de una estimulación parcial, un posible mecanismo para la completitud de la Gestalt (por ejemplo, el reconocimiento de un objeto como un gato a partir de una entrada parcial como la cola y las patas). Además, las redes autoasociativas integran las observaciones establecidas de que los códigos neuronales corticales pueden ser dispersos (sparse) y que algunas neuronas responden a características elementales y frecuentes de varios estímulos (comportándose de manera menos dispersa). La razón de esto radica en la superposición de asambleas celulares, es decir, la posibilidad de que dos o más circuitos compartan neuronas mientras permanecen funcionalmente separados.
Las redes autoasociativas pueden modelar un amplio espectro de procesos cognitivos, desde el reconocimiento de objetos, palabras y conceptos hasta la navegación, el procesamiento sintáctico, la memoria, la planificación y la toma de decisiones. Algunos modelos utilizan varios componentes de redes autoasociativas interconectados para modelar la interacción entre múltiples áreas corticales en el procesamiento cognitivo.
Redes Heteroasociativas (o de Feedforward)
Las redes heteroasociativas o de feedforward incluyen dos o más pools o 'capas' de neuronas con conexiones entre ellas, pero no (como en las redes autoasociativas) dentro de las capas. Ofrecen un camino diferente hacia las representaciones distribuidas y el aprendizaje. Estos modelos consisten en diferentes pools de neuronas conectadas en secuencia, un esquema de conexión inspirado en estructuras neurobiológicas, por ejemplo, por conexiones de feedforward entre capas de la retina o entre áreas corticales.
Una clase de modelos frecuentemente utilizada, llamada perceptrones multicapa, comúnmente usada en el procesamiento paralelo distribuido, incluye tres capas de neuronas: una capa que recibe la entrada, una que genera la salida y una capa 'oculta' entre ellas. En tales redes, las representaciones de entidades cognitivas son densas y no dispersas; es decir, están distribuidas a través de todas las neuronas de la capa oculta, de modo que un vector de activación a través de toda la capa es el correlato de red de un objeto, palabra, significado o pensamiento. Es importante notar que la naturaleza densa y 'completamente distribuida' de estas representaciones contrasta con las representaciones dispersas (pero también distribuidas) que caracterizan a muchas redes autoasociativas.
Para implementar una forma de aprendizaje en estas redes, se alimentan señales de 'maestro' (input y output deseado) a las capas de entrada y salida, respectivamente, y los pesos sinápticos se modulan para que la red aprenda las relaciones entre las entradas y las salidas deseadas. Para ajustar los pesos sinápticos, se aplican algoritmos de aprendizaje supervisado que ajustan los pesos según el gradiente de error que se calcula hacia atrás desde la capa de salida hasta la sinapsis en cuestión. Inicialmente, se aplicó un algoritmo llamado 'retropropagación del error', pero más recientemente, se ha dispuesto de una serie de reglas de aprendizaje basadas en gradientes de error a través de la red, lo que permite diferentes variantes de aprendizaje 'dependiente del gradiente'.
Para implementar procesos de memoria, se añadió una capa adicional a la arquitectura de tres capas y se conectó recíprocamente a la capa 'oculta'; esta arquitectura de 'red recurrente simple' permite la actividad reverberante. Similar a las redes autoasociativas, las redes feedforward que incluyen tres o cuatro capas han abordado con éxito un amplio rango de funciones cognitivas.
Redes Neuronales Profundas (DNNs)
Para mejorar aún más su poder computacional, se añadieron más capas a las redes heteroasociativas, dando lugar a las redes neuronales profundas (DNNs). Una motivación neurobiológica para aumentar el número de capas de tres a seis o más proviene de la estructura neuroanatómica de la vía occipitotemporal ventral para el procesamiento de objetos, en la que las conexiones neuroanatómicas van desde la corteza visual primaria (V1) a áreas adyacentes y, a través de múltiples niveles, a áreas temporales anteriores.
Las DNNs se han variado de varias maneras importantes. Por ejemplo, las DNNs convolucionales incluyen proyecciones topográficas entre (algunas de) sus capas para facilitar el procesamiento conjunto de entradas adyacentes, y las DNNs recurrentes incluyen conexiones recíprocas entre capas y/o enlaces recurrentes dentro de las capas que permiten mantener información a lo largo del tiempo. Estas modificaciones han producido dispositivos extremadamente potentes que han alcanzado niveles de rendimiento casi humanos en varios dominios cognitivos, incluyendo, por ejemplo, la clasificación de objetos y el reconocimiento de voz.
A pesar de su amplio éxito, recientemente se han señalado limitaciones específicas de las DNNs. A veces muestran un comportamiento de generalización inapropiado, como clasificar, con alta confianza, imágenes completamente irreconocibles para los humanos como instancias de objetos específicos. De manera similar, un extenso cuerpo de investigación sobre los llamados 'ejemplos adversariales' ha demostrado que perturbaciones mínimas en las imágenes pueden, a pesar de ser imperceptibles para los humanos, causar clasificaciones erróneas graves por parte de las DNNs. Queda por investigar si estos fallos parciales apuntan a diferencias relevantes entre los mecanismos de percepción inmanentes a las DNNs y los internos del cerebro que pueden remediarse mediante mejoras algorítmicas, o si más bien reflejan limitaciones de los conjuntos de estímulos aplicados durante el entrenamiento, que difieren de los estímulos realistas disponibles para los seres vivos durante su ontogenia. Un estudio reciente encontró que la introducción de una capa oculta que se ajusta mejor al área V1 de primates mejoró la robustez a ejemplos adversariales en una red neuronal para la clasificación de imágenes, sugiriendo que un mayor grado de realismo biológico podría ser clave.
Modelos de Cerebro Completo
Los modelos de cerebro completo implementan la conectividad global entre áreas. Estos modelos proporcionan una herramienta importante para comprender aspectos de la actividad cerebral. Sin embargo, no son áreas completas que funcionan uniformemente, sino más bien las neuronas y su interacción en circuitos neuronales los que son las unidades funcionales que llevan a cabo la función cerebral y la cognición.
Los neuroanatomistas han mapeado la estructura areolar de la corteza y el cerebro a niveles gruesos y finos. La información sobre la conectividad cerebral estructural está disponible a partir de estudios de trazado invasivos en animales y de neuroimagen no invasiva aplicable tanto en animales como en humanos (como DTI/DWI). Al parcelar la corteza en un conjunto de áreas y traducir su conectividad estructural en enlaces entre áreas, se puede obtener un modelo de red de cerebro completo o de múltiples áreas en el que cada área cortical y conexión anatómica tiene su nodo y enlace de red correspondiente. En lugar de modelar todas las partes del cerebro, la mayoría de los modelos de 'cerebro completo' se centran en áreas corticales y núcleos del prosencéfalo, o selecciones de ellos.
Los circuitos neuronales cruciales y sus enlaces interconectados están en parte determinados por la estructura neuroanatómica, pero una contribución igualmente importante a la formación de circuitos proviene de la plasticidad sináptica. Por lo tanto, para avanzar hacia una mayor plausibilidad biológica, es necesario incorporar neuronas y plasticidad en las simulaciones de redes de cerebro completo, aprovechando así las restricciones realizadas por las redes neuronales asociativas mencionadas anteriormente. En esencia, los modelos de red de cerebro completo pueden mejorarse añadiendo más detalles a nivel de subárea y neuronal; correspondientemente, las DNNs pueden hacerse más realistas añadiendo información neuroanatómica sobre la conectividad dentro y entre áreas.
Plausibilidad Biológica y Restricciones
Para que las redes neuronales de función neurocognitiva sean más realistas, es necesario primero desarrollar modelos de mecanismos neuronales en diferentes niveles, desde los microniveles de neuronas y circuitos corticales locales hasta el macronivel de áreas corticales y conectividad global, y segundo, aplicar restricciones de la neurociencia en estos diferentes niveles. Las propuestas anteriores ya han discutido varias restricciones diferentes en las redes neuronales, pero a menudo han enumerado restricciones neurobiológicas junto con criterios técnicos o prácticos (por ejemplo, 'eficiencia computacional' o 'escalabilidad'), o han abordado la plausibilidad biológica de manera muy general (por ejemplo, como 'realismo biológico').
A continuación, detallamos punto por punto lo que implica el 'realismo biológico' y discutimos una lista de restricciones neurobiológicas específicas aplicables a los modelos de red de funciones cognitivas. Como los procesos cognitivos están en foco, los mecanismos en el prosencéfalo y especialmente en la corteza reciben atención especial. Las restricciones propuestas no se conciben como características categóricas que los modelos deben cumplir necesariamente de manera binaria. Más bien, las concebimos como dimensiones a lo largo de las cuales los modelos neuronales pueden ajustarse gradualmente, en vista de sus propósitos específicos.
Integración en Diferentes Niveles
La mayoría del modelado previo se ha centrado en un tamaño de grano específico, con el objetivo de aproximar la función neuronal a nivel de neuronas individuales, interacción neuronal en circuitos corticales locales o interacción global entre áreas corticales. Para aplicar simultáneamente restricciones en diferentes niveles de estructura y función cerebral, estos diferentes niveles deben ser abordados e integrados en un solo modelo. Además, el modelado multinivel es necesario para explotar múltiples fuentes de datos experimentales para la validación del modelo. Estas diferentes fuentes incluyen el rendimiento conductual, y la actividad neurofisiológica, donde, una vez más, entran en juego diferentes escalas espaciales y temporales. La actividad de las neuronas registradas o áreas imaginadas, e incluso las similitudes entre estos patrones de activación o las interacciones funcionales transitorias que revelan, pueden relacionarse con patrones de activación de neuronas artificiales, clusters de neuronas locales o componentes de 'área' de un modelo. Tal comparación de patrones de actividad a través de diferentes escalas requiere que los componentes del cerebro y las redes se asemejen estructuralmente, y que sea posible identificar partes del cerebro con partes de la red. Solo en este caso pueden utilizarse las medidas fisiológicas para validar los modelos neuronales.
Modelos Neuronales
Las unidades funcionales de la corteza y el cerebro son las neuronas. Estas neuronas reciben entradas que se traducen en potenciales postsinápticos y finalmente en una salida de potenciales de acción discretos, mediante los cuales la frecuencia de los potenciales de acción puede variar continuamente. Todas las redes neuronales están compuestas por correlatos artificiales de neuronas, pero el nivel de detalle con el que se simula la función neuronal varía considerablemente. Los modelos de campo medio utilizan neuronas con entradas y salidas continuas (ignorando así los picos de la mayoría de las neuronas reales), junto con una función de transferencia. Pueden interpretarse como simulaciones de la probabilidad de disparo de neuronas individuales o la actividad acumulada de circuitos neuronales locales. Las neuronas de 'integración y disparo' con picos más sofisticadas modelan la suma de potenciales postsinápticos y el disparo neuronal resultante, y pueden extenderse para integrar compartimentos dendríticos e interacciones no lineales entre sus entradas. Los modelos de neuronas multicompartimentales y biofísicos pueden incluir aún más detalles. Por lo tanto, una dimensión de progresión que aborda el grado de realismo del modelo neuronal puede avanzar desde modelos de campo medio a modelos de integración y disparo y a modelos de neuronas biofísicos. Además, parte de la actividad neuronal es difícil de explicar por la entrada y, por lo tanto, puede verse como ruido. La adición de ruido, junto con la adaptación (es decir, la reducción de la actividad con la activación prolongada), puede aumentar aún más el grado de realismo de los modelos neuronales.
Plasticidad Sináptica y Aprendizaje
Evidentemente, la inclusión de mecanismos de aprendizaje es un ingrediente biológico crucial de las redes biológicamente plausibles. Como se mencionó, los modelos localistas y de cerebro completo típicamente carecen de esta característica. Para modelar múltiples sistemas de aprendizaje en el cerebro, es necesaria la implementación de las dos formas principales de aprendizaje, supervisado y no supervisado. El aprendizaje basado en principios hebbianos biológicamente plausibles es relevante para todos los dominios cognitivos. Se aproxima mediante diversas reglas de aprendizaje. Algunas de estas reglas son elementales; por ejemplo, las implementaciones del principio 'fire-together-wire-together' conducen a la potenciación a largo plazo (LTP) de las conexiones entre neuronas coactivadas. Otras reglas incluyen más detalles neurofisiológicos, en particular aquellas que pueden implementar tanto LTP como, como consecuencia de la activación no correlacionada o anticorrelacionada, la depresión a largo plazo (LTD). La plasticidad sináptica dependiente del momento de los potenciales de acción, conocida como plasticidad dependiente del tiempo de pico (STDP), es una consecuencia del aprendizaje hebbiano realizada en implementaciones sofisticadas. Por lo tanto, se puede ver una progresión desde la ausencia de aprendizaje, al aprendizaje hebbiano basado en LTP y, en última instancia, a las reglas de aprendizaje hebbiano LTP-más-LTD y la adición de STDP.
El aprendizaje supervisado implica el uso de una señal de retroalimentación que informa al individuo o a la red si el rendimiento fue apropiado, incorrecto o erróneo. Sin embargo, la elección de los algoritmos utilizados en las simulaciones de aprendizaje supervisado no solo ha sido guiada por la plausibilidad biológica; la eficacia computacional del aprendizaje dependiente del gradiente ha jugado un papel importante. Es controvertido si estos últimos algoritmos son biológicamente realistas y aplicables al aprendizaje sofisticado en dominios cognitivos específicos. Algunos investigadores han criticado la falta de un fuerte apoyo biológico para los mecanismos que calculan y retroalimentan los gradientes de error a través de redes neuronales feedforward, mientras que otros señalan la evidencia emergente reciente de mecanismos neurobiológicos que podrían, en parte, soportar aspectos de ello. Los mecanismos por los cuales los gradientes de error podrían propagarse gradualmente hacia atrás a través de una población de neuronas biológicas siguen siendo un objetivo de investigación en curso.
Otro problema putativo se refiere al tipo de retroalimentación necesaria para el aprendizaje dependiente del gradiente. En las simulaciones de DNN, hay miles de ensayos de aprendizaje disponibles, mediante los cuales, por ejemplo, las imágenes de objetos se clasifican con respecto a la pertenencia a una categoría. Sin embargo, en muchos casos de clasificación y aprendizaje de idiomas en humanos, dicha retroalimentación no juega un papel importante, y si acaso, solo está disponible raramente. Más bien parece que, en algunos casos de aprendizaje cognitivo, la ausencia de ciertas entradas es suficiente. Este tipo de aprendizaje cognitivo no se explica por el aprendizaje supervisado basado en retroalimentación, sino que invita al modelado basado en la plasticidad hebbiana. No obstante, la retroalimentación explícita es importante en algunos tipos de aprendizaje (como el aprendizaje por refuerzo) y su implementación biológicamente realista es crucial.
Inhibición y Regulación
Los cerebros son sistemas regulados, y la actividad cortical está regulada por mecanismos de control en diferentes niveles. Estos incluyen el nivel de circuito local microscópico, en el que las neuronas corticales excitatorias interactúan con las células inhibitorias locales, y el nivel macroscópico, más global, de partes cerebrales interactuantes, en el que la actividad cortical está regulada a través del intercambio de información con el tálamo, los ganglios basales y otras estructuras subcorticales. Muchas redes neuronales distribuidas utilizadas para simular la cognición están compuestas solo por unidades excitatorias y carecen de mecanismos de inhibición. Otros marcos de modelado implementan la regulación a un nivel abstracto, por ejemplo, predefiniendo un número máximo de neuronas en un área que pueden activarse al mismo tiempo. Los modelos de redes neuronales más realistas incluyen elementos neuronales excitatorios e inhibitorios, de modo que la regulación y el control de la actividad se logran mediante su interacción, un mecanismo crucial para la excitación y la atención. Pocos modelos han realizado mecanismos regulatorios tanto locales como globales. La inclusión de mecanismos de inhibición y regulación tanto a nivel de circuito local como a niveles más globales (como el nivel de área) es una característica importante para hacer que las redes neurocognitivas sean biológicamente plausibles.
Estructura de Área
La corteza está estructurada en un conjunto de áreas, donde la definición de área se basa principalmente en criterios anatómicos y a veces se refina utilizando información funcional. Dependiendo de la pregunta a abordar por una simulación, un modelo de red puede implementar una, una selección específica de, o todas las áreas corticales junto con los núcleos subcorticales. Cada área o núcleo puede realizarse como una 'capa' o área modelo separada que incluye un número predefinido de neuronas artificiales. Las dimensiones de progresión hacia el realismo biológico incluyen el rango de partes y regiones cerebrales cubiertas por el modelo (de una, a varias, a cerebro completo) y la granularidad de las áreas modeladas, pasando de subdivisiones de área gruesas a más finas.
Conectividad Local Dentro del Área
Las células piramidales, las neuronas excitatorias más comunes en la corteza, cada una lleva de 10,000 a 40,000 espinas dendríticas, cada una de las cuales a su vez típicamente contiene una sinapsis. Por lo tanto, una de estas células puede hacer contacto con unas pocas decenas de miles de otras células corticales. La probabilidad de que dos neuronas piramidales adyacentes estén conectadas disminuye con la distancia entre ellas. En resumen, los estudios neuroanatómicos indican que las conexiones excitatorias locales dentro de un área cortical son dispersas y muestran un sesgo de vecindario hacia enlaces entre neuronas adyacentes. En vista de estas características, la falta de conexiones dentro de la capa de las redes heteroasociativas no parece biológicamente realista. Muchas redes que incluyen capas o áreas autoasociativas incluyen conectividad completa entre todas las neuronas dentro de estas áreas y, de manera similar, las capas de memoria de las redes recurrentes simples tienen conexiones recurrentes de todo a todo. Tal autoasociatividad completa contrasta con la dispersión de las conexiones corticales locales intrínsecas. La restricción cerebral de conexiones dispersas, locales y parcialmente aleatorias con un sesgo de vecindario se ha realizado en redes neuronales que conectan la autoasociatividad con conexiones heteroasociativas entre áreas. Los modelos más avanzados con respecto a la restricción de conectividad local son los modelos de microcircuitos que realizan diferentes tipos de células y su ubicación en capas del neocórtex. No obstante, para la mayoría de las redes neuronales disponibles hoy en día, la implementación de restricciones de conectividad dentro del área aún conduce a un aumento en el realismo biológico.
Conectividad Global Entre Áreas
Las conexiones entre las capas de las redes neuronales suelen ser simples, con áreas vecinas vinculadas; sin embargo, esto difiere de la estructura de conectividad de la corteza, en la que numerosas áreas están conectadas de maneras intrincadas. Aproximar la compleja subdivisión de los cerebros en áreas y núcleos, e implementar la conectividad neuroanatómica entre estos componentes, es un objetivo principal del modelado de 'cerebro completo'.
La Teoría de Redes en la Ciencia Cognitiva
La ciencia cognitiva ha empleado en gran medida metodologías de ciencia de redes para estudiar las relaciones entre palabras y conceptos, además de aplicaciones a las relaciones sociales. Si bien una amplia gama de constructos cognitivos pueden representarse como una red, la teoría de redes en ciencia cognitiva se centra principalmente en la investigación que estudia fenómenos relacionados con la memoria y el lenguaje utilizando redes.
La ciencia de redes proporciona un enfoque cuantitativo para representar sistemas cognitivos. Un objetivo importante de la ciencia cognitiva es modelar estructuras cognitivas, como la memoria semántica y el léxico mental. Argumentamos que un enfoque de ciencia de redes puede proporcionar un marco alternativo poderoso para modelar y cuantificar representaciones cognitivas en diversos dominios. La ciencia de redes proporciona un conjunto de herramientas computacionales que permite al científico cognitivo examinar explícitamente las propiedades estructurales de los sistemas cognitivos.
La ciencia de redes facilita una comprensión más profunda de la cognición humana al permitir al investigador considerar cómo la estructura de la red y los procesos que operan sobre la estructura de la red interactúan para producir fenómenos conductuales. Otro punto fuerte del enfoque de ciencia de redes es la capacidad no solo de cuantificar aspectos relacionados con la estructura de los sistemas cognitivos, sino también de modelar los procesos que operan dentro de estos sistemas. Por ejemplo, un modelo de recuperación de memoria típicamente requiere dos componentes principales: una representación de las memorias y un proceso para recuperarlas. Dentro de un enfoque de red, estos componentes podrían modelarse, por ejemplo, como una representación de red que representa la memoria semántica como una red de conceptos similares y un proceso de paseo aleatorio que recorre aleatoriamente la red semántica, emitiendo una secuencia de nodos que aproxima las salidas del proceso de recuperación.
La ciencia de redes proporciona un marco para modelar cambios estructurales en sistemas cognitivos en múltiples escalas. La investigación en áreas como la adquisición del lenguaje y el envejecimiento cognitivo ha revelado que los sistemas cognitivos son dinámicos y son sensibles a los cambios en el entorno lingüístico, la acumulación de experiencia a lo largo del tiempo, y los déficits o otros declives relacionados con la edad en el procesamiento sensorial. Los cambios dinámicos pueden ocurrir en escalas de tiempo más largas, reflejando la acumulación a largo plazo de experiencias, y en escalas de tiempo más pequeñas, reflejando la naturaleza dinámica de la memoria semántica en respuesta a diferentes contextos y tareas experimentales.
Representando Sistemas Cognitivos como Redes
Las redes se componen de dos elementos: nodos que representan las entidades conceptuales de interés (por ejemplo, personas, sitios web o palabras) y aristas que representan las relaciones entre esas unidades (por ejemplo, amistad, hipervínculos o similitud semántica). Si bien se pueden considerar aspectos adicionales, como se hace en redes bipartitas y multiplex, identificar estos dos elementos básicos en el sistema de estudio es suficiente para formalizar el sistema como una red y emplear las poderosas herramientas proporcionadas por la ciencia de redes.
La fuerza asociativa es una de muchas opciones para construir redes de palabras. Las aristas entre palabras también pueden construirse basándose en el número de características compartidas, sus relaciones semánticas (como sinonimia, hiperonimia y meronimia), su similitud fonológica, su similitud ortográfica, sus coocurrencias en el habla natural, estadísticas de corpus de lenguaje y relaciones de dependencia sintáctica anotadas manualmente. Asimismo, la investigación ha estudiado diferentes unidades lingüísticas distintas de las palabras mapeando letras, sílabas o segmentos, o documentos enteros en nodos. Además, la investigación ha aplicado métodos de ciencia de redes para examinar la estructura semántica, estilística, tipológica y fonológica de idiomas distintos del inglés.
Medidas de Red en Ciencia Cognitiva
Una ventaja clave de estudiar sistemas cognitivos como redes es la accesibilidad de medidas y herramientas cuantitativas confiables y bien establecidas. Presentamos medidas comunes utilizadas para cuantificar aspectos de las redes en tres escalas de estructura en las representaciones de red: (i) la estructura microscópica (vista de un nodo), (ii) la mesoescala (subconjunto de nodos) y (iii) la macroescala (vista de toda la red).

Medidas a Nivel de Nodo (Microscópico)
Una medida popular de centralidad de nodo es el grado del nodo, es decir, el número de aristas conectadas a un nodo. Los nodos de mayor grado están conectados directamente a un mayor número de nodos en la red y pueden tener un papel importante en, por ejemplo, el intercambio de información a través de la red. El grado de un nodo también define el 'tamaño del vecindario' de un nodo, una propiedad que a menudo se ha utilizado en el contexto de redes fonológicas y ortográficas de formas de palabras para predecir tiempos de recuperación léxica.
Otra propiedad de los nodos derivada de su vecindario inmediato es el coeficiente de clustering local, que caracteriza la medida en que los vecinos de un nodo están interconectados. El coeficiente de clustering mide hasta qué punto los vecinos de un nodo también son vecinos entre sí. Al igual que el grado de un nodo, el coeficiente de clustering de un nodo influirá en el flujo de información a través y alrededor de un nodo. La investigación psicolingüística reciente ha demostrado que las personas son sensibles a los matices en la estructura de similitud de las palabras, según se operacionaliza por el coeficiente de clustering.
Para caracterizar la importancia de un nodo más allá de su vecindario inmediato, se pueden utilizar medidas como la centralidad de cercanía o la centralidad PageRank. La centralidad de cercanía se calcula como la inversa de la longitud promedio del camino más corto a todos los demás nodos de la red. La centralidad de cercanía de las palabras calculada a partir de redes de similitud fonológica y ortográfica ha demostrado influir en el reconocimiento de palabras habladas y visuales, el rendimiento en la denominación de imágenes en personas con afasia y el rendimiento en una tarea de navegación mental. La centralidad PageRank puede pensarse en términos de un 'fluido' que fluye por toda la red y se acumula en los nodos más importantes. La idea general es que los nodos más importantes (sitios web) reciben más 'fluido' (aprobación) de nodos (sitios web) que son ellos mismos importantes de manera recursiva.
Finalmente, el camino más corto, o distancia más corta entre dos nodos, puede utilizarse para revelar algo sobre la relación de nodos (no vecinos) en lugar de los nodos en sí mismos. Por ejemplo, la longitud del camino entre dos nodos en redes cognitivas y de lenguaje influye en la percepción errónea de palabras habladas, los juicios de relación semántica y el rendimiento en la denominación de imágenes en personas con afasia.
Medidas a Nivel Mesoscópico
A nivel mesoscópico, la investigación se ha centrado en la estructura de la comunidad de red. Las comunidades se refieren a la agrupación de nodos en subredes basándose en su conectividad, es decir, cuán fuertemente están interconectados. La identificación de comunidades y los nodos que incluyen puede proporcionar información interesante sobre un sistema cognitivo. En el dominio del lenguaje, por ejemplo, la detección de comunidades puede utilizarse para identificar campos o categorías semánticas. La capacidad de los algoritmos de detección de comunidades para describir una red en términos de un conjunto de comunidades se captura típicamente utilizando una medida conocida como modularidad. Las investigaciones a nivel neural en el cerebro, por ejemplo, han demostrado consistentemente cómo la estructura de la comunidad de las redes neurales cambia con la progresión de varias psicopatologías diferentes.
Estudios recientes también han destacado la importancia de la modularidad en las redes cognitivas tanto en poblaciones sanas como clínicas. Por ejemplo, se ha encontrado que la red semántica de individuos con autismo de alto funcionamiento (síndrome de Asperger) exhibe una modularidad más alta que los controles emparejados, lo que ofrece una posible explicación de su rigidez en el procesamiento del lenguaje. Además, se sugirió que la alta modularidad observada en la red fonológica restringía la propagación de la activación en la recuperación léxica y la mayor modularidad observada en las redes semánticas se relacionaba negativamente con las diferencias individuales en la capacidad creativa.
Medidas a Nivel Macroscópico
Las medidas de la estructura macroscópica de las redes se refieren a la organización general de las redes, en contraposición a las estructuras a nivel de nodo o comunidad. Estas medidas pueden revelar propiedades emergentes de un sistema visibles solo al considerar la red en su conjunto, lo que puede desempeñar un papel importante en el comportamiento del sistema.
Las redes a menudo se caracterizan por los promedios de las medidas locales y basadas en nodos descritas anteriormente, como el grado promedio, la longitud promedio del camino más corto y el coeficiente de clustering local promedio. Un patrón que emerge frecuentemente en una variedad de sistemas se conoce como estructura de mundo pequeño, caracterizada por un alto clustering local y longitudes de camino más cortas promedio moderadas, en relación con redes aleatorias de tamaño y densidad similares. Esta propiedad de mundo pequeño puede ser importante en el dominio de la cognición por dos razones. Primero, se ha encontrado que las estructuras de mundo pequeño son una propiedad casi universal de las redes del mundo real en diversos dominios, incluyendo redes biológicas, redes sociales y redes de información. Segundo, las estructuras de mundo pequeño pueden surgir de procesos de crecimiento sistemáticos que pueden adaptarse a las restricciones ambientales para dar lugar a una estructura beneficiosa. Por ejemplo, se ha dicho que la estructura de mundo pequeño de las redes cerebrales refleja el equilibrio entre las distancias neuronales cortas entre las regiones cerebrales y los costos asociados con la creación de estas conexiones, con la conclusión de que la estructura de mundo pequeño puede proporcionar un medio para optimizar la estructura organizativa de las neuronas. La idea de organización optimizada en las redes cerebrales está relacionada con la idea de eficiencia de red, refiriéndose a la capacidad de una red para intercambiar información rápidamente.
La "mundo pequeño" es también una característica ubicua de muchos tipos de redes de lenguaje, incluidas las redes semánticas, las redes fonológicas de varios idiomas, la red ortográfica del inglés y las redes sintácticas. Similar al argumento sobre las redes cerebrales, las propiedades de mundo pequeño en las redes de lenguaje podrían surgir debido a dos aspectos competitivos del aprendizaje y uso del lenguaje: la distintividad (por ejemplo, cada objeto tiene un mapeo de palabra único) y las restricciones de memoria (por ejemplo, el lenguaje más fácil de aprender es aquel donde una sola palabra se refiere a todo). Estas dos características competitivas del lenguaje pueden resultar en la emergencia de clusters locales de significado y forma similares, pero una longitud de camino promedio baja debido a la influencia de las restricciones de memoria que resultan en la reutilización de palabras y segmentos sublexicales.
La distribución de grados de las redes semánticas sigue consistentemente una distribución de ley de potencia aproximada. Esto se ha demostrado en redes semánticas construidas a partir de asociaciones libres y de relaciones semánticas más complejas, sugiriendo puntos en común en la organización semántica de los significados de las palabras. Por otro lado, las distribuciones de grados de las redes fonológicas de varios idiomas parecen ajustarse mejor a una ley de potencia truncada, lo que tiene implicaciones para los modelos candidatos de crecimiento de red.
Procesos en Redes Cognitivas
Ahora pasamos a los modelos que pueden explicar los procesos que ocurren en los tipos de redes cognitivas discutidas anteriormente. Una ventaja clave del enfoque de ciencia de redes relevante para la ciencia cognitiva es que es posible formalizar procesos que operan sobre la estructura de una red. Uno de los primeros intentos de conceptualizar procesos cognitivos en una red de nodos y sus relaciones se centró en la memoria semántica humana para explicar una intrincada taxonomía del razonamiento humano. Más tarde, Collins y Loftus generalizaron la idea de que la estructura de la red junto con un proceso de recuperación pueden explicar el comportamiento humano y desarrollaron la teoría de la propagación de la activación en la memoria semántica.
La contribución clave de esta teoría fue hacer explícito el proceso que opera en una red semántica al ejecutar una tarea cognitiva y vincular los resultados de ese proceso al rendimiento y los tiempos de respuesta de los participantes. Específicamente, en la teoría de la propagación de la activación se asumió que leer o pensar en un concepto activaría el concepto y que esta activación se propagaría a conceptos vecinos en la red, activando conceptos relacionados y facilitando su recuperación. El proceso de propagación de la activación propuesto por Collins y Loftus asume implícitamente la presencia de algún recurso cognitivo (es decir, activación) que puede asignarse a nodos específicos, propagarse entre nodos conectados en una red predefinida y decaer con el tiempo. Esta propagación de la activación decae rápidamente con el tiempo y la distancia en la red semántica.
En general, el éxito de la explicación de la propagación de la activación demuestra la importancia de formalizar un proceso que capture la búsqueda dentro de una representación cognitiva. La ciencia de redes proporciona nuevas formas de expandir la conceptualización original de la propagación de la activación de Collins y Loftus formalizando modelos de difusión sobre representaciones de red. Los procesos de difusión en una red se han utilizado independientemente para estudiar y predecir extensamente epidemias de propagación de enfermedades e ideas contagiosas en una población. Los modelos de difusión desarrollados en estos dominios pueden utilizarse y adaptarse de manera similar para estudiar cómo la información o la activación se 'propaga' en una red cognitiva.
Aunque existen diferentes implementaciones de modelos de difusión de red, una idea central que ilustra el poder de tales modelos de proceso de red es la noción de un paseo aleatorio (random walk) en una red. Un modelo de paseo aleatorio es un proceso de búsqueda ingenuo que se mueve de nodo a nodo en función de un conjunto de probabilidades de transición que especifican la probabilidad de moverse de un nodo a cualquiera de sus nodos vecinos directamente conectados. Tenga en cuenta que cuando se combina con un parámetro de decaimiento, un modelo de paseo aleatorio se vuelve similar a un modelo de propagación de la activación. Sin embargo, a pesar de su similitud, hay diferencias notables en las implementaciones y objetivos de la propagación de la activación en la tradición de Collins y Loftus y los modelos de paseo aleatorio de los científicos de redes. Específicamente, los modelos de paseo aleatorio producen caminos individuales recorridos por el paseo (por ejemplo, una lista ordenada de palabras), mientras que un proceso de propagación de la activación produce un patrón de niveles de activación entre los nodos de la red y cómo cambian con el tiempo. Los modelos de difusión proporcionan un medio para explorar teorías cognitivas existentes y conocimientos como la propagación de la activación y tienen la capacidad de explicar los procesos de decisión individuales, así como describir el funcionamiento de varios sistemas cognitivos. En los últimos años, varios estudios empíricos han demostrado cómo la búsqueda en la memoria puede modelarse como un proceso de paseo aleatorio sobre la memoria semántica y han demostrado poder predictivo para explicar el comportamiento humano.
Recuperación Léxica
La teoría de la propagación de la activación ofrece un plano para una explicación mecanicista de varios estudios psicolingüísticos que examinan los efectos de la similitud en el procesamiento del lenguaje. Las medidas de red como el grado, el coeficiente de clustering local, la centralidad de cercanía y muchas otras pueden calcularse para palabras individuales. Críticamente, estas características pueden determinar cómo se propaga la activación a través de una red y, por lo tanto, influir en el rendimiento conductual en tareas psicolingüísticas y de memoria. Los estudios que han investigado tales tareas conductuales han encontrado que las palabras con vecindarios más agrupados (palabras con altos valores de coeficiente de clustering) se responden más lentamente en tareas de reconocimiento de palabras habladas y visuales, y se producen más lentamente que las palabras en vecindarios menos agrupados.
En estas tareas psicolingüísticas, los participantes suelen ser presentados con palabras que tienen valores altos o bajos en una medida de red particular para detectar su influencia en la eficiencia de la recuperación léxica, que generalmente se indica por tiempos de reacción más rápidos y mayor precisión. Ejemplos de tales tareas incluyen la decisión léxica y la denominación rápida. Los tiempos de reacción rápidos y las altas tasas de precisión en estas tareas indican una mayor eficiencia de la recuperación léxica.
Para explicar los efectos del coeficiente de clustering en el reconocimiento de palabras versus no palabras, algunos autores proporcionan una explicación teórica que asume un proceso de propagación de la activación que opera en una red fonológica, donde las características estructurales de una palabra afectan cómo se propaga la activación a través de la red. Se hipotetiza que las palabras con bajos coeficientes de clustering reciben más activación de sus vecinos en comparación con aquellas con altos coeficientes de clustering, porque la activación en este último caso es más probable que se comparta entre los vecinos, lo que resulta en niveles más bajos de activación para la palabra objetivo.
Aunque el proceso de propagación de la activación está principalmente relacionado con las propiedades estructurales locales de las palabras, el proceso de propagación de la activación también puede utilizarse para explicar hallazgos que muestran que los aspectos estructurales globales de las palabras en la red influyen en la recuperación léxica. Tales hallazgos sugieren que la centralidad de cercanía de las palabras influye en el reconocimiento de palabras habladas y visuales, que el tamaño del componente en el que residen las palabras influye en el reconocimiento de palabras habladas, el recuerdo serial y la denominación de imágenes, y que la mezcla asociativa por grado, la tendencia de los nodos con grados similares a conectarse entre sí, influye en los fallos en la recuperación léxica.
El hallazgo de una ventaja de procesamiento para las palabras con alta centralidad de cercanía en el reconocimiento de palabras habladas es especialmente interesante, ya que este hallazgo va en contra del hallazgo general de que una mayor similitud no tiende a ayudar al reconocimiento. Sin embargo, para explicar la ventaja de procesamiento para las palabras con alta centralidad de cercanía, podemos recurrir nuevamente a la teoría de la propagación de la activación. Se sugiere que, como resultado de la propagación de la activación de las representaciones léxicas a lo largo del tiempo, las palabras con alta centralidad de cercanía acumularán más activación que las palabras menos centrales debido a su ubicación topológicamente ventajosa en la red. Esta mayor acumulación de activación a largo plazo proporciona una explicación del beneficio de procesamiento de las palabras con alta centralidad de cercanía que contrarresta los efectos negativos más inmediatos del tamaño del vecindario y el clustering.
Procesos Creativos
Otro dominio cognitivo donde la propagación de la activación ha demostrado ser un marco poderoso es la creatividad. Las teorías del proceso creativo atribuyen un papel clave a la propagación de la activación sobre la memoria para explicar las diferencias individuales en la creatividad. Tales teorías proponen que la creatividad está relacionada con la capacidad de combinar conceptos débilmente relacionados (es decir, distantes) en nuevos conceptos que sean tanto novedosos como apropiados. En promedio, cuanto más lejos estén los componentes combinados en una red semántica, más novedoso será el nuevo concepto.
Varios estudios han aplicado metodologías de ciencia de redes para examinar la idea de que la creatividad implica la combinación de conceptos distantes. Estos estudios han demostrado cómo las diferencias en la estructura de la memoria semántica se relacionan con las diferencias individuales en la creatividad, tanto a nivel de grupo como a nivel individual. Centrándose en la estructura macro y mesoscópica, estos estudios encontraron que los niveles más altos de creatividad se asociaban con redes semánticas que exhibían coeficientes de clustering más altos, longitudes de camino más cortas promedio más pequeñas y menor modularidad en la estructura de la comunidad. Los autores argumentan que las propiedades macroscópicas estructurales de la red semántica de individuos más creativos facilitan la propagación de la activación a través de las comunidades de red en su memoria semántica, lo que lleva a la generación de ideas más novedosas a medida que la activación alcanza nodos en la red que están más separados entre sí.
De hecho, los paseos aleatorios simulados sobre las redes semánticas de individuos con baja y alta capacidad creativa revelaron que los procesos de búsqueda simulados sobre la red semántica de individuos altamente creativos alcanzaban nodos distantes y nodos con relaciones más débiles. Estos hallazgos demuestran cómo la ciencia de redes puede investigar cuantitativamente cómo la estructura de un sistema cognitivo restringe el procesamiento en la representación.
Una gran cantidad de investigación ha demostrado que las personas buscan en sus espacios cognitivos internos de manera similar a como lo harían en un espacio físico externo, lo que implica que los procesos de búsqueda espacial y cognitiva tienen raíces evolutivas similares. Representar la memoria semántica como redes produce esencialmente un mapa del espacio semántico que permite rastrear matemáticamente los procesos de búsqueda como caminos en una red y hacer predicciones sobre cómo las propiedades estructurales de tales mapas de red influyen en el comportamiento de búsqueda cognitiva.
En un estudio, se pidió a los participantes que jugaran un juego de transformación de palabras que requería transformar una palabra en otra cambiando solo una letra a la vez. Este juego es análogo a encontrar un camino en una red léxica de formas de palabras. Los resultados mostraron que con el tiempo los participantes comenzaron a utilizar activamente puntos de referencia de red, palabras centrales y palabras de alta centralidad de cercanía, para mejorar drásticamente su rendimiento. En otro estudio, los individuos pudieron identificar con éxito el camino más corto entre una palabra de inicio y una palabra objetivo dentro de una red semántica predefinida. Este resultado indica que las personas son capaces de explotar activamente tanto la estructura global como local de la memoria semántica para estimar la distancia entre dos palabras y usar esa información para guiar su búsqueda.
Se obtuvieron conclusiones similares de tareas de búsqueda más abiertas que requerían a los individuos explorar activamente sus representaciones mentales, como tareas de fluidez de categoría y letra. En las tareas de fluidez verbal, se requiere que los individuos recuperen de la memoria, en un tiempo fijo, tantos elementos pertenecientes a una categoría semántica o palabras que comiencen con una letra específica como puedan. El trabajo previo ha utilizado datos conductuales obtenidos de la tarea de fluidez para inferir la estructura de las redes semánticas y para analizar y comparar la estructura de red macro y/o mesoscópica. Esto ha llevado a importantes conocimientos sobre las diferencias estructurales en las redes semánticas entre adultos jóvenes y mayores, individuos menos creativos y altamente creativos, el primer y segundo idioma de bilingües, y individuos con baja o alta apertura a la experiencia.
Las secuencias que los individuos producen en las tareas de fluidez verbal pueden, sin embargo, también utilizarse para estudiar los procesos de búsqueda involucrados cuando los individuos exploran sus representaciones mentales. El hallazgo de que los elementos con alta relación semántica y muchas características compartidas tienden a agruparse se propuso que estaba relacionado con un proceso de búsqueda activo que cambia dinámicamente entre las señales de recuperación. Otro trabajo ha demostrado que la información micro (a nivel de nodo) como la centralidad PageRank fue la más predictiva del recuerdo de palabras y que los modelos de proceso como los paseos aleatorios podrían explicar los datos de fluidez verbal.
Una pregunta predominante en esta línea de investigación es si tales procesos de búsqueda se explican mejor por un proceso de forrajeo o un paseo aleatorio, y el debate sigue abierto. Colectivamente, los estudios discutidos anteriormente proporcionan información importante sobre cómo las personas navegan y recuperan información de sus redes semánticas y lingüísticas. La fuerte evidencia conductual y los enfoques basados en modelos muestran que las personas son capaces de buscar con éxito sus representaciones mentales de formas flexibles para lograr una variedad de tareas cognitivas. La capacidad de los procesos de red para capturar diferencias conductuales sugiere que la perspectiva de la ciencia de redes proporciona formas de formular hipótesis comprobables con respecto a cómo los individuos acceden y navegan por estas estructuras cognitivas.
Tabla Comparativa de Modelos
| Tipo de Modelo | Estructura Clave | Inspiración Biológica | Características Notables | Limitaciones (Según el texto) |
|---|---|---|---|---|
| Localista | Nodos individuales representan entidades cognitivas. Conexiones entre nodos. | Intento temprano de vincular módulos cognitivos a 'neuronas'. | Simple, fácil de vincular a teorías cognitivas. | Controvertido (1 neurona = 1 concepto), no aborda formación de representaciones, poca plausibilidad biológica moderna. |
| Autoasociativa | Conexiones dentro de las capas/pools neuronales. Permite actividad recurrente. | Conectividad intrínseca y recurrente de la corteza, memoria asociativa. | Modela asambleas celulares, representaciones distribuidas (dispersas), aprendizaje hebbiano, completitud de Gestalt. | Conectividad a menudo completa dentro de las capas (contrasta con la dispersión cortical). |
| Heteroasociativa (Feedforward) | Capas de neuronas conectadas secuencialmente (entre capas, no dentro). | Conexiones feedforward entre estructuras (retina, áreas corticales). | Representaciones distribuidas (densas), aprendizaje supervisado (retropropagación). | Falta de conexiones dentro de la capa (no biológicamente realista para la corteza), controversia sobre plausibilidad de retropropagación. |
| Profunda (DNN) | Varias capas ocultas en arquitectura feedforward. | Estructura jerárquica de vías sensoriales (ej. vía visual ventral). | Gran poder computacional, rendimiento casi humano en tareas complejas, variantes convolucionales y recurrentes. | Generalización inapropiada, sensibilidad a ejemplos adversariales, similitud imperfecta con el cerebro. |
| Cerebro Completo | Nodos representan áreas cerebrales, aristas representan conectividad entre áreas. | Conectividad estructural global del cerebro (mapeo neuroanatómico). | Modela interacción global entre áreas, dinámica de actividad a gran escala (ej. estado de reposo). | Generalmente carece de detalle neuronal y plasticidad, no representa neuronas individuales o circuitos locales. |
Preguntas Frecuentes sobre Modelos de Redes Neuronales en Neurociencia
Aquí respondemos algunas preguntas comunes sobre este tema:
¿Qué son exactamente los modelos de redes neuronales en neurociencia?
Son representaciones computacionales inspiradas en la estructura y función del cerebro. Utilizan nodos (neuronas artificiales) y conexiones (sinapsis artificiales) para simular procesos neuronales y cognitivos, ayudándonos a entender cómo el cerebro procesa información.
¿Para qué se utilizan estos modelos en la investigación del cerebro?
Se utilizan para probar teorías sobre cómo funcionan los circuitos neuronales, cómo se almacenan y procesan la información y cómo surgen funciones cognitivas complejas como el lenguaje, la memoria y la percepción. Permiten simular y predecir la actividad cerebral y el comportamiento.
¿Qué significa que un modelo sea biológicamente plausible?
Significa que el modelo incorpora características de la biología real del cerebro, como el tipo de neuronas, los mecanismos de aprendizaje sináptico, la forma en que las neuronas se conectan local y globalmente, y cómo se regula la actividad neuronal (inhibición). Un mayor realismo biológico puede hacer que el modelo sea una mejor representación del cerebro real.
¿Las redes neuronales artificiales como las DNNs son modelos realistas del cerebro?
Las DNNs han logrado un rendimiento impresionante en muchas tareas, pero su similitud con el cerebro real es imperfecta. A menudo carecen de detalles biológicos clave como tipos de neuronas realistas, mecanismos de aprendizaje hebbiano o estructuras de conectividad local y global precisas. Sin embargo, la incorporación de más restricciones biológicas puede mejorar su realismo.
¿Cómo modelan las redes neuronales procesos cognitivos como la memoria o el lenguaje?
Diferentes modelos abordan estos procesos de maneras distintas. Las redes autoasociativas pueden modelar la memoria asociativa y la completitud de Gestalt. Las redes heteroasociativas y profundas pueden aprender mapeos complejos entre entradas y salidas, relevante para el procesamiento del lenguaje y la percepción. La ciencia de redes en cognición modela la estructura de conceptos o palabras y procesos como la propagación de la activación o paseos aleatorios sobre esta estructura para simular la recuperación de memoria o la búsqueda léxica.
¿Cuál es la diferencia entre un modelo de cerebro completo y otros tipos de redes?
Los modelos de cerebro completo se centran en la conectividad a gran escala entre diferentes áreas cerebrales, tratando cada área como un nodo. Otros modelos, como los localistas, autoasociativos o heteroasociativos, a menudo se centran en simular circuitos neuronales a menor escala o redes con estructuras más abstractas, sin mapeo directo a áreas cerebrales específicas.
Conclusión
Los modelos de redes neuronales y los enfoques de ciencia de redes en la ciencia cognitiva representan avenidas de investigación poderosas y complementarias para desentrañar la complejidad del cerebro y la mente. Desde la simulación detallada de neuronas y circuitos hasta la representación de la estructura de la memoria y el lenguaje como redes, estas herramientas computacionales nos permiten formular y probar hipótesis sobre cómo la estructura y los procesos neuronales dan lugar a la cognición. Si bien aún existen desafíos, como mejorar el realismo biológico de los modelos y comprender la interacción entre la estructura y el proceso en los sistemas cognitivos, la integración de datos neurocientíficos en modelos computacionales ofrece perspectivas emocionantes para una comprensión más profunda de las funciones cerebrales superiores y posibles aplicaciones clínicas futuras.
Si quieres conocer otros artículos parecidos a Modelos de Redes Neuronales en Neurociencia puedes visitar la categoría Neurociencia.
