El habla humana es una maravilla de la complejidad biológica y cognitiva. Producir una simple sílaba o comprender una frase requiere la coordinación precisa de múltiples músculos y la integración de información sensorial y motora a una velocidad asombrosa. Durante décadas, los neurocientíficos han buscado comprender los mecanismos neuronales subyacentes a esta capacidad única. Una teoría prominente que intenta proporcionar un marco cuantitativo y anatómicamente plausible es el modelo computacional DIVA (Directions in sensory space Into Velocities of Articulators).

Este artículo explora el modelo DIVA, detallando su estructura, sus componentes principales y cómo postula que aprendemos y controlamos el habla. También examinaremos su conexión con el concepto de 'neuronas espejo' y cómo ayuda a unificar nuestra comprensión de la producción y percepción del habla.
- ¿Qué es el Modelo DIVA?
- Componentes Clave del Modelo DIVA
- Adquisición del Habla Según DIVA
- El Mapa de Sonidos del Habla como "Espejo"
- Roles Funcionales del Mapa de Sonidos del Habla en DIVA
- Conexión con Otras Teorías y Áreas Cerebrales
- Control Articulatorio y Fonética
- Preguntas Frecuentes sobre la Teoría Neural del Habla
- ¿Qué es el modelo DIVA?
- ¿Cómo aprendemos a hablar según el modelo DIVA?
- ¿Qué papel juega el mapa de sonidos del habla?
- ¿Están involucradas las neuronas espejo en el habla?
- ¿Qué áreas del cerebro son importantes para el habla según estos modelos?
- ¿Qué parte del cerebro controla los músculos articulatorios?
- Conclusión
¿Qué es el Modelo DIVA?
El modelo DIVA es un marco computacional diseñado para simular y explicar la adquisición y producción del habla. Concibe el cerebro como un sistema de mapas neuronales interconectados, donde cada mapa representa un conjunto de neuronas que realizan transformaciones específicas de información. Las proyecciones entre estos mapas simulan las conexiones sinápticas en el cerebro. El objetivo final del modelo es controlar un sintetizador articulatorio que genera una señal acústica, permitiendo comparar las predicciones del modelo con datos de habla humana real.
DIVA postula que la producción del habla se inicia con la activación de neuronas en un "mapa de sonidos del habla", que representa unidades como fonemas o sílabas. Desde este mapa, se generan comandos motores que llegan a la corteza motora primaria a través de dos sistemas de control principales: un sistema de control feedforward (directo) y un sistema de control feedback (retroalimentación), que a su vez se divide en subsistemas auditivo y somatosensorial.
Componentes Clave del Modelo DIVA
El modelo DIVA identifica varios mapas neuronales y vías de conexión como cruciales para el habla:
Mapa de Sonidos del Habla
Propuesto para residir en el giro frontal inferior posterior izquierdo (Área de Broca) y la corteza premotora ventral adyacente, este mapa es central en el modelo. Actúa como un vínculo crucial entre la representación sensorial de un sonido del habla y el programa motor necesario para producirlo. Una característica distintiva de las neuronas en este mapa es que se postula que están activas tanto durante la producción como durante la percepción del mismo sonido del habla. Esta propiedad las asemeja a las "neuronas espejo" descritas en otras áreas cerebrales, aunque en el contexto del habla.
Sistema de Control Feedforward
Este sistema implica proyecciones directas desde el mapa de sonidos del habla a unidades de control articulatorio en el cerebelo y la corteza motora primaria. Es responsable de la producción de habla fluida una vez que el comando motor para un sonido específico ha sido aprendido y ajustado. Permite generar rápidamente los movimientos articulatorios necesarios sin depender constantemente de la retroalimentación sensorial.
Sistema de Control Feedback (Retroalimentación)
Este sistema opera de manera más lenta e indirecta, pasando por áreas sensoriales. Es fundamental durante la adquisición del habla y para corregir errores en la producción. Se compone de dos subsistemas:
- Subsistema de Retroalimentación Auditiva: Involucra proyecciones desde la corteza premotora a la corteza auditiva de orden superior que codifican los objetivos auditivos para los sonidos del habla. También incluye proyecciones desde la corteza auditiva a la corteza motora que transforman los "errores auditivos" (la discrepancia entre el sonido producido y el objetivo auditivo) en comandos motores correctivos.
- Subsistema de Retroalimentación Somatosensorial: Similar al auditivo, pero basado en las sensaciones táctiles y propioceptivas (la sensación de posición y movimiento de los articuladores). Involucra proyecciones desde la corteza premotora a la corteza somatosensorial de orden superior que codifican los objetivos somatosensoriales, y proyecciones desde las neuronas de error somatosensorial a la corteza motora que generan comandos correctivos basados en la discrepancia entre la sensación esperada y la real.
Adquisición del Habla Según DIVA
El modelo DIVA proporciona una explicación de cómo un bebé aprende a producir sonidos del habla. Este proceso se describe en dos etapas principales:
Balbuceo
Durante el balbuceo inicial, tanto aleatorio como reduplicado, el bebé genera una combinación de información motora, auditiva y somatosensorial. Esta información se utiliza para ajustar las conexiones sinápticas, particularmente aquellas entre los mapas de error sensorial y la corteza motora a través de un mapa de control de retroalimentación (propuesto en la corteza premotora ventral derecha). Es en esta etapa donde se aprende la transformación de errores sensoriales (auditivos o somatosensoriales) en comandos motores correctivos. Esta transformación matemática se relaciona con el pseudoinverso de la matriz Jacobiana que vincula los espacios auditivo y motor.

Imitación
Cuando un bebé intenta aprender un nuevo sonido del habla (por ejemplo, de su lengua materna), se activan neuronas previamente no utilizadas en el mapa de sonidos del habla asociadas a ese sonido. Primero, se aprende un "objetivo auditivo" para el nuevo sonido, codificado en las proyecciones sinápticas. Este objetivo no es un punto fijo, sino una región que permite variabilidad, una característica importante del modelo.
En el primer intento de producir el nuevo sonido, el comando feedforward para ese sonido aún no está ajustado. Por lo tanto, el sistema debe depender fuertemente del subsistema de retroalimentación auditiva. Los errores auditivos detectados se transforman en comandos motores correctivos, utilizando la transformación aprendida durante el balbuceo. Con cada intento, el comando feedforward se actualiza para incorporar estos ajustes, volviéndose más preciso. Eventualmente, el comando feedforward por sí solo es suficiente para producir el sonido de forma fluida con poca o ninguna necesidad de retroalimentación auditiva activa.
A medida que la producción del sonido se repite y se vuelve fluida, también se aprende una "región objetivo somatosensorial", que representa las sensaciones esperadas asociadas con la producción del sonido. Esta se utiliza en el subsistema de retroalimentación somatosensorial para detectar y corregir errores basados en la sensación.
El Mapa de Sonidos del Habla como "Espejo"
El concepto de "neuronas espejo" se refiere a neuronas que se activan tanto cuando un individuo realiza una acción como cuando observa a otro individuo realizar la misma acción. El modelo DIVA postula que el mapa de sonidos del habla posee propiedades similares en el dominio del habla.
Durante la producción del habla, las regiones de la corteza prefrontal de alto nivel activan secuencialmente neuronas en el mapa de sonidos del habla, lo que lleva a la ejecución de comandos motores feedforward. Esta función se asemeja a la actividad de las neuronas espejo durante la producción de una acción.
Durante la percepción del habla, las vías desde las regiones auditivas de la corteza temporal superior (que procesan el sonido percibido) activan las mismas neuronas correspondientes en el mapa de sonidos del habla. Esta activación por entrada sensorial es análoga a la activación de las neuronas espejo durante la observación de una acción.
Gracias a su capacidad para mediar entre las representaciones auditivas (sensoriales) y motoras del habla, el mapa de sonidos del habla juega un papel fundamental en el aprendizaje por imitación dentro del modelo DIVA. Permite que la información sensorial (el sonido percibido) active la representación motora correspondiente, facilitando el aprendizaje de cómo producir ese sonido.

Roles Funcionales del Mapa de Sonidos del Habla en DIVA
El mapa de sonidos del habla cumple varias funciones cruciales en el modelo DIVA:
- Adquisición de Unidades: Facilita la adquisición de unidades discretas de sonidos del habla a partir de la información auditiva procesada en la corteza temporal superior.
- Definición de Objetivos Sensoriales: Las proyecciones de retroalimentación desde este mapa a los mapas de error auditivo y somatosensorial definen las señales de retroalimentación sensorial esperadas al producir sonidos objetivo específicos.
- Generación de Comandos Motores: Las señales de comando motor feedforward desde el mapa de sonidos del habla inician directamente los programas motores para los sonidos del habla en la corteza motora y el cerebelo.
El modelo DIVA sugiere que estas unidades con propiedades de espejo no necesariamente son responsables de la "comprensión de la acción" (como se ha postulado para otras neuronas espejo), sino que sirven para vincular representaciones sensoriales y motoras y facilitar el aprendizaje y control del habla.
Conexión con Otras Teorías y Áreas Cerebrales
Más allá del modelo DIVA, se ha propuesto un marco más amplio para la organización funcional del lenguaje en el cerebro, que involucra dos corrientes de procesamiento principales a partir de las etapas tempranas de percepción del habla en el giro temporal superior:
- Corriente Ventral: Implicada en el mapeo del sonido al significado. Se proyecta ventrolateralmente hacia la corteza temporal posterior inferior, que actúa como interfaz entre las representaciones basadas en sonido y las representaciones conceptuales distribuidas.
- Corriente Dorsal: Implicada en el mapeo del sonido a representaciones basadas en la articulación. Se proyecta dorsoposteriormente, involucrando una región en la fisura Silviana posterior (área Spt) y proyectándose finalmente a regiones frontales. Esta corriente proporciona un mecanismo para mantener la "paridad" entre las representaciones auditivas y motoras del habla.
El modelo DIVA, particularmente su mapa de sonidos del habla y las vías que conectan las áreas auditivas y motoras, se alinea bien con la corriente dorsal. El mapa de sonidos del habla, propuesto en el giro frontal inferior y la corteza premotora ventral, es parte de las regiones frontales a las que se proyecta la corriente dorsal. La conexión entre las áreas auditivas del giro temporal superior y el mapa de sonidos del habla es esencial para la adquisición y la función de "espejo" en DIVA, reflejando el mapeo de sonido a articulación de la corriente dorsal.
Las áreas cerebrales mencionadas en estos modelos incluyen el giro temporal superior (percepción auditiva inicial), la corteza temporal posterior inferior (significado), el área Spt (interfaz temporo-parietal para mapeo sonido-articulación), el giro frontal inferior (Área de Broca, parte del mapa de sonidos del habla), la corteza premotora ventral (mapa de sonidos del habla, control de retroalimentación) y el cerebelo (control articulatorio).
Control Articulatorio y Fonética
El modelo DIVA describe cómo se generan los comandos motores, pero estos comandos finalmente actúan sobre los músculos articulatorios para producir los sonidos del habla. La fonética articulatoria describe cómo se producen estos sonidos utilizando los órganos del tracto vocal. Los comandos motores provenientes de la corteza motora, modulados por los sistemas feedforward y feedback de DIVA, controlan los movimientos de los articuladores activos (como la lengua y los labios) hacia los articuladores pasivos (como los dientes o el paladar) para formar las constricciones o cierres necesarios.
La producción de sonidos se caracteriza por tres factores principales en fonética articulatoria:
- Voz: Si las cuerdas vocales vibran (sonidos sonoros) o no (sonidos sordos).
- Lugar de Articulación: Dónde se forma la constricción en el tracto vocal (bilabial, labiodental, dental, alveolar, postalveolar, palatal, velar).
- Modo de Articulación: Cómo se modifica el flujo de aire (oclusivas, nasales, fricativas, aproximantes para consonantes; o la posición de la lengua y los labios para vocales).
El modelo DIVA genera los comandos neurales que, al ser ejecutados por el sistema motor, resultan en los movimientos articulatorios precisos necesarios para lograr las configuraciones del tracto vocal descritas por la fonética articulatoria para cada sonido específico.
| Característica | Sistema Feedforward | Sistema Feedback (Auditivo/Somatosensorial) |
|---|---|---|
| Velocidad | Rápido y directo | Más lento e indirecto |
| Vías Neuronales | Directo desde mapa de sonidos del habla a corteza motora/cerebelo | Vías indirectas a través de áreas sensoriales (auditiva/somatosensorial) |
| Función Principal | Producción de habla fluida y automática | Adquisición del habla, corrección de errores, ajuste de comandos feedforward |
| Dependencia Sensorial | Mínima durante la producción fluida | Depende activamente de la retroalimentación sensorial (auditiva y somatosensorial) |
| Rol en el Aprendizaje | Se afina a lo largo del aprendizaje para volverse autónomo | Esencial en las etapas tempranas para transformar errores en correcciones |
Preguntas Frecuentes sobre la Teoría Neural del Habla
¿Qué es el modelo DIVA?
Es un modelo computacional neurocientífico que simula cómo el cerebro adquiere, produce y percibe el habla, centrándose en los mecanismos de control motor y sensorial.
¿Cómo aprendemos a hablar según el modelo DIVA?
El aprendizaje ocurre en etapas, comenzando con el balbuceo para ajustar los sistemas de retroalimentación y continuando con la imitación, donde se aprenden sonidos específicos afinando progresivamente los comandos motores directos (feedforward) basados en la retroalimentación sensorial.

¿Qué papel juega el mapa de sonidos del habla?
Es un componente central que une las representaciones sensoriales y motoras de los sonidos del habla. Se activa tanto al producir como al percibir un sonido, actuando de forma similar a las neuronas espejo y siendo clave para el aprendizaje por imitación.
¿Están involucradas las neuronas espejo en el habla?
Según el modelo DIVA, sí. Las neuronas en el mapa de sonidos del habla exhiben una propiedad similar a la de las neuronas espejo al activarse durante la producción y la percepción del mismo sonido del habla, facilitando el vínculo entre ambas.
¿Qué áreas del cerebro son importantes para el habla según estos modelos?
Áreas clave incluyen el giro temporal superior (procesamiento auditivo inicial), el giro frontal inferior (Área de Broca), la corteza premotora ventral (parte del sistema de control), el cerebelo (control motor fino) y áreas relacionadas con las corrientes dorsal y ventral para el mapeo sonido-articulación y sonido-significado.
¿Qué parte del cerebro controla los músculos articulatorios?
Los comandos para los músculos articulatorios se originan en la corteza motora primaria y son modulados por las señales que provienen de sistemas de control como los descritos en el modelo DIVA (mapa de sonidos del habla, sistemas feedforward y feedback) y contribuciones del cerebelo.
Conclusión
La comprensión de cómo el cerebro maneja el habla es un desafío monumental. Modelos computacionales como DIVA ofrecen un marco cuantitativo poderoso para desentrañar esta complejidad. Al postular mapas neuronales específicos y sus interacciones para el control feedforward y feedback, y al proponer un papel central para el mapa de sonidos del habla con propiedades de espejo, DIVA proporciona una teoría coherente sobre la adquisición, producción y percepción del habla. Este enfoque no solo unifica aspectos sensoriales y motores del habla, sino que también genera predicciones verificables experimentalmente, impulsando la investigación futura en neurociencia del lenguaje y ayudando a comprender mejor las bases neurales de nuestra capacidad de comunicarnos.
La investigación continua, utilizando técnicas como la resonancia magnética funcional (fMRI), se beneficia enormemente de marcos teóricos detallados como DIVA para interpretar los patrones de activación cerebral observados y avanzar en nuestro conocimiento del sistema neural del habla.
Si quieres conocer otros artículos parecidos a Neurociencia del Habla: El Modelo DIVA puedes visitar la categoría Neurociencia.
