Las redes neuronales artificiales, inspiradas en el funcionamiento del cerebro humano, son sistemas que permiten intercambiar información a través de una red de nodos interconectados. John Hopfield y Geoffrey Hinton, recibieron el premio Nobel a la física por sus contribuciones en este campo. Muchos de los términos que hemos estado leyendo en relación a esta noticia nos resuenan, obviamente, porque las herramientas de IA nos han estado sorprendiendo de forma notable durante los últimos dos años. Pero intentemos profundizar un poco más en qué esto significa:
¿Cómo funciona una red neuronal?
Una red neuronal se compone de nodos, que son unidades de procesamiento que imitan las neuronas del cerebro. Estos nodos están interconectados por conexiones, que emulan las sinapsis. Cada conexión tiene una fuerza asociada, que determina cuánto influye la salida de un nodo en la entrada de otro. A diferencia del software tradicional, que sigue instrucciones paso a paso, las redes neuronales aprenden a partir de ejemplos. Como explicaremos más adelante, este aprendizaje se logra ajustando la fuerza de las conexiones entre los nodos.
Cuando se introduce información en la red neuronal, esta se propaga a través de los nodos y conexiones. Cada nodo procesa la información que recibe y envía una salida a otros nodos. La red aprende a reconocer patrones y a realizar tareas ajustando las conexiones entre los nodos para que la salida de la red sea lo más cercana posible a la salida deseada.
John Hopfield creó la memoria asociativa, un tipo de red neuronal que puede almacenar y reconstruir información. Una red neuronal es capaz de encontrar patrones almacenados incluso cuando se le proporciona información incompleta o distorsionada, similar a como funciona la memoria humana.
Geoffrey Hinton, por su parte, desarrolló la máquina de Boltzmann que es un tipo de red neuronal artificial fundamental en el campo del aprendizaje automático.
¿Qué es la Máquina de Boltzmann?
Es un sistema que se inspira en la física estadística, una rama que estudia sistemas con muchos componentes similares. La Máquina de Boltzmann aplica la ecuación de Boltzmann desarrollada por el físico del siglo XIX Ludwig Boltzmann, la cual se utiliza para calcular la probabilidad de que ocurran diferentes patrones en una red en función de la energía del sistema. Así, al igual que la física estadística analiza las moléculas de un gas para determinar sus propiedades generales, la máquina de Boltzmann utiliza nodos interconectados para procesar información y encontrar patrones dentro de un sistema.
¿Pero cómo funciona esta máquina?
Imaginemos que queremos enseñarle a una computadora a reconocer una flor pero queremos evitar introducir un código complejo y largo que incluya todas sus posibles características. El objetivo es que la computadora pueda reconocer la imagen de la flor por sí misma y la máquina de Boltzamann tiene los recursos para lograrlo.
Una forma de describir su funcionamiento es hacer una analogía con un juego de acertijos entre dos equipos:
Los Nodos visibles: serán jugadores que reciben la información directa de la imagen de la flor, como si cada uno viera un pixel de la imagen.
Los Nodos ocultos: serán jugadores que no ven la foto directamente, pero están conectados a los nodos visibles. Su trabajo es encontrar patrones en la información que reciben de los nodos visibles.
Al principio, las conexiones entre todos los nodos son aleatorias. Durante el entrenamiento, se le muestran muchas fotos de flores a la máquina. Cada vez que se muestra una, los nodos visibles se activan según lo que "ven" y envían señales a los nodos ocultos. Los nodos ocultos, a su vez, intentan encontrar relaciones entre las señales que reciben.
El mecanismo avanza a medida que se ajusta la fuerza de las conexiones entre los nodos. Si dos nodos se activan juntos con frecuencia al ver imágenes de flores, la conexión entre ellos se fortalece. Por el contrario, si rara vez se activan juntos, la conexión se debilita. Lo interesante, finalmente, es que con suficiente entrenamiento, la máquina de Boltzmann "aprende" las características decisivas de una flor aunque nunca se le haya dado una definición explícita. Esto significa que si se le muestra una nueva imagen que nunca ha visto, la máquina puede usar las conexiones aprendidas para determinar si la imagen es o no una flor.
¿Por qué el Nobel de Física?
El trabajo de Hinton con la máquina de Boltzmann, junto con las contribuciones de John Hopfield en el desarrollo de la memoria asociativa, sentaron las bases para la revolución del aprendizaje automático que comenzó alrededor de 2010. La máquina de Boltzmann, en particular, demostró que las ideas de la física estadística podían aplicarse al desarrollo de redes neuronales artificiales, abriendo nuevas posibilidades para el procesamiento de información y el aprendizaje automático. Aunque la máquina de Boltzmann en su forma original no era muy eficiente, Hinton y otros investigadores continuaron desarrollándola y perfeccionandola, lo que llevó a la creación de redes neuronales más complejas y eficientes.
En este sentido, podríamos decir que la máquina de Boltzmann es un ejemplo de cómo la física puede inspirar el desarrollo de tecnologías innovadoras. Al aplicar conceptos de la física estadística al campo del aprendizaje automático, Hinton y sus colegas abrieron un nuevo camino para la inteligencia artificial, un camino que continúa en plena exploración.
Referencias: https://www.nobelprize.org/prizes/physics/2024/popular-information