¿Queremos energía nuclear más barata? Convirtamos el proceso de diseño en un juego

Los investigadores muestran que el aprendizaje por refuerzo profundo se puede utilizar para diseñar reactores nucleares más eficientes.Lo que permitiría obtener energía nuclear más barata.
En este diseño diseñado por IA para un reactor de agua hirviendo, las barras de combustible están ubicadas idealmente alrededor de dos barras de agua fijas para quemar de manera más eficiente. Los investigadores del MIT ejecutaron el equivalente a 36.000 simulaciones para encontrar las configuraciones óptimas, lo que podría extender la vida útil de las varillas en un conjunto en aproximadamente un 5 por ciento, generando $ 3 millones en ahorros por año si se escala al reactor completo. Los colores corresponden a cantidades variables de uranio y óxido de gadolinio en cada barra.

Kim Martineau | Búsqueda de inteligencia del MIT
Créditos: Imagen: Majdi Radaideh / MIT

La energía nuclear proporciona más electricidad libre de carbono en los Estados Unidos que la solar y la eólica juntas, lo que la convierte en un actor clave en la lucha contra el cambio climático. Pero la flota nuclear estadounidense está envejeciendo y los operadores están bajo presión para optimizar sus operaciones y competir con las plantas de carbón y gas.

Uno de los lugares clave para reducir los costos es el núcleo del reactor, donde se produce la energía. Si las barras de combustible que impulsan las reacciones allí están ubicadas de manera ideal, queman menos combustible y requieren menos mantenimiento. A través de décadas de prueba y error, los ingenieros nucleares han aprendido a diseñar mejores diseños para extender la vida útil de las costosas barras de combustible. Ahora, la inteligencia artificial está preparada para impulsarlos.

Investigadores del MIT y Exelon muestran que al convertir el proceso de diseño en un juego, se puede entrenar un sistema de IA para generar docenas de configuraciones óptimas que pueden hacer que cada varilla dure aproximadamente un 5 por ciento más, ahorrando a una planta de energía típica un estimado de $ 3 millones al año , informan los investigadores. El sistema de IA también puede encontrar soluciones óptimas más rápido que un humano y modificar rápidamente los diseños en un entorno seguro y simulado. Sus resultados aparecen este mes en la revista Nuclear Engineering and Design.

“Esta tecnología se puede aplicar a cualquier reactor nuclear del mundo”, dice el autor principal del estudio, Koroush Shirvan, profesor asistente en el Departamento de Ciencia e Ingeniería Nuclear del MIT. “Al mejorar la economía de la energía nuclear, que suministra el 20 por ciento de la electricidad generada en los EE. UU., Podemos ayudar a limitar el crecimiento de las emisiones globales de carbono y atraer a los mejores jóvenes talentos a este importante sector de energía limpia”.

En un reactor típico, las barras de combustible están alineadas en una rejilla, o ensamblaje, por sus niveles de uranio y óxido de gadolinio en su interior, como piezas de ajedrez en un tablero, con reacciones de conducción de uranio radiactivo y gadolinio de tierras raras que las ralentiza. En un diseño ideal, estos impulsos en competencia se equilibran para generar reacciones eficientes. Los ingenieros han intentado utilizar algoritmos tradicionales para mejorar los diseños creados por humanos, pero en un conjunto estándar de 100 varillas puede haber una cantidad astronómica de opciones para evaluar. Hasta ahora, han tenido un éxito limitado.

Los investigadores se preguntaron si el aprendizaje por refuerzo profundo, una técnica de inteligencia artificial que ha logrado un dominio sobrehumano en juegos como el ajedrez y el Go, podría acelerar el proceso de selección. El aprendizaje por refuerzo profundo combina redes neuronales profundas, que destacan en la selección de patrones en montones de datos, con el aprendizaje por refuerzo, que vincula el aprendizaje con una señal de recompensa como ganar un juego, como en Go, o alcanzar una puntuación alta, como en Super Mario Bros .

Aquí, los investigadores entrenaron a su agente para colocar las barras de combustible bajo una serie de restricciones, ganando más puntos con cada movimiento favorable. Cada restricción, o regla, elegida por los investigadores refleja décadas de conocimiento experto enraizado en las leyes de la física. El agente podría ganar puntos, por ejemplo, colocando barras con bajo contenido de uranio en los bordes del conjunto, para ralentizar las reacciones allí; extendiendo las varillas de «veneno» de gadolinio para mantener niveles constantes de quemaduras; y limitando el número de varillas de veneno entre 16 y 18.

“Una vez que se introducen las reglas, las redes neuronales comienzan a tomar muy buenas acciones”, dice el autor principal del estudio, Majdi Radaideh, un postdoctorado en el laboratorio de Shirvan. “No están perdiendo el tiempo en procesos aleatorios. Fue divertido verlos aprender a jugar como lo haría un humano «.

A través del aprendizaje por refuerzo, la IA ha aprendido a jugar juegos cada vez más complejos tan bien o mejor que los humanos. Pero sus capacidades permanecen relativamente sin probar en el mundo real. Aquí, los investigadores muestran que el aprendizaje por refuerzo tiene aplicaciones potencialmente poderosas.

“Este estudio es un ejemplo emocionante de la transferencia de una técnica de inteligencia artificial para jugar juegos de mesa y videojuegos para ayudarnos a resolver problemas prácticos en el mundo”, dice el coautor del estudio Joshua Joseph, científico investigador del MIT Quest for Intelligence.

Exelon ahora está probando una versión beta del sistema de IA en un entorno virtual que imita un ensamblaje dentro de un reactor de agua hirviendo, y alrededor de 200 ensamblajes dentro de un reactor de agua a presión, que es el tipo de reactor más común a nivel mundial. Con base en Chicago, Illinois, Exelon posee y opera 21 reactores nucleares en los Estados Unidos. Podría estar listo para implementar el sistema en uno o dos años, dice un portavoz de la compañía.

Los otros autores del estudio son Isaac Wolverton, un estudiante de último año del MIT que se unió al proyecto a través del Programa de Oportunidades de Investigación de Pregrado; Nicholas Roy y Benoit Forget del MIT; y James Tusar y Ugi Otgonbaatar de Exelon.

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos y para fines de afiliación y para mostrarte publicidad relacionada con sus preferencias en base a un perfil elaborado a partir de tus hábitos de navegación. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de sus datos para estos propósitos. Más información
Privacidad
Ir al contenido