Universidad Tsinghua e Inteligencia Artificial
Foto: Generación IA
Científicos de la Universidad de Tsinghua han dado a conocer un método pionero de computación fotónica que podría mejorar significativamente los procesos de entrenamiento de las redes neuronales ópticas. Este avance, unido al lanzamiento del chip basado en luz Taichi-II, está llamado a ofrecer una alternativa más rápida y eficiente desde el punto de vista energético para el entrenamiento de grandes modelos lingüísticos.
Los investigadores Lu Fang y Dai Qionghai, junto con su equipo, publicaron sus hallazgos en un artículo titulado “Fully Forward Mode (FFM) Training for Optical Neural Networks” en la revista Nature. El artículo pone de relieve su potencial para avanzar en campos aplicados y teóricos como las redes neuronales profundas, la percepción ultrasensible y la fotónica topológica.
El método actual para entrenar modelos de IA se basa en gran medida en la emulación de ordenadores digitales, que se ve limitada por su elevado consumo energético y su dependencia del hardware de las GPU. El método de aprendizaje FFM desarrollado por Tsinghua permite llevar a cabo estos procesos de entrenamiento intensivos por ordenador directamente en el sistema físico, lo que reduce significativamente las restricciones del modelado numérico, según el equipo de investigación.
Aunque la computación fotónica ha ofrecido una gran potencia de cálculo con un menor consumo de energía en comparación con los métodos convencionales, se ha limitado a los cálculos preliminares. Los cálculos precisos y complejos necesarios para el entrenamiento avanzado de la IA han seguido dependiendo en gran medida de las GPU, según explicó Liu Gang, economista jefe del Instituto Chino de Estrategias de Desarrollo de la IA de Nueva Generación, al Global Times.
La nueva tecnología desarrollada por el equipo de Tsinghua promete superar estas limitaciones, eliminando potencialmente la necesidad de un uso extensivo de GPU y conduciendo a un entrenamiento más eficiente y preciso de los modelos de IA, añadió Liu.