Aprendizaje máquinaLogra acelerar as rondas de entrenamento de aprendizaxe máquina facendo uso de FinisTerrae

Gonzalo Ferro do Dpto. de Proxectos e Aplicacións do CESGA ven de desenvolver un paquete de software en python para explotar o paralelismo que posibilita FinisTerrae utilizando a API de Google para aprendizaxe máquina, TensorFlow. Así, conseguiu reducir os tempos de entrenamento dun algoritmo de aprendizaxe automática nun 90%.

Con esto, Ferro demostrou que se pode acelerar o entrenamento de redes convolucionais empregando como exemplo un caso de control dun proceso de deposición por láser desenvolvido polo Centro Tecnolóxico AIMEN. O caso amosa a vantaxe do emprego de redes de interconexión de nodos de alta velocidade como Infiniband para reducir os tempos dun entrenamento paralelo.

O preparou un paquete que tira proveito das tecnoloxías Infiniband de intercomunicación de nodos das que dispón FinisTerrae.

Unha completa descrición do paquete e os resultados do experimento poden ser consultados no informe técnico “Integrating Neural Network Parallel Training using Tensorflow with SLURM”

Machine learning infiniband