Investigadores do CiTIUS facilitan o procesamento de Big Data cun algoritmo de baixo consumo
xoves, 5 de agosto do 2021
Investigadores
do Centro Singular de Investigación en Tecnoloxías Intelixentes da
Universidade de Santiago de Compostela (CiTIUS-USC) desenvolveron
unha solución que mellora “de maneira espectacular” un dos
métodos de referencia para a clasificación de grandes volumes de
datos datos mediante técnicas de aprendizaxe automática (Machine
Learning).
O
traballo, publicado na prestixiosa revista IEEE Transactions on
Pattern Analysis and Machine Intelligence (unha
das publicacións máis citadas internacionamente no ámbito da
Intelixencia Artificial e as Ciencias da Computación), permitiu
superar as eivas actuais do Machine Learning co
desenvolvemento dun novo Clasificador Rápido de Vectores de Soporte
(Fast Support Vector Classifier, FSVC), que, segundo fai saber
o CiTIUS, presenta numerosas vantaxes respecto ao método estándar:
“En primeiro lugar, é moito máis rápido, entre 10 e 100 veces
máis cás aproximacións tradicionais; e ademais, este novo
clasificador opera con moita menos memoria, grazas ao cal é capaz de
desenvolver solucións óptimas con computadores moito menos potentes
e custosos”, explica Manuel Fernández Delgado, director da
investigación.
Os
investigadores do CiTIUS destacan esta cuestión da sustentabilidade
e a eficiencia como unha das contribucións básicas do seu traballo:
“O aforro de memoria ten unha gran importancia”, asegura Ziad
Akram, investigador predoctoral do CiTIUS e primeiro autor do artigo,
“xa que mellorando a eficiencia podemos resolver, con equipos moito
máis modestos, problemas para os que normalmente necesitariamos un
supercomputador”. E engade a súa colega a investigadora Eva
Cernadas: “Todo iso tradúcese nunha redución enorme do custo e o
consumo de enerxía”.
Outro
dos artífices do traballo, Senén Barro, puntualiza que “unha das
claves é conseguir desenvolver unha solución analítica para o
deseño de clasificadores, o que evita usar métodos iterativos de
aprendizaxe sobre conxuntos de datos, a causa principal da
ineficiencia computacional e de consumo de recursos da Aprendizaxe
Automática”. O director científico do CiTIUS aclara que “con
esta nova aproximación é coma se puidésemos memorizar dunha vez un
conxunto enorme de casos (de caras, por exemplo), sen necesidade de
velas unha e outra vez ata que queden gravadas na nosa memoria”. E
engade: “A rapidez e o aforro en memoria e en capacidade de cómputo
é enorme, o que supón un aforro en diñeiro e, aínda máis
importante, en pegada de carbono”.