O CITIC traballa en achegar solucións para os grandes retos actuais da información (Big Data)

martes, 23 de decembro do 2014 Redacción

Dicía Larry Page, co-fundador do xigante Google, que organizar a información do mundo non é algo que poidan facer cen persoas. Afrontando a problemática real que supón o almacenamento, análise e acceso á cantidade de datos que se xeran cada día, o empresario non anda escaso de razón. Cada dous días, xéranse no mundo 5 hexabytes de información, cantidade equivalente á información dixital xerada ate o ano 2003. Aínda que historicamente existían técnicas para manexar grandes volumes de datos, atopámonos con que na actualidade non son aplicábeis. A análise de datos Big Data no só presenta un problema de volume, senón tamén de xestión da velocidade á que se producen e a variedade de fontes, formatos, etc., que achegan. Dende a Área Tecnolóxica de Intelixencia Artificial do Centro de Investigación en Tecnoloxías da Información e as Comunicacións (CITIC) traballan sobre tres aproximacións.
En primeiro lugar, a selección de características, na que se intenta detectar aquelas variables relevantes para resolver un problema concreto. A continuación, a aprendizaxe computacional, que engloba o aprendizaxe en tempo real –sistemas capaces de “tragar” todos os datos a grande velocidade, ao tempo que os clasifica- e a aprendizaxe distribuída –que ten sentido cando a información provén de estar almacenada fisicamente en sitios distintos-. Por último, traballa sobre a detección de anomalías, de utilidade cando os datos que se queren detectar en relación a un problema son aqueles que se atopan en menor cantidade.
As aplicacións que atopa o traballo nestas vertentes son variadas. Por un lado, aplícase na análise do comportamento de usuarios en contornas dixitais. Un sistema permite ofrecer recomendacións a usuarios a partir da análise e filtrado de Big Data, e que atopa unha aplicación doada no sector da prensa. Amparo Alonso, unha das investigadoras principais da Área de Intelixencia Artificial, explica que “deste xeito, extráense patróns de comportamento, ademais de coñecer o perfil dos usuarios”. Seguindo este ronsel, atópanse as recomendacións e correccións automáticas de probas nos MOOCS. Neste caso, o sistema emprega métodos de ránking, aprendizaxe de preferencias e palabras clave. Foi desenvolvido canda outros grupos de investigación da Universidade de Oviedo e a Universidade de Sevilla onde, unidos á Universidade da Coruña, implantáronse os pilotos. Bertha Guijarro, vicecoordinadora do CITIC, engade que “se trata dun sistema automático de corrección de grande relevancia para a potenciación do ensino en liña -eido no que países como Estados Unidos xa están a despuntar- xa que permitirá que os cursos se distingan non só polo contido senón polos métodos”.
O labor do CITIC na análise e manexo de datos non remata aquí. A Área de Sistemas de Información creou recentemente unha ferramenta que permite aos usuarios, xa sexan particulares ou empresas, dar forma e manter o seu propio catálogo de contidos dixitais.
E-ditor é o resultado dun acordo de colaboración con Enxenio, spin-off da Universidade da Coruña. O proxecto xurdiu a raíz dunha necesidade detectada de contar con ferramentas de creación de contidos dixitais que permitiran, ao mesmo tempo, a súa venda/distribución e visualización. O obxectivo perseguido era, ademais, desenvolver unha ferramenta web soportada con tecnoloxía de bases de datos que facilitara a creación e mantemento de contido interactivo formado por texto, imaxes, audio ou animacións, actividades de autoavaliación, etc.
Queríamos unha ferramenta o máis sinxela posible, que guiara aos usuarios dunha maneira simple, de tal maneira que non fora necesario nin un curso introdutorio de manexo da ferramenta”, conta Eduardo Rodríguez, un dos investigadores principais do proxecto. Dito e feito. A plataforma estrutura o contido de tal maneira que é facilmente editable e permite ser organizado en capítulos, temas, unidades, etc. Á hora de introducir o contido, E-ditor posibilita texto, audio, imaxes, arquivos en flash, etc., así como exercicios interactivos. Por último, permite que a información sexa exportada a distintos formatos, o máis común ePUB, pero tamén HTML, CSS ou SCORM. Todo baixo o uso de patróns que permiten personalizar a estética do contido.
Actualmente, E-ditor conta xa con arredor de 600 usuarios rexistrados, repartidos entre particulares e empresas do mundo editorial. Agárdase que nos vindeiros anos esta cifra continúe aumentando.

PUBLICIDADE