O CITIC traballa en achegar solucións para os grandes retos actuais da información (Big Data)
martes, 23 de decembro do 2014
Dicía
Larry Page, co-fundador do xigante Google, que organizar a
información do mundo non é algo que poidan facer cen persoas.
Afrontando a problemática real que supón o almacenamento, análise
e acceso á cantidade de datos que se xeran cada día, o empresario
non anda escaso de razón. Cada dous días, xéranse no mundo 5
hexabytes de información, cantidade equivalente á información
dixital xerada ate o ano 2003. Aínda que historicamente existían
técnicas para manexar grandes volumes de datos, atopámonos con que
na actualidade non son aplicábeis. A análise de datos Big Data no
só presenta un problema de volume, senón tamén de xestión da
velocidade á que se producen e a variedade de fontes, formatos,
etc., que achegan. Dende a Área Tecnolóxica de Intelixencia
Artificial do Centro de Investigación en Tecnoloxías da Información
e as Comunicacións (CITIC)
traballan sobre tres aproximacións.
En
primeiro lugar, a selección de características, na que se intenta
detectar aquelas variables relevantes para resolver un problema
concreto. A continuación, a aprendizaxe computacional, que engloba o
aprendizaxe en tempo real –sistemas capaces de “tragar” todos
os datos a grande velocidade, ao tempo que os clasifica- e a
aprendizaxe distribuída –que ten sentido cando a información
provén de estar almacenada fisicamente en sitios distintos-. Por
último, traballa sobre a detección de anomalías, de utilidade
cando os datos que se queren detectar en relación a un problema son
aqueles que se atopan en menor cantidade.
As
aplicacións que atopa o traballo nestas vertentes son variadas. Por
un lado, aplícase na análise do comportamento de usuarios en
contornas dixitais. Un sistema permite ofrecer recomendacións a
usuarios a partir da análise e filtrado de Big Data, e que atopa
unha aplicación doada no sector da prensa. Amparo Alonso, unha das
investigadoras principais da Área de Intelixencia Artificial,
explica que “deste
xeito, extráense patróns de comportamento, ademais de coñecer o
perfil dos usuarios”.
Seguindo este ronsel, atópanse as recomendacións e correccións
automáticas de probas nos MOOCS. Neste caso, o sistema emprega
métodos de ránking, aprendizaxe de preferencias e palabras clave.
Foi desenvolvido canda outros grupos de investigación da
Universidade de Oviedo e a Universidade de Sevilla onde, unidos á
Universidade da Coruña, implantáronse os pilotos. Bertha Guijarro,
vicecoordinadora do CITIC, engade que “se
trata dun sistema automático de corrección de grande relevancia
para a potenciación do ensino en
liña -eido no que países como Estados Unidos xa están a despuntar- xa
que permitirá que os cursos se distingan non só polo contido senón
polos métodos”.
O labor
do CITIC na análise e manexo de datos non remata aquí. A Área de
Sistemas de Información creou recentemente unha ferramenta que
permite aos usuarios, xa sexan particulares ou empresas, dar forma e
manter o seu propio catálogo de contidos dixitais.
E-ditor
é o resultado dun acordo de colaboración con Enxenio,
spin-off
da Universidade da Coruña. O proxecto xurdiu a raíz dunha
necesidade detectada de contar con ferramentas de creación de
contidos dixitais que permitiran, ao mesmo tempo, a súa
venda/distribución e visualización. O obxectivo perseguido era,
ademais, desenvolver unha ferramenta web soportada con tecnoloxía de
bases de datos que facilitara a creación e mantemento de contido
interactivo formado por texto, imaxes, audio ou animacións,
actividades de autoavaliación, etc.
“Queríamos
unha ferramenta o máis sinxela posible, que guiara aos usuarios
dunha maneira simple, de tal maneira que non fora necesario nin un
curso introdutorio de manexo da ferramenta”,
conta Eduardo Rodríguez, un dos investigadores principais do
proxecto. Dito e feito. A plataforma estrutura o contido de tal
maneira que é facilmente editable e permite ser organizado en
capítulos, temas, unidades, etc. Á hora de introducir o contido,
E-ditor posibilita texto, audio, imaxes, arquivos en flash, etc., así
como exercicios interactivos. Por último, permite que a información
sexa exportada a distintos formatos, o máis común ePUB, pero tamén
HTML, CSS ou SCORM. Todo baixo o uso de patróns que permiten
personalizar a estética do contido.
Actualmente,
E-ditor conta xa con arredor de 600 usuarios rexistrados, repartidos
entre particulares e empresas do mundo editorial. Agárdase que nos
vindeiros anos esta cifra continúe aumentando.