Sistemas recomendadores e buscas de información máis efectivas a través das investigacións do CITIC
martes, 30 de abril do 2013
- O investigador do centro coruñés de I+D, VÃctor Carneiro
Cando
un accede a Google ou a calquera outro buscador estarÃa encantado
con que a través dunha operación simple e rápida atopase na
primeira páxina de resultados toda a información que está a
procurar, pero ás veces téñense que realizar novas buscas ou
avanzar na listaxe de páxinas ata chegar ao resultado óptimo. Para
evitar esta situación e mellorar a calidade da información obtida,
o Centro de Investigación en TecnoloxÃas da Información e as
Comunicacións (CITIC)
desenvolveu técnicas intelixentes baseadas na creación
semiautomática de aplicacións de integración lixeiras (mashups)
que se están a aplicar en empresas como Denodo Technologies ou en
sectores como a banca ou a industria téxtil.
Segundo
nos lembran dende o centro coruñés, o volume de información que se
xera en Internet é descomunal, estÃmase que en dous dÃas prodúcese
a mesma cantidade de información que dende a orixe dos tempos ata o
ano 2003. Pero, de todo o que se encontra na Rede, cales son os datos
que está a buscar ou necesita unha empresa? O Centro de
Investigación en TecnoloxÃas da Información e as Comunicacións
(CITIC) leva anos desenvolvendo proxectos de investigación nesta
liña, que favorezan a obtención de información máis refinada e
axeitada ás buscas realizadas do xeito máis rápido posible.
En
definitiva, trátase de obter un software que baseado nun algoritmo sexa
quen de crear un sistema recomendador cun claro obxectivo: recadar
información máis relevante.
Procuras
máis refinadas
VÃctor
Carneiro, investigador
principal
do Grupo de Investigación Telemática do CITIC explica o
funcionamento destas aplicacións de integración de datos en dous
pasos: "En
Internet hai millóns de fontes, un buscador emprega complicados
algoritmos para encontrar a información requirida pero non é quen
de determinar que fonte é a máis axeitada para a busca que
realizamos. O noso software baseado en técnicas intelixentes
permite, en primeiro lugar, a localización das mellores fontes de
datos
e a continuación, sobre ese primeiro nesgo, busca o contido
relacionado, co que se conseguen buscas máis refinadas e eficientes.
Trátase de quedar co que realmente interesa".
Estes
sistemas recomendadores do CITIC obteñen mellores buscas xa que
integran todo tipo de datos e fontes heteroxéneas como páxinas
html, arquivos Word, bases de datos ou formularios, conseguindo
homoxeneizalas dun xeito rápido, en tan só segundos. Un dos
obxectivos principais é conseguir que estas operacións se realicen
de maneira óptima e rápida, xa que as respostas lentas están
condenadas ao fracaso.
Investigación
aplicada
Entre
os proxectos de investigación do CITIC levados á práctica destacan
as aplicacións mashup de intelixencia colectiva que foron
empregadas para colaborar nalgunhas das plataformas da compañÃa
Denodo Technologies, referente internacional no acceso ás fontes de
información desestruturadas. Para este caso en concreto, creáronse
unha serie de algoritmos desenvolvidos para análise de formularios
web, automatización de consultas, etc. Deste xeito, o sistema
adáptase a cambios recorrentes nas fontes, a novas fontes,...
Desde
o CITIC tamén se desenvolveron aplicacións orientadas á venda en
liña na industria téxtil. Baseándose nunha aplicación de
algoritmos deuse forma a un software que orixina un sistema
recomendador que facilita información sobre produtos relacionados na
procura, permitindo incrementar en máis dun 5% as vendas a través
de web. En función dos pasos que o cliente realiza na súa procura,
asÃgnase un peso á mesma, o que favorece a recomendación doutros
produtos dentro dun volume de información enorme.
Para
os investigadores do centro coruñés, o correcto manexo do
coñecemento é a dÃa de hoxe un dos aspectos máis importantes para
as empresas: integrar datos, analizalos e atopar o que se precisa do
xeito máis eficaz posible é un dos grandes eidos nos que
investigación TIC está a facer máis fincapé. Non é necesario
saÃr de Galicia para atopar modelos de como levalo a cabo, o CITIC
desenvolveu diferentes técnicas que facilitan este obxectivo.
Axudas do programa de consolidación e estruturación de unidades de investigación competitivas: Agrupación Estratéxica CITIC (CN2012/211). Cofinanciado por::