Gradiant traballa en ampliar ao máximo a capacidade de lectura dos dispositivos
martes, 17 de xuño do 2014
O centro tecnolóxico
Gradiant
está a traballar dende a súa sede no campus de Vigo en procurar
novos vieiros para incrementar a capacidade de comprensión dos
dispositivos móbiles, ou sexa a capacidade de interpretar a
linguaxe escrita (sinais específicos para eles, pero tamén non
específicos), no camiño de mellorar a nosa calidade de vida de
moitas e variadas maneiras (máis e mellor eAdministración, atención
médica áxil e optimizada, coñecemento do medio, eficiencia no
transporte, etc). Segundo informa o centro galego, a devandita
capacidade de “ler” e “interpretar” información escrita é
unha das claves para o futuro das Cidades Intelixentes, e máis polo
miúdo para o que se coñece como smart devices.
Proba diso é que
practicamente tódolos xigantes tecnolóxicos están a mover ficha na
procura de novos desenvolvementos baseados en lectura e entendemento
que complementen os seus produtos.
- Javier Sánchez, investigador de Gradiant
Sexa como sexa, o
investigador Javier Sánchez lembra dende Gradiant que o
recoñecemento de caracteres (OCR) non é algo novo, senón “unha
tecnoloxía veterana”. Ten a súa orixe na década dos setenta do
século pasado, e a súa evolución foi posíbel grazas aos sucesivos
avances en areas como o procesado de imaxe e o recoñecemento de
patróns. “Na actualidade”, engade o investigador, “o
recoñecemento de texto en documentos e imaxes en condicións
controladas é parte dunha tecnoloxía xa madura, e proba diso son as
diferentes soluciones software existentes a día de hoxe, moitas
delas integradas en procesadores de texto ou sistemas de
almacenamento na nube (GoogleDrive co seu motor Tesseract)”.
Con todo, explica, a era
dos dispositivos móbiles ten diante un novo reto: localizar e
recoñecer o texto presente en contornas non controladas, onde unha
serie de factores (iluminación irregular, cambios de perspectiva,
oclusións..) “dificultan enormemente o proceso”. De aí (a
necesidade de superar o dito desafío) xurdiron eventos académicos
como as conferencias ICDAR ou o desenvolvemento de sistemas como o
plugin Naptha, “que permite detectar e recoñecer texto en
calquera elemento presente nun navegador web”. De semellante arela
abrollou unha tecnoloxía de Google que é quen de recoñecer máis
do 90% de texto en captchas e imaxes de GoogleStreetView.
Javier Sánchez sostén que nos vindeiros anos seremos testemuñas da
aparición definitiva de dispositivos que lean por nós, e Gradiant
impulsa a chegada deste día con proxectos como Maven, do
que xa temos falado en Código Cero e que se dirixe ao
desenvolvemento de sistemas con capacidade para recoñecer texto en
imaxes naturais.
Maven, como lembraremos,
é unha iniciativa de colaboración impulsada por sete socios
europeos (entre os que se atopa Gradiant) dirixida a dar forma a un
paquete de ferramentas que permitan a xestión e a verificación da
autenticidade de contidos multimedia. O proxecto comezou oficialmente
o día 1 de outubro de 2013, e esténdese durante dous anos, até o
30 de setembro de 2015. Ten o seu xermolo nunha necesidade ben
definida: a necesidade no mercado de prover á industria de solucións
tecnolóxicas avanzadas que sexan quen de operar nun rango amplo de
escenarios reais (circuítos pechados de TV, imaxes web, broadcast,
etcétera). Os resultados deste proxecto permitirán ás PEME, corpos
de seguridade, axencias, compañías de seguros e medios de
comunicación (entre outras empresas) xestionar os seus activos
multimedia e verificar a súa integridade e autenticidade.
O papel do centro galego
no proxecto é de líder do mesmo, e como tal é responsábel da súa
coordinación en termos xerais. Ademais, e como sinalamos ao comezo
desta reportaxe, Gradiant dirixe o desenvolvemento de novas e
efectivas ferramentas nos eidos do recoñecemento facial, da lectura
e a interpretación de texto e da linguaxe falada en contidos
multimedia.