Gradiant traballa en ampliar ao máximo a capacidade de lectura dos dispositivos

martes, 17 de xuño do 2014 Redacción

O centro tecnolóxico Gradiant está a traballar dende a súa sede no campus de Vigo en procurar novos vieiros para incrementar a capacidade de comprensión dos dispositivos móbiles, ou sexa a capacidade de interpretar a linguaxe escrita (sinais específicos para eles, pero tamén non específicos), no camiño de mellorar a nosa calidade de vida de moitas e variadas maneiras (máis e mellor eAdministración, atención médica áxil e optimizada, coñecemento do medio, eficiencia no transporte, etc). Segundo informa o centro galego, a devandita capacidade de “ler” e “interpretar” información escrita é unha das claves para o futuro das Cidades Intelixentes, e máis polo miúdo para o que se coñece como smart devices.
Proba diso é que practicamente tódolos xigantes tecnolóxicos están a mover ficha na procura de novos desenvolvementos baseados en lectura e entendemento que complementen os seus produtos.

Javier Sánchez, investigador de Gradiant

Sexa como sexa, o investigador Javier Sánchez lembra dende Gradiant que o recoñecemento de caracteres (OCR) non é algo novo, senón “unha tecnoloxía veterana”. Ten a súa orixe na década dos setenta do século pasado, e a súa evolución foi posíbel grazas aos sucesivos avances en areas como o procesado de imaxe e o recoñecemento de patróns. “Na actualidade”, engade o investigador, “o recoñecemento de texto en documentos e imaxes en condicións controladas é parte dunha tecnoloxía xa madura, e proba diso son as diferentes soluciones software existentes a día de hoxe, moitas delas integradas en procesadores de texto ou sistemas de almacenamento na nube (GoogleDrive co seu motor Tesseract)”.
Con todo, explica, a era dos dispositivos móbiles ten diante un novo reto: localizar e recoñecer o texto presente en contornas non controladas, onde unha serie de factores (iluminación irregular, cambios de perspectiva, oclusións..) “dificultan enormemente o proceso”. De aí (a necesidade de superar o dito desafío) xurdiron eventos académicos como as conferencias ICDAR ou o desenvolvemento de sistemas como o plugin Naptha, “que permite detectar e recoñecer texto en calquera elemento presente nun navegador web”. De semellante arela abrollou unha tecnoloxía de Google que é quen de recoñecer máis do 90% de texto en captchas e imaxes de GoogleStreetView. Javier Sánchez sostén que nos vindeiros anos seremos testemuñas da aparición definitiva de dispositivos que lean por nós, e Gradiant impulsa a chegada deste día con proxectos como Maven, do que xa temos falado en Código Cero e que se dirixe ao desenvolvemento de sistemas con capacidade para recoñecer texto en imaxes naturais.
Maven, como lembraremos, é unha iniciativa de colaboración impulsada por sete socios europeos (entre os que se atopa Gradiant) dirixida a dar forma a un paquete de ferramentas que permitan a xestión e a verificación da autenticidade de contidos multimedia. O proxecto comezou oficialmente o día 1 de outubro de 2013, e esténdese durante dous anos, até o 30 de setembro de 2015. Ten o seu xermolo nunha necesidade ben definida: a necesidade no mercado de prover á industria de solucións tecnolóxicas avanzadas que sexan quen de operar nun rango amplo de escenarios reais (circuítos pechados de TV, imaxes web, broadcast, etcétera). Os resultados deste proxecto permitirán ás PEME, corpos de seguridade, axencias, compañías de seguros e medios de comunicación (entre outras empresas) xestionar os seus activos multimedia e verificar a súa integridade e autenticidade.
O papel do centro galego no proxecto é de líder do mesmo, e como tal é responsábel da súa coordinación en termos xerais. Ademais, e como sinalamos ao comezo desta reportaxe, Gradiant dirixe o desenvolvemento de novas e efectivas ferramentas nos eidos do recoñecemento facial, da lectura e a interpretación de texto e da linguaxe falada en contidos multimedia.

PUBLICIDADE