Diagnósticos médicos seguros e fiables co proxecto europeo TRUMPET

mércores, 4 de outubro do 2023 S. P.

Fernando Pérez e Alberto Pedrouzo

Os investigadores de atlanTTic Fernando Pérez e Alberto Pedrouzo participan nun proxecto en cifrado homomórfico para conseguir compartir con éxito datos cifrados sen vulnerar a privacidade dos pacientes enfermos de cancro.
TRUMPET (Trustworthy Multi-site Privacy Enhancing Technologies) é un proxecto do programa Horizonte Europa no que participan Reino Unido e Israel e os investigadores de atlanTTic (Centro de Investigación en Tecnoloxías de Telecomunicación da Universidade de Vigo), Fernando Pérez-González e Alberto Pedrouzo Ulloa.
A través das súas investigacións preténdese desenvolver unha ferramenta eficaz que evite as fugas de información e perdas de privacidade da denominada “aprendizaxe federada”, un potente concepto creado por Google en 2016 e que se emprega en medicina, defensa, telecomunicacións ou farmacia. En concreto, TRUMPET centrarase na loita contra o cancro e farao a través dos seus dous socios sanitarios, os hospitais oncolóxicos de Liege, en Bélxica, e de IRST-IRCCS, en Emilia-Romaña, Italia.
En palabras de Fernando Pérez e Alberto Pedrouzo a aprendizaxe federada é unha técnica de adestramento de modelos que traballa de maneira descentralizada en múltiples dispositivos ou servidores, sen necesidade de compartir datos crus. “Isto é especialmente útil”, indican, “en situacións onde a privacidade dos datos é unha preocupación e onde non é práctico ou seguro enviar datos a un servidor centralizado”. Por iso, emprégase en ámbitos como a saúde, as finanzas, ou os dispositivos da Internet das Cousas, onde os datos poden ser sensíbeis.
Segundo lembran, aínda que a aprendizaxe federada evita o intercambio dos datos privados, os modelos que se adestran localmente en cada cliente e que se envían a un servidor para que os combine conteñen información desde a que se pode facer inferencia estatística sobre datos privados. Por exemplo, a partir dos modelos de diagnose de cancro que comparte un hospital durante o proceso de adestramento pódese obter información sobre a presencia dun determinado paciente na base de datos. O proxecto TRUMPET pretende protexer os modelos que se comparten para dificultar a inferencia, pero sen menoscabar a utilidade que resulta da combinación dos mesmos. Para elo, emprega técnicas como o procesamento homomórfico que traballan con modelos cifrados.
Sinalan os dous investigadores de atlanTTic que “o cifrado emprégase no noso día a día para protexer os datos que transmitimos por Internet, por exemplo, cando empregamos unha aplicación de mensaxería é habitual que as conversacións estean cifradas de extremo a extremo garantindo a súa privacidade fronte a terceiros”.
Malia a súa utilidade, unha vez os datos están cifrados, a única forma de poder traballar coa información é descifrando previamente”.
O cifrado homomórfico, indican Fernando Pérez e Alberto Pedrouzo, pretende resolver precisamente este problema, xa que permite traballar coa información cifrada sen necesidade de descifrala antes. Así, os hospitais poderían adestrar modelos de diagnose compartindo os seus datos protexidos previamente co cifrado homomórfico e, polo tanto, sen vulnerar a privacidade dos seus pacientes.
A pesar da utilidade desta técnica para compartir e traballar con información cifrada, existen aínda certas limitacións para a súa aplicación práctica dentro da aprendizaxe federada. Por unha banda, a maioría dos esquemas presentan un elevado sobrecusto no momento en que un número grande de entidades colaboran no adestramento. Por outra banda, aínda que esta técnica permite protexer os modelos adestrados localmente fronte a un servidor centralizado, os modelos de diagnose calculados poderían aínda ser susceptíbeis a certos ataques de inferencia.
Para resolver estes e outros problemas, TRUMPET busca combinar os esquemas de cifrado homomórfico con outras técnicas complementarias de protección da privacidade como é, por exemplo, o caso da privacidade diferencial.
Manter a privacidade dos pacientes
O proxecto agárdase que posibilite grandes avances na sociedade e no eido da medicina destacando Fernando Pérez que “a vantaxe fundamental das técnicas que se desenvolven no proxecto é a de permitir que diferentes hospitais, que mesmo poden estar suxeitos a regulamentos diferentes, poidan combinar os resultados da aprendizaxe de modelos, sen chegar a compartir os datos dos seus pacientes. Grazas a iso, pódese acceder a moitos máis datos para o adestramento e, en consecuencia, desenvolver sistemas de detección e diagnóstico de maior confianza. Por enriba, mantendo en todo momento a privacidade”.
Un dos problemas que os investigadores atopan cando desenvolven esquemas de protección da privacidade é poder cuantificala. Explica Fernando Pérez-González que “cando se infire información sobre os pacientes, por exemplo, o resultado non adoita ser absolutamente certeiro, senón que existe unha probabilidade de acertar. Pero aínda que chegar a inferir que unha persoa ten unha probabilidade do 95% de estar nunha base de datos de pacientes con cancro non implica unha certeza absoluta, si que implica unha fuga de información.
“Cuantificar canta información se filtrou cada vez que se comparte un modelo adestrado cunha determinada base de datos, permite coñecer en que medida se pode vulnerar a privacidade. Con todo, non existe unha métrica suficientemente aceptada. No proxecto, estamos a desenvolver unha que é máis práctica que a máis popular na actualidade, coñecida como privacidade diferencial”, salientan os investigadores.
Un proxecto internacional
TRUMPET está enmarcado nun consorcio de nove organizacións entre as que se atopan dous hospitais (Centre Hospitalier Universitaire de Liège, Bélxica, e o Instituto Romagnolo per lo Studio dei Tumori dino Amadori, Italia), tres centros de investigación (Gradiant, España, Commissariat à l’Énergie Atomique et aux Énergies Alternatives, Francia, e Institut National de Recherche en Informatique et en Automatique, Francia), unha universidade (atlanTTic – Universidade de Vigo) e tres pymes (Time.Lex, Bélxica, Technovative Solutions, Reino Unido, e Arteevo Technologies, Israel).
O proxecto acadou durante o seu primeiro ano un fito relevante relacionado coa definición dos requisitos da ferramenta en función das necesidades propostas polos hospitais. Indica Alberto Pedrouzo que “o proxecto está dividido en dúas fases. O obxectivo da primeira fase é producir un primeiro prototipo da ferramenta con menos funcionalidades que se validará en setembro do ano que vén. Os resultados acadados permitirannos detectar e corrixir con suficiente antelación potenciais problemas técnicos para a segunda fase. Nesta segunda fase, que remata en setembro do ano 2025, farase a proba piloto e validación do prototipo final”.

PUBLICIDADE