Un proyecto pionero en Valencia ha conseguido reproducir la voz real, no robótica, de un enfermo de ELA. Se llama Fran Vivó y es un bombero forestal valenciano de 36 años que sufre esta enfermedad desde 2019.
Un proyecto pionero de inteligencia artificial (IA) en el que participa la Universitat Politécnica de València (UPV) rescata la voz de un enfermo de Esclerosis Lateral Amiotrófica (ELA) para personalizar la comunicación con sus allegados. Este avance ha sido probado con éxito para comunicarse en castellano y en valenciano en un paciente de 36 años, Fran Vivó, de Benaguasil (Valencia), que era bombero forestal cuando en 2019 le diagnosticaron ELA y dos años después perdió la voz a causa de un a traqueotomía relacionada con la enfermedad.
El director del trabajo es Jordi Linares, miembro de la Unidad Mixta de Investigación de Valencian Graduate School and Research Network of Artificial Inteligence (ValgrAI) y del Instituto Universitario Valenciano de Investigación en Inteligencia Artificial (VRAIN) de la UPV, cuyo trabajo ha tratado de demostrar el poder humanizador de la IA y la necesidad de dar visibilidad a este colectivo.
El proyecto ha logrado reconstruir la voz de Fran Vivó para conseguir que cuando su voz se apaga por el avance de la ELA, pueda volver a sonar como si fuera su voz natural y no robótica, lo que supone un paso más con respecto a los sistemas de comunicación que hay hasta ahora, más impersonales. Este proyecto llegó a ValgrAI de la mano del documentalista Alex Badia y a través de la investigadora Gema Piñero, del Instituto iTEAM de la UPV, y el equipo afrontó el gran reto de reconstruir la voz de Fran Vivó con apenas 20 minutos de audio en castellano y valenciano, su lengua natal, recuperados de mensajes sonoros de WhatsApp.
Con redes neuronales entrenadas para trabajar con corpus limitados —especialmente en valenciano, donde apenas existen recursos— los investigadores analizaron su dinámica vocal, incorporaron modulaciones emocionales y crearon un modelo adaptativo, todo con el objetivo de ofrecer un lenguaje lleno de los rasgos humanos de Fran y con su entonación en lugar de una voz robótica. Se da la circunstancia de que los audio de Fran eran escasos puesto que perdió la capacidad del habla cuando apenas comenzaba a usarse este sistema en esta aplicación de mensajería.
En este proceso, la familia ha jugado un papel fundamental puesto que ha ayudado en el proceso de construcción del habla y ha posibilitado ajustar la carga emocional, la entonación o la intención del mensaje mediante un editor que respeta la identidad sonora de Fran. Este proyecto no sólo ha permitido a Fran Vivó recuperar su identidad sino que abre un abanico de posibilidades a todos los enfermos de ELA, ya que podría ayudarles a recuperar su voz y a tener esperanza en la vida, como el propio Fran reconoce.
El grupo VertexLit, que ha realizado este proyecto de manera totalmente altruista, pretende mostrar el potencial humanizador de la IA, puesto que ésta puede devolver capacidades perdidas y dignificar la vida de personas que viven situaciones extremas. Linares ha afirmado que con el proyecto buscan dar visibilidad a las personas afectadas por la ELA puesto que esta enfermedad continúa siendo invisible en la conversación social y mediática, a pesar del sufrimiento inmenso que provoca en pacientes y familias, de manera que “esta voz no solo es para Fran" sino "para todos ellos“.
Por su parte, el responsable de VRAIN y de ValgrAI de la UPV, Vicent Botti, ha sostenido que “no se trata de un experimento ni una demostración" y que responde al reto de que "la ciencia y la tecnología deben ponerse al servicio de quienes más apoyo necesitan" "Del mismo modo que Fran ha vuelto a hablar, miles de voces también lo podrán hacer”, ha agregado.
La presentación de este avance ha tenido lugar en el marco de unas jornadas del VRAIN donde científicos de los diferentes grupos de este instituto han expuesto otros avances en inteligencia artificial en campos como la subtitulación automática, la detección y extracción de reseñas de la web, la detección automatizada de microplásticos y la seguridad en las interacciones de entornos virtuales e híbridos.