Científicos del MIT en colaboración con Microsoft y Adobe han desarrollado un algoritmo capaz de extraer audio inteligible de las vibraciones de objetos a través de un vídeo. Las películas de espías cada vez se acercan más a la realidad.
Debo reconocer que las películas de espías me gustan por una cosa en particular: los gadgets. Ni la trama, ni los coches, ni las persecuciones, ni siquiera las chicas me atraen en esos films, yo, y muchos como yo, vemos las películas por conocer los últimos aparatos modernos que usan nuestros agentes favoritos.
El equipo lo componen dos profesores del MIT, un investigador de Microsoft y otro de Adobe
Míticos son los inventos que usa James Bond en sus películas donde utiliza teléfonos móviles para conducir un coche a distancia, ríete tú del que se conduce solo ahora, o los cacharros de última generación de Misión Imposible. Aparatos de última generación que aún estaban por llegar al mercado y que poco se acercaban a la electrónica de consumo. Aunque era divertidísimo verlos en pantalla.
En este marco de invenciones made in Hollywood se encontraría lo que acaban de desarrollar científicos del MIT en conjunción con Microsoft y Adobe: un algoritmo capaz de reconstruir audio a partir de las vibraciones de un objeto en un vídeo. En otras palabras, ya es posible hacer escuchas sin un micrófono, tan sólo con una cámara de vídeo.
Uno de los experimentos que han llevado al desarrollo de este algoritmo se han llevado a cabo consistía en recuperar el audio gracias a las vibraciones de una bolsa de patatas fritas que estaba siendo grabada desde más de 5 metros de distancia a través de un cristal insonoro. También se ha recuperado audio de papel de aluminio, la superficie de un vaso de agua e incluso las hojas de una planta. Los resultados se presentarán en la Siggraph, un conferencia sobre gráficos de ordenador.
Se usaron cámaras ultrarápidas que capturan entre 2.000 y 6.000 frames por segundo
Tal y como se puede leer en la web MIT News, los científicos se basan en la teoría de que el sonido, al golpear una superficie, causa vibraciones en éste. El movimiento de estas vibraciones crea una señal visual muy sutil, imperceptible al ojo humano y que es la base sobre la que trabaja el algoritmo para recuperar el audio.
De este modo, la ciencia ha sido capaz de llegar a lo que se planteaba en la película "La conspiración del pánico" (Eagle Eye) dónde en las escenas finales un ordenador era capaz de descifrar el audio de una sala totalmente insonorizada gracias a las vibraciones que se producían en un vaso de agua. Algo que parecía descabellado hace tan solo unos años, es posible a partir de ahora.
Continúar leyendo...