Para el creador de las gafas EchoSpeech “las pantallas en la cabeza serán tendencia en el futuro”

Para el creador de las gafas EchoSpeech “las pantallas en la cabeza serán tendencia en el futuro”

“Con tecnologías avanzadas y problemas de privacidad resueltos, estimo que serán ampliamente aceptadas”, dice Ruidong Zhang, el investigador detrás de este desarrollo que se muestra al mundo desde Nueva York.

 

Los anteojos inteligentes llevan más de una década intentando conquistar al mercado. Desde Google Glass hasta la fecha, vimos a un puñado de smartglasses con suerte siempre esquiva. Ruidong Zhang, un investigador de la Universidad de Cornell, confía en la viabilidad de esos dispositivos. “Creo que las gafas y las pantallas que se llevan en la cabeza serán tendencias en las interacciones del futuro. Con tecnologías avanzadas y problemas de privacidad resueltos, estimo que serán ampliamente aceptadas”, comenta en diálogo con TN Tecno.

EchoSpeech, así se llama el ingenio en el que trabaja Zhang, se destaca por su capacidad para reconocer gestos faciales que sirven para controlar el celular. Además, el sistema ofrecerá otros usos, por ejemplo que personas con problemas del habla se comuniquen mediante voces sintéticas. El especialista de la universidad neoyorkina lo describe como un equipo de “reconocimiento silencioso”.

– ¿Cómo surgió la idea para desarrollar estas gafas?

– Siempre me interesó el reconocimiento de voz silencioso. En investigaciones previas nos dimos cuenta del gran potencial que tienen esas interfaces gracias a su naturaleza mínimamente obstructiva, de bajo consumo, que preserva la privacidad y rendimiento.

Sin embargo, pasamos bastante tiempo tratando de encontrar una configuración confiable: probamos auriculares, ganchos para las orejas y múltiples posiciones en el marco de vidrio. Durante este proceso profundizamos nuestra comprensión de que la señal no tiene que viajar en línea recta, fue entonces cuando finalmente encontramos la configuración actual.

– ¿Por qué creés que este tipo de dispositivos, las gafas smart, aún no seducen al gran público?

– Creo que Google Glass se adelantó a su tiempo (NdR: se presentaron en el año 2012). Propuso un gran concepto, pero no respondió algunas preguntas importantes que preocupan a los usuarios, como la privacidad. Además, muchas de esas tecnologías no estaban maduras en ese momento, por ejemplo, sus pantallas y baterías.

– ¿Qué funciones diferenciales ofrece EchoSpeech en comparación con otras gafas inteligentes que conocemos?

– Hasta donde sabemos, EchoSpeech es el primer anteojo con capacidades de reconocimiento de voz silencioso. El habla silenciosa puede ser una idea relativamente nueva para el público, pero creemos que tiene un gran potencial.

 En la práctica, ¿cómo funcionan?

– Básicamente, pusimos altavoces y micrófonos en el marco de cristal. Los parlantes emiten ondas de sonido que viajan por la cara antes de llegar a los micrófonos. Cualquier cosa que se mueva a lo largo de la ruta de la señal afectará la forma en que viaja la señal. Cuando las personas “hablan en silencio”, todavía mueven los labios. Al analizar la señal final que llega a los micrófonos, podemos inferir inversamente qué movimientos pueden causar tales patrones y, por lo tanto, inferir el contenido del habla silenciosa.

Esto es algo similar a poner una linterna delante de la mano, proyectará una sombra de la mano en la pared. Mirando la sombra podemos de alguna manera inferir qué gesto está realizando la mano. De esta forma, es posible configurar ciertos gestos o movimientos de la cara para hacer ciertas cosas.

– ¿Es posible comparar la tecnología que utilizan con la forma en la que los murciélagos reconocen objetos en su camino?

– Hay algunas similitudes, sí. Estamos moviendo el sonar hacia la cara, pero nuestro sonar es más sutil. No solo trata de identificar las orientaciones y distancias de los objetos, sino también cómo los objetos (específicamente, la piel del rostro, los labios) realizan movimientos leves.

– ¿EchoSpeech puede usarse para controlar otros dispositivos, además del celular?

– Por supuesto, se puede utilizar para controlar otros equipos. Actualmente, implementamos el modelo de inferencia en un teléfono inteligente. Sin embargo, no anticipamos ningún problema al implementarlos en otros dispositivos con capacidades computacionales similares. Con los avances recientes en el aprendizaje profundo integrado, incluso es posible implementar todo el sistema en el marco de vidrio sin usar ningún teléfono inteligente.

– ¿Cuáles son los posibles usos de estos para personas con dificultades del habla? ¿Cómo ayudaría, en esos casos?

– Nos interesa por mejorar la accesibilidad. El habla silenciosa puede ser una buena alternativa al habla con voz, especialmente para las personas que tienen dificultades para vocalizar los sonidos. Por otro lado, estamos trabajando activamente en otro proyecto que trata de sintetizar voces a partir del movimiento de los labios para devolverle la voz a la gente. Esto proporcionará una voz personal para las personas con dificultades del habla.

Zhang se muestra entusiasmado con los próximos pasos de su invento. Nos cuenta que luego de la divulgación, este mismo mes, su equipo recibió consultas de pacientes, médicos y posibles inversores, deseosos de convertir el prototipo que vemos en las imágenes en un producto disponible en el mercado.

Creemos que EchoSpeech puede marcar una gran diferencia en la vida de las personas y estamos trabajando para hacerlo posible”, comenta el investigador y señala que pretenden que el sistema sea más compacto, de menor consumo y que tenga un vocabulario más amplio. “El objetivo es hacer que las interfaces de voz silenciosa sean más maduras y utilizables; si esto tiene éxito, será otro paso hacia la aplicación a gran escala”, cierra.

Fuente: TN.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *