parentesis.com/

Inteligencia de Google lee los labios mejor que los humanos


El programa tiene casi 50% de efectividad, un 38% más que los expertos.

por: Juan Martín M. Juan Martín M.

portada de nota

Investigadores de la división DeepMind de Google, en colaboración con la Universidad de Oxford, desarrollaron el software de lectura de labios más preciso hasta el momento. 

 

Los científicos entrenaron una red neural utilizando miles de horas de exposición a programas de televisión, la cual obtuvo resultados del 46.8% de precisión.

 

En un primer momento, esto podría no parecer tan impresionante (si lo comparamos con software utilizado para transcribir audio), sin embargo, los resultados obtenidos por un humano experto en leer labios utilizando las mismas imágenes, no sobrepasan el 12.4%.


Este mes, se realizó un trabajo similar en la Universidad de Oxford. En esta investigación, los científicos crearon un programa para leer los labios llamado LipNet, el cual acertaba el 93.4% (los humanos, 52.3%).

 

Sin embargo, el software fue probado con videos especialmente diseñados, en los que aparecían voluntarios formulando oraciones sencillas.

 

Por otro lado, la inteligencia artificial de Google se probó con imágenes más complejas, como las conversaciones de programas de política de la BBC. Los clips utilizados incluían 118 mil oraciones diferentes.


Los científicos mencionan que este programa puede tener múltiples aplicaciones, como ayudar a las personas con debilidad auditiva a comprender conversaciones, transcribir películas mudas o permitir a usuarios de asistentes digitales tener control con sólo hacer un gesto.

 

Nota relacionada: La inteligencia artificial ahora puede programar tu día

Comenta:

separador de nota