Google Duplex el “humano” asistente de Alphabet

 google duplex

Google Duplex ha sorprendido a propios y extraños con su capacidad para conversar con las personas de forma natural a través del sistema de inteligencia artificial.

Esa llamada en la que una máquina hablaba con una persona y lo hacía de forma totalmente natural marca un punto de inflexión. Uno en el que la comprensión del lenguaje natural, el aprendizaje profundo y el dictado de textos demuestra por primera vez que puede engañarnos y hacernos pensar que estamos hablando con una persona real. La encargada de la peluquería en ningún momento sospechó que quien la llamaba era una voz sintetizada con entonación humana y con esas mismas pausas y dudas que habitualmente hacemos al hablar los seres humanos. El sistema es el resultado de varios años de trabajo en esos ámbitos.

Como explicaban en el blog de inteligencia artificial de Google, el sistema conversacional de Google Duplex se basa en una Red Neuronal Recurrente (RNN) desarrollada mediante TensorFlow Extended.

Asr

Como ocurre con otros sistemas similares, para lograr esta precisión en su nivel de conversación la red neuronal tuvo que ser entrenada con conversaciones telefónicas anonimizadas. El sistema hace uso de la tecnología ASR (Automatic Speech Recognition) de Google y analiza distintos parámetros para lograr diferenciar el contexto y entender qué le está diciendo el interlocutor. Hasta es capaz de entender cuándo está siendo interrumpido y para qué:

Para lograr que esa voz suene natural se usa el sistema de dictado (Text to Speech, TTS) usando Tacotron y WaveNet para controlar la entonación. Lo más interesante aquí es la introducción de las llamadas ‘speech dysfluencies‘, esas pausas en forma de ‘ahm’ y ‘uhm’ que son comunes entre los seres humanos al expresarse y que hacían que la voz sintetizada fuera aún más convincente a la hora de parecer humana.

El sistema es capaz de mantener conversaciones de forma “totalmente autónoma, sin intervención humana”, explican en Google, aunque también integra un sistema de monitorización que avisa a un operador humano de que cierta tarea no ha podido ser completada. Google Duplex está pensado para reservas de servicios, algo que reduce el contexto de preguntas y respuestas y que lo acota para hacer todo más manejable.

Sin embargo Google Duplex abre un debate ético en redes sociales respecto   a un sistema que desde luego lograba resolver la tarea, pero por medio del engaño, sea este más o menos inocuo. Además se habla de la privacidad de esas conversaciones utilizadas para entrenar al sistema. Es probable que Google Duplex registre toda la conversación, la grabe y la analice (previa anonimización) para “mejorar el servicio”, como suelen avisar todos estos sistemas. Sin embargo las suspicacias sobre lo que se pueden hacer con todas esas grabaciones son evidentes. Aquí Alphabet debe ser también transparente sobre qué se guarda, cómo se guarda y durante cuánto tiempo.

Y por último está el problema de los malos usos. Será difícil controlar como siempre que una herramienta se utilice de mala forma y de hecho eso no debería frenar esa evolución tecnológica —hacerlo sería un error—, pero si Google implanta esta tecnología, será importante saber cómo nos protege de usos fraudulentos que podrían automatizar por ejemplo llamadas de telemarketing engañosas

C.

Deja un comentario