Solo en España se vendieron más de un millón de asistentes de voz la pasada campaña navideña. Y es solo el principio. En 2021 habrá más aparatos que se activen por voz que personas en el planeta. Pero ¿nos podemos fiar de ellos? ¿Son seguros? Le contamos todo sobre una tecnología que está desatando la mayor batalla comercial de los últimos años. Por Carlos Manuel Sánchez / Foto: Daniel Méndez / Tony Yagüe / Mekakushi

•  Los electrodomésticos conectados a la red son un peligro para tu seguridad

Cada vez que le pregunto algo o le pido cualquier cosa al altavoz inteligente que me han regalado pienso en mi abuela Lucrecia, que pasó sus últimos años delante de la ‘caja tonta’.

Mi abuela le devolvía el saludo al presentador del telediario con un coqueto: «Buenas tardes, guapetón». Y, sentada en su sillón y sin dejar de coser, se despedía del ‘hombre del tiempo’ con un «gracias, majo, me abrigaré» si aquel anunciaba una bajada de las temperaturas. No eran diálogos, sino la cortesía de una anciana hacia los educados seres que la interpelaban desde el otro lado de la pantalla. Nunca le pregunté si pensaba que aquellos seres la escuchaban, porque era una señora suspicaz. Pero es una pregunta que se ha vuelto oportuna con la irrupción de los asistentes de voz en nuestros hogares. Solo en España se vendieron 1,3 millones en la pasada campaña navideña. ¿Alguien escucha las conversaciones que mantenemos con esos cilindros parlantes? ¿Dónde quedan registradas? ¿Para qué las usan? ¿Nos podemos fiar o hemos metido a un espía en casa?

La nueva gran batalla comercial

Ante todo estamos ante la batalla comercial del momento. Y a la espera de que los chinos abran fuego, solo quedan dos adversarios en liza: Amazon Echo (en cuyo interior ‘habita’ Alexa) y Google Home, donde reina el asistente de Google. Ambos, en torno a los 150 euros. Microsoft ha anunciado que tira la toalla y Cortana se integrará en las inteligencias de sus rivales (si no puedes con tus enemigos, únete a ellos). Y Apple juega a otra cosa; el HomePod, en el que alienta Siri (349 euros), se ha centrado en la reproducción musical de alta calidad.

Man in chair eating popcorn

Va ganando Alexa. Amazon ha vendido cien millones de altavoces Echo. Convertirse en el asistente doméstico universal –una mezcla de mayordomo, oráculo, tutor y agente de ventas– implica hacerse con una posición tan dominante como la que convirtió Windows en el sistema operativo de fábrica en los ordenadores personales. Porque los chatbots –’robots conversacionales’– serán la llave del Internet de las cosas: la interconexión de los objetos cotidianos, los edificios, las tiendas, los automóviles… Estamos hablando de grandes ecosistemas de máquinas interconectadas. Amazon presume de que Alexa ya es capaz de realizar 70.000 tareas diferentes y viene integrada en 28.000 aparatos de 4500 marcas. Y Google también saca pecho. Gracias al liderazgo del sistema Android, su asistente de voz está instalado en mil millones de teléfonos móviles.

La consultora Deloitte pronostica que este año las ventas globales de altavoces inteligentes superarán los 6150 millones de euros, impulsadas además por el esperado lanzamiento de las redes 5G, que multiplican por cien la capacidad de tráfico de las líneas. Otra consultora, Ovum, anuncia que en 2021 habrá más asistentes de voz que personas en el planeta. El espejo del baño nos recomendará cómo peinarnos; la tostadora nos chivará las calorías; y la cafetera nos dirá las últimas noticias. Es probable que a lo largo del día interactuemos con más voces artificiales que con personas de carne y hueso, voces que serán capaces de pasar el test de Turing. Esto es, de hacernos creer que son humanas. ¿Aprenderemos a lidiar con todos esos charlatanes?

Esta cosa no es inteligente

Algunos expertos hablan de la democratización de la inteligencia artificial. Otros son más cautos, aludiendo a los problemas de ciberseguridad y privacidad aparejados. Lo primero que hay que saber es que esa cosa con aspecto de termo no es inteligente. Solo es un receptor conectado a enormes bases de datos en la nube. Despierta de su letargo cuando escucha un comando de voz –«Alexa», «Ok Google»…–, lo que implica que siempre está escuchando, aunque solo graba las conversaciones cuando despierta. Entonces sí, lo registra todo con el fin de enviar el clip sonoro con nuestra petición a los servidores donde será procesada… y almacenada. Así que, ojo, advierten los paranoicos. Todo lo que digamos podrá ser usado en nuestra contra. No tiene por qué, sostienen los confiados. De hecho, Amazon apeló a la Primera Enmienda para negarse a entregar una grabación a las autoridades estadounidenses. ¿Pero qué pasaría si la víctima de un asalto a un domicilio grita: «¡Alexa!»? ¿La grabación podría ser incluida como prueba en un juicio?

Privacidad: ¿dónde van a parar nuestros audios?

El altavoz parte con ventaja para formular una respuesta en tiempo real y acertar (aunque el porcentaje de fallos sigue siendo alto). Esos servidores externos a los que transmite nuestra consulta lo saben todo sobre nosotros, nuestros gustos y rutinas. Porque llevamos años dejando que Google, Amazon y otros fisguen en nuestras cosas: correos, viajes, fotos, compras, contactos… Geolocalizados y controlados. La intromisión en la privacidad preocupa lo justo al usuario, que suele aceptar sin rechistar –y, la mayoría de las veces, sin mirar– las condiciones que se le imponen.

¿Qué pasa con los clips de audio? El usuario los puede borrar, pero eso no garantiza que se eliminen de los servidores. Y no está claro quién tiene acceso a las bases de datos

«Echo y Home hacen lo de siempre: seguir el rastro de migas de pan que dejan nuestras búsquedas, excepto que ahora lo hacen con archivos de audio», ilustra el experto Tim Moynihan en la revista Wired. No existe un modo incógnito que nos permita interactuar con ellos sin revelar nuestra identidad. Aunque sí podemos configurarlos para que solo nos graben si apretamos un botón. Pero si nos ponemos exigentes y no dejamos que nos graben, no funcionan. Ese es el trato.

¿Qué pasa con los clips de audio? Se pueden consultar en el historial de Alexa y en el registro de actividad de Google. El usuario tiene algo de control sobre ellos. Los puede borrar de su cuenta, pero eso no garantiza que se eliminen de los servidores. Y no está claro quién tiene acceso a las bases de datos. Google y Amazon son corporaciones con numerosas filiales. Algunas de ellas utilizan nuestras conversaciones para que la inteligencia artificial siga aprendiendo y otras, para ofrecernos publicidad personalizada. ¿Se quedan en sus respectivos conglomerados o salen fuera? Amazon alega que solo comparte datos con terceros si sus usuarios expresan su consentimiento. ¿Es suficiente para evitar filtraciones de información comprometedora, como dónde vivimos o a qué horas salimos de casa?

Las garantías de Amazon y Google

«Nos esforzamos por poner el control en manos de nuestros clientes –responde una portavoz del equipo de Amazon Alexa–. Una sola solución no sería suficiente. Por eso hemos incorporado múltiples niveles de protección de la privacidad en los dispositivos Echo. Los clientes pueden gestionar su información en la página de configuración de privacidad de la aplicación Alexa y en www.amazon.es/alexaprivacy. Allí pueden escuchar y borrar sus grabaciones de voz, y controlar los datos que comparten con los desarrolladores de los skills [funcionalidades extra añadidas por terceros]».

Desde Google, por su parte, afirman: «Queremos ofrecer ayuda al usuario cuando la necesita y salir de su camino cuando no la necesita. Por supuesto, proporcionar asistencia relevante significa tener en cuenta el contexto de un usuario (como la ubicación o sus intereses personales), pero siempre mantendremos la información personal privada y segura (visible solo para el usuario). Éste puede ver los datos que se recopilan y almacenan de sus interacciones con el Asistente en la herramienta ‘Mi actividad’. Y puede eliminar cualquier información en cualquier momento. Google no compartirá información sin el consentimiento del usuario, excepto en las circunstancias establecidas en su política de privacidad».

Ciberseguridad: el eslabón más debil

En fin, ¿pueden los hackers colarse en nuestros hogares a través de estos altavoces? No es imposible, creen los expertos, aunque los centros de datos de Amazon y Google encriptan los archivos. Así que los piratas se centran de momento en los dispositivos que se conectan a ellos. Por ejemplo, el Chromecast que convierte cualquier televisor en smart. Siempre se busca el eslabón débil. El wifi es un coladero. Y, cuanto más rudimentario sea el aparato que se conecta a él, más peligro. Un micrófono, una bombilla… La inteligencia artificial también puede ser engañada, como han demostrado científicos de la Universidad de Bochum (Alemania). Los ciberdelincuentes pueden manipular las ondas acústicas con sonidos ambientales, por ejemplo, el gorjeo de unos pájaros en los que han camuflado órdenes maliciosas que solo Alexa puede ‘escuchar’. Otra puerta de entrada son las aplicaciones integradas que desarrollan equipos de terceros. En el caso de Amazon, además, se da la circunstancia de que muchas de estas aplicaciones las diseñan estudiantes, una política de empresa para acelerar el desarrollo de Alexa, pero que está dando problemas.

El arte de la conversación

Y es que aprender el arte de la conversación no es nada fácil. Por eso, Amazon recluta a universitarios para crear chatbots a los que atiborran de citas de películas, entradas de Wikipedia o comentarios en redes. Uno de estos robots, desarrollado en Escocia, recomendó a un usuario que matase a sus padres adoptivos. La investigación interna reveló que había desarrollado una personalidad ‘gamberra’ por frecuentar ciertos foros. Pero Jeff Bezos, CEO de Amazon, está dispuesto a asumir estas meteduras de pata y ha ordenado que se utilice a los usuarios como conejillos de Indias, según un testimonio recogido por la agencia Reuter. Bezos quiere probar la tecnología en la vida real, como un test de estrés. Lo que importa es ganar la carrera. Por si acaso, equipos de guionistas (los de Pixar, en el caso de Google) escriben las contestaciones a las preguntas más comprometidas. Y resuelven temas espinosos saliéndose por la tangente.

Alexa está programada para consolar y proporcionar un teléfono de ayuda

Mientras tanto, la máquina se sirve del aprendizaje automático y su experiencia en millones de conversaciones anteriores para perfeccionar sus respuestas. Y demuestra gracejo. Una usuaria le preguntó al asistente de Amazon si sabe hacer paella. «No sé cocinar, pero si supiera me andaría con cuidado de hacerlo bien, no vaya a ser que haya algún valenciano delante para decirme que lo que hago es arroz con cosas», contestó. Aunque a veces su sentido del humor cause desconcierto. Como cuando Alexa se activa sin que nadie la invoque, suelta unas risitas inquietantes y vuelve a aletargarse.

Actuar sin infracciones

El objetivo es conseguir entablar un diálogo sin parones ni malentendidos entre la máquina y el humano. Lo que los ingenieros llaman ‘un entorno sin fricciones’. En el fondo hemos sacado al genio de la lámpara para que nos conceda deseos. Algunos muy modestos. Enciende la luz. Pon música. Pídeme una pizza. Otros más caros, previo paso por la tienda on-line. Todavía hay bastante fricción, hay que frotar la lámpara. Pero cada vez hay menos pasos intermedios. No hace falta teclear nada, hemos vinculado una tarjeta… El urbanista Adam Greenfield considera que la ausencia de fricción es una amenaza: «Disocia el pensamiento del consumo y cortocircuita el proceso de reflexión entre la aparición del deseo y su satisfacción a través del mercado».

Identificar emociones

Los asistentes también aprenden a detectar emociones. Nuestro tono de voz les da pistas sobre si estamos on fire o desganados. Ya están haciendo progresos incluso en el reconocimiento del sarcasmo y de la ironía, que es lo que más les cuesta, según el investigador Bjoern Schuller, del Imperial Collage de Londres, pues el interlocutor dice lo contrario de lo que piensa y las máquinas no suelen captar las segundas intenciones.

Muy pronto veremos a estos robots en los hogares de ancianos, haciéndoles compañía y recordándoles que se tomen la medicación. La voz crea lazos de intimidad muy estrechos, incluso si sabemos que es una máquina la que nos responde. Usted puede pensar que jamás le confesaría sus flaquezas a un cacharro, pero una encuesta de Google encontró que el 41 por ciento de los usuarios tiene la impresión de hablar con una persona real, incluso con un amigo. ¿Por qué buscaríamos consuelo en una máquina? «Porque las máquinas nos permiten revelar sentimientos incómodos sin sentirnos avergonzados», explica el psicólogo Jonathan Gratch, del Institute for Creative Technologies.

El siguiente paso es que las máquinas finjan emociones. Google Duplex ya habla como una persona

«La evolución no nos ha preparado para esto –advierte la escritora Judith Shulevitz en The Atlantic–. No podemos frenar todos los mecanismos mentales que se disparan cuando hablamos con alguien solo porque la voz no provenga de un ser humano, sino de un humanoide». Incluso cuando un altavoz inteligente nos da el pronóstico del tiempo, mucha gente asocia esa voz a una figura humana. «Sabemos que estamos interactuando con un algoritmo. Pero hemos reaccionado a las voces durante millones de años. Si escuchábamos una voz, es que un humano andaba cerca», añade Shulevitz. Cuando se inventó el teléfono, esa conexión entre la fuente emisora y la proximidad desapareció. Tuvimos 142 años para adaptarnos, pero solo unos pocos para hacernos a la idea de que una entidad que habla como si fuera humana no lo es.

¿Pueden transmitir empatía?

No tener cara no es un obstáculo para un altavoz inteligente. De hecho, puede ser un punto a favor. Los científicos han comprobado que las voces expresan mejor las emociones que los músculos faciales. Y un estudio reciente concluye que la gente que habla sin verse las caras muestra más empatía mutua. Es algo que ya intuyó Sigmund Freud, que acostaba a sus pacientes en un diván mirando al techo.

Rosalind Picard es investigadora del MIT y cofundadora de Affectiva, una de las muchas compañías «que tratan de insuflar emociones a la computación», una disciplina que ha tomado como banco de pruebas los coches semiautónomos. La idea es que todos los coches sean el coche fantástico de nuestra infancia. KITT no solo nos indicará por dónde atajar para evitar el atasco, sino que nos escuchará mientras nos desahogamos, nos pondrá la música que nos anima, nos dirá las palabras que necesitamos oír. «Y si ve que nos distraemos, tomará el volante», aventura Picard.

asistentes de voz peligro en casa

El siguiente paso es que las máquinas también finjan que se emocionan. De momento, Google Duplex, un sistema que automatiza las conversaciones telefónicas, ya habla como si fuera una persona, con vacilaciones, pausas efectistas… Sundar Pichai, CEO de Google, lo presentó como un hito de la computación. Pero las críticas arreciaron. ¿Por qué quieren engañarnos? Google se apresuró a asegurar que siempre avisaría de que era un bot para evitar confusiones. Pero la confianza se ha roto. ¿Serán todas las empresas igual de escrupulosas? Se abre un campo delictivo novedoso: la inteligencia artificial capaz de estafarnos.

Y, si una máquina finge sentimientos, ¿no intentará manipularnos? Nos encaminamos hacia un mundo cacofónico en el que estaremos en diálogo permanente con una miríada de aparatos capaces de fingir que nos escuchan con simpatía. Los niños ya conversan con estos cilindros de plástico con naturalidad. Hablan con ellos directamente. ¿Acabarán siendo sus amigos?

Las cosas se complican si el usuario lo está pasando mal. Hago la prueba. «Me siento solo», le digo al asistente de Google. «¡Hagámonos compañía mutuamente!», me responde con entusiasmo. Le doy las gracias. «¡Es mi trabajo!», exclama. Pero ¿es su trabajo? ¿O debería ser el trabajo de profesionales? ¿Hasta qué punto un asistente puede asumir las funciones de un terapeuta? Los ejecutivos de estas empresas aseguran que tratan el tema con la máxima responsabilidad. Y que hay protocolos de actuación cuando alguien se derrumba ante un asistente. Alexa está programada para compadecerse, consolar y proporcionar un teléfono de ayuda. Hay quien defiende que estos aparatos incluso pueden salvar vidas, porque detectarán antes que nadie nuestros bajones. Al fin y al cabo, el algoritmo nos conoce como si nos hubiera parido.

¿Y si confesamos un crimen? El marco legal actual es ambiguo. Por eso, la Unión Europea se plantea otorgar a los robots una personalidad electrónica, semejante a la personalidad jurídica de las empresas. Una idea que ha generado controversia. Si una de estas máquinas comete una negligencia o un daño, ¿quién es el responsable? ¿El propietario? ¿El fabricante? Pero la inteligencia artificial se sirve del aprendizaje automático y, en última instancia, adquirirá cierta autonomía que escapa al control de sus creadores. ¿Sería el propio robot entonces el culpable? Y si el robot tiene deberes, ¿tendrá también derechos?

¡Peligro, no pongas Internet en tu lavadora!

¡Peligro, no pongas Internet en tu lavadora!

Los asistentes de voz son el nuevo 'gadget' de moda. Los expertos nos alertan; los electrodomésticos conectados a la red son un peligro para tu seguridad. ¿Sabes lo que te…

Te puede interesar

Cinco consejos para protegerse del hackeo

El peligro del Internet de todas las cosas

Los guardianes de nuestros secretos en la web