sábado, 23 de marzo de 2024

El salto evolutivo que hará que los robots se conviertan en seres vivos

 

Imagen generada con inteligencia artificial o real? (Artgrid)


No importa la apariencia que tenga un robot para que nos creamos que es un ser vivo. Será la voz y la velocidad de interacción con los humanos lo que lo cambiará todo.


Incluso antes que el escritor checo Karel Capek acuñase el término ‘robot’ en su novela de 1920 R.U.R., los humanos hemos estado obsesionados con la idea de crear vida a partir de objetos inanimados. Desde los antiguos golems y el mítico hombre de bronce que defendió Creta contra los piratas en el año 400 antes de Cristo hasta los Gundams de Yoshiyuki Tomino y el C-3PO de George Lucas, nuestras historias a menudo han contado con seres de metal, arcilla o protoplasma que estaban tan vivos como nosotros. El otro día, al ver el vídeo del robot Figure 01 —equipado con un cerebro ChatGPT— charlando con una persona, me pareció muy claro que la humanidad está a punto de cumplir el sueño de convertirse en dioses. Sólo falta un elemento obvio pero que no llega.

Ese elemento no es la inteligencia artificial general (AGI en sus siglas en inglés). Lógicamente, tener una mente AGI capaz de comprender y adaptarse al mundo físico será clave para destilar la vida sintética que buscamos igual que los mosquitos vuelan hacia la luz azul de un aparato insecticida en una húmeda noche de verano.

Tampoco es la apariencia humana. Sí, eventualmente llegaremos al punto en el que podremos crear 'replicantes' perfectos como en Blade Runner o Westworld. Serán indistinguibles de los humanos y probablemente se convertirán en nuestros compañeros, exploradores interestelares, amigos y hasta amantes. Probablemente, de hecho, serán el siguiente paso en la evolución humana, perfecta e inmortal.

 

Pero todo eso no importa ahora mismo.

En el vídeo publicado por Figure —la empresa fundada por Brett Adcock, con el respaldo financiero de OpenAI, Nvidia, Microsoft, Intel Jeff Bezos— un robot que no tiene AGI ni apariencia humana me hace pensar, por unos breves segundos, que está vivo. Charla con un hombre, le da una manzana, limpia la basura mientras explica a esa persona por qué le dio la fruta, luego procede a poner orden en el mostrador, colocando un vaso y un plato en una bandeja de secado.

Destellos de vida

Durante esos breves segundos en los que habla, la voz y la interacción parecen tan reales que pensé que tal vez se trataba de uno de esos bailes y acrobacias precoreografiadas que hace Boston Dynamics con su robot Atlas. Escuchando la naturalidad de su voz y sus dudas guturales, llegué a pensar que tal vez era en realidad había un humano hablando detrás de la cámara. Pero no. Es real y, en esos momentos en que Figura 01 se expresa, me creí que él es un ser real.

No importa que no tenga un cerebro capaz de comprender todo lo que pasa a su alrededor. Tampoco que no parezca un ser humano en absoluto, sin ojos, sin piel, sin cabello, sin nada de lo que nuestro cerebro identifica visualmente como un miembro de nuestra propia especie. Durante esos breves segundos, el robot rompió la barrera racional y conecté emocionalmente como me conectaría con cualquier otra persona.

Pero la breve ilusión se rompió con las largas pausas entre respuestas. Fue entonces cuando me di cuenta de que ya tenemos todo lo que necesitamos para crear un robot que pueda conectarse con nosotros de la misma manera que seres artificiales de ciencia ficción como HAL 9000, Terminator o Bender B. Rodríguez pueden provocar miedo, compasión, comprensión y risa como cualquier otro ser humano puede hacerlo. Es la velocidad, el ritmo. Eso es lo que nos falta ahora. Ya tenemos todo lo demás que necesitamos y el vídeo lo demuestra.

A lo largo de millones de años de evolución, nuestro cerebro se ha formado para esperar una respuesta de los seres vivos que nos rodean. De hecho, esto es parte de una expectativa arraigada en nuestra estructura cerebral que influye directamente en nuestra percepción del mundo. Si falla, si no hay respuesta a nuestras palabras y empujones, automáticamente pensamos que algo va mal. Por ese motivo, si mantenemos una conversación y no obtenemos una respuesta instantánea (que no tiene que ser verbal, pero sí instantánea), nuestro cerebro simplemente no puede aceptarlo como real. No importa si la respuesta que viene después de la pausa sean las palabras más inteligentes, bonitas o graciosas que alguien haya dicho jamás. Simplemente la ilusión fracasa, como ocurre en la comedia, donde el tempo es quizás más importante que en cualquier otra forma de comunicación.

La velocidad y el tempo son las razones clave por las que vemos los videos acrobáticos del robot Atlas de Boston Dynamics y todos exclamamos “¡parece un humano!” Lo mismo ocurre con las respuestas de HAL 9000. Su flujo natural y el ritmo de la conversación es lo que lo hace tan amenazador como un sociópata 100% humano en 2001: Una odisea en el espacio. Lo mismo que C-3PO es insoportable para Han Solo en Star Wars. O Rachael hace que Deckard se enamore de él en la película de Ridley Scott basada en la novela de Philip K. Dick ‘¿Sueñan los androides con ovejas eléctricas?’ Claro que ahí el robot funciona porque todo está perfectamente guionizado, coreografiado en el caso de Atlas e interpretado por humanos en películas y series de ciencia ficción.

Aquí, en el mundo real, la próxima gran barrera no es conseguir una IA más inteligente o una apariencia humana, sino conseguir la velocidad adecuada para que nuestras conversaciones sean naturales. Quizás la mejor prueba de ello sea la creciente popularidad de las aplicaciones de chat basadas en IA. Éstas funcionan muy bien porque ya estamos entrenados para esperar durante largo tiempo en nuestras comunicaciones asíncronas usando Whatsapp y SMS con otros humanos. Aquí la pausa es normal. La otra prueba es que he tenido múltiples conversaciones con auténticos imbéciles más tontos que ChatGPT y nadie duda de su humanidad.

Cuando llega la comunicación en vivo y en directo, cuando necesitas pedir un café en el mostrador de un bar a un robot camarero, darle instrucciones a tu robot niñera o hablar con tu asistente robot sobre cuál podría ser un buen restaurante para tener una cita, ahí es cuando el tempo y la velocidad son la clave fundamental para que la experiencia del usuario sea un éxito. Y tal vez por eso Nvidia está trabajando en realizar nuevos chips para robots que puedan hacer que los robots se muevan y se comuniquen con tanta fluidez como lo hacen los humanos.

Tal y como van las cosas, no me extrañaría que viéramos el primero de estos robots de habla natural a finales de este mismo año. Y cuando eso pase, como ya apuntaba Isaac Asimov en su Hombre Bicentenario, abriremos una nueva caja de Pandora sobre los derechos de estos ‘seres vivos’ que pueden conectar con nosotros empáticamente, igual que lo puede hacer (casi) cualquier otra persona.

Font, article de Jesús Díaz per a "El Confidencial"

No hay comentarios:

Publicar un comentario