La Singularidad Desnuda

Un universo impredecible de pensamientos y cavilaciones sobre ciencia, tecnología y otros conundros

El Test de Turing Musical: ¿Conseguiremos un Tommy Dorsey cibernético?

Posted by Carlos en abril 24, 2007

El test de Turing -del que hace algún tiempo hablábamos en relación a la posibilidad de que un buscador de Internet como Google pudiera ser el primero en superarlo- es una de las más clásicas caracterizaciones de la Inteligencia Artificial. Hay que recordar que a grandes rasgos lo que en él se plantea es que una máquina cuya capacidad la hace ser indistinguible de un humano en una conversación puede ser caracterizada como “pensante”. Esta caracterización está por supuesto sujeta a un amplio debate que podemos abordar con más detalle en un futuro artículo. Consideremos por el momento una de las objeciones que se suelen plantear, y que hace referencia al hecho de que esta prueba adolezca de “chauvinismo” antropomórfico. En este sentido, por una parte está la cuestión de fondo de que se busca en la máquina sujeta al test la expresión de un comportamiento asimilable al humano. Por otra parte está la cuestión de forma de que se exige que la conversación se plantee mediante un lenguaje humano. En relación a la primera objeción, cabe aducir que aun siendo cierta, es verdad también que puede objetivizar la prueba en tanto en cuanto que asumir inteligencia en un sentido abstracto puede ser difuso y subjetivo. La argumentación no termina ahí, pero dejémosla de lado y concentrémonos en la segunda cuestión, la formal. Esta objeción es interesante por varios motivos, como por ejemplo que la elección del lenguaje podría ser muy relevante a la hora de facilitar o dificultar que la máquina pasara el test, que el procesamiento de lenguaje natural introduce un nivel adicional de complejidad que no necesariamente debe conllevar inteligencia aparejada, o que simplemente el uso del lenguaje puede ser un factor de distracción debido por ejemplo al uso de expresiones de relleno. ¿De qué manera pueden mitigarse algunas de estas dificultades? Quizás la respuesta la tengamos en el uso de un lenguaje más flexible y más universal: la música.

Planteémonos una analogía al test de Turing en términos musicales. Una primera idea puede ser la de tomar dos composiciones musicales, una compuesta por un hombre, y otra por una máquina, y someterlas a la consideración de un experto. Si el mismo es incapaz de determinar cuál es la humana, y cuál la creada por la máquina, podríamos decir que ésta ha pasado el test. El problema es que un test como éste puede plantear dificultades para la máquina si el humano es un gran compositor (en el test de Turing clásico si el humano es un gran orador la máquina estaría comprometida, pero en menor medida, ya que es más fácil simular la oratoria que el talento musical); por otra parte sería muy fácil para la máquina si el humano es un pésimo compositor, o un compositor -digamos- extravagante en sus obras (este inconveniente sí es análogo al que se plantea en el test de Turing clásico). Démosle entonces una vuelta de tuerca al test, y planteémoslo en otros términos, como si de una conversación se tratase: tendríamos una orquesta virtual, dentro de la cual estaría el juez como músico o como director. Si la actuación de la máquina es indistinguible de la de un humano durante la obra (que puede -y debe- conllevar su parte de improvisación) diríamos que ha pasado el test.

musicbot.jpg
Credit: Dean MacAdam, ScienceNews

Una cosa como la anterior plantea numerosas dificultades. Una parte de las mismas está relacionada con el propio reconocimiento del sonido musical, problema similar al reconocimiento del habla. Es preciso que la máquina sea capaz de identificar las notas individuales (y considérese que hay ruido, múltiples notas superpuestas por parte de diferentes instrumentos, etc.), y esto es una tarea muy compleja. Sin embargo, los progresos que se han hecho en este área son enormes (¡gracias Villa por el link!). Por ejemplo, utilizando técnicas de aprendizaje automático (redes neuronales, modelos bayesianos, etc.) se puede mejorar la identificación de los sonidos, ya que las secuencias de notas no son arbitrarias sino que siguen algunos patrones generales que hacen que sean agradables a nuestro oído. Más aún, se ha conseguido que un ordenador correlacione las notas con la partitura, de manera que siga el desarrollo de la obra y sea capaz de proporcionar acompañamiento a un solista, siguiendo su ritmo. Se trata sin duda de un logro excepcional, aunque aún falta dar el siguiente paso: introducir la creatividad y la interacción en la composición. Hay algunas cosas interesantes hechas con redes neuronales, o con algoritmos evolutivos, pero aún distan mucho de lo que se consideraría equivalente al rendimiento humano en algo así como una jam session. De todas formas, quién sabe si veremos antes a un robot saxofonista improvisando en una banda de jazz que a un robot conversacional pasando el test de Turing.

Enviar a Blog Memes Enviar a del.icio.us Enviar a digg Enviar a fresqui Enviar a menéame

Anuncios

4 comentarios to “El Test de Turing Musical: ¿Conseguiremos un Tommy Dorsey cibernético?”

  1. Muy pero que muy curioso, quien lo habría imaginado xD, dentro de poco formo mi propia banda, pero yo no toco nada, seré el manager y los miembros serán robots xD, un saludo.

  2. Carlos said

    Bueno, siempre puedes cantar 🙂

  3. Boca Rana said

    Dejando aparte que en mi opinión la inteligencia artificial es una estupidez, ¿a quien puede interesarle una máquina que te mande a paseo porque le aburren tus peticiones? ¿quien puede tener interés en una máquina que se equivoque de vez en cuando?. Quisiera hacer algunos comentarios.

    Por supuesto, la elección del lenguaje es fundamental a la hora de pasar el test de Turing. Primero porque muchos investigadores consideran que el lenguaje y la inteligencia evolucionaron a la vez, lo cual, en mi opinión, implicaría una relación entre ambos mucho más directa, dicho de otro modo, creo que lenguaje natural e inteligencia son dos caras de la misma moneda.

    Respecto a realizar un test de Turing con música, me parece muy poco demostrativo por varios motivos, el primero, porque respecto a que diálogos musicales tipo jam session puedan ser sinónimos de inteligencia, no es un razonamiento muy sólido cuando, en algunas especies de pájaros, es algo que forma parte de cortejo habitual (por cierto, se trata de sonidos muy bellos, mucho más de lo que puede componer la inmensa mayoría de las personas). Como mucha gente sabe los pájaros no brillan como los vertebrados mas inteligentes. El segundo es que el lenguaje musical está sujeto a reglas formales mucho más estrictas que el lenguaje natural. El tercero y, para mi, más importante, es que la belleza es algo absolutamente distinto a la inteligencia, tanto que se puede encontrar belleza en objetos inanimados como una roca y por tanto, desprovistos de cualquier tipo de inteligencia.

    Respecto a que los buscadores pudieran superar el test de Turing, en mi opinión, es más que posible, de hecho lo superan con frecuencia, no hay mas que ver las recopilaciones de frases usadas para la búsqueda que publican algunos blogs; se ve claramente que quien las escribe está convencido de hablar con una persona inteligente (y mucho). Más en serio, no tengo ninguna duda de, que con pequeñas modificaciones, cualquier buscador superaría el test de Turing en la inmensa mayoría de los casos, pero estaría haciendo trampa. Dicho de otro modo, si se modifica el buscador para que use como criterio de búsqueda la frase del humano y que de como respuesta lo que encuentre en la página a continuación de la frase usada para la búsqueda, la mayoría de nosotros consideraríamos que se trata de una respuesta inteligente y con razón, porque esa respuesta la habría escrito un humano, el buscador solo habría “buscado”, no habría pensado nada.

    No se me escapa que, además de la modificación que he mencionado arriba hacen falta muchas líneas de código, se debe conectar bien la frase del humano y del buscador, el buscador debe flexibilizarse lo suficiente para que siempre pueda dar, al menos una respuesta.

  4. Carlos said

    Es buena idea dejar aparte tu opinión de que la inteligencia artificial es una estupidez, a la vista de las dos cuestiones con las que la ejemplificas.

    La relevancia de la elección del lenguaje a la hora de pasar el test de Turing no está en el hecho de que sea un producto coevolutivo de la inteligencia. De hecho, esa relación (incluso en una versión más débil en la que el lenguaje es resultado de la inteligencia) es precisamente uno de los factores que justifican el test de Turing. Le relevancia de la elección está en que la máquina debe superar la barrera existente entre sintaxis y semántica, lo que en primera instancia implica establecer relaciones entre sistemas sintácticos (dependientes del lenguaje utilizado), y contenidos mentales (ya sean referencias a objetos físicos o a nociones abstractas).

    Con respecto al test de Turing musical, al igual que en el test de Turing clásico la idea subyaciente es la indistinguibilidad. No es relevante que los pájaros trinen, ni ninguna noción de belleza subjetiva, sino que la capacidad demostrada por una máquina sea asimilable a la de un humano, y para ello entra en juego tanto la comprensión de la composición musical de la otra parte (que debe permitir no sólo acompañar, sino anticipar los siguientes movimientos), como la creatividad para aportar nuevos elementos a la composición. En ambas líneas se está avanzando mucho, aunque la segunda sea todavía más incipiente.

    En cuanto a los buscadores, están todavía a años-luz de poder superar el test, aunque dado el ritmo de desarrollo, y el interés práctico en el área, las cosas pueden ser distintas en una o dos décadas. La objeción que comentas sobre que en el fondo no habría pensamiento, sino mera búsqueda de frases en una base de datos es la que planteó Ned Block como experimento mental. La diferencia está en que mientras en el experimento mental de Block la base de datos abarca todas las posibles conversaciones y es físicamente irrealizable, en el caso de una aplicación real hay restricciones físicas que impiden la mera fuerza bruta, por lo que es necesario alcanzar una cierta comprensión de la semántica de la conversación. Si eso supone pensamiento o no está sujeto a debate, pero desde luego no es algo que se pueda alcanzar a corto plazo.

Sorry, the comment form is closed at this time.

 
A %d blogueros les gusta esto: