Test de Turing

La "interpretación estándar" de la prueba de Turing, en la cual el jugador C, el interrogador, le es dada la tarea de tratar de determinar qué jugador - A o B - es una computadora y cual un ser humano. El interrogador se limita a la utilización de las respuestas a las preguntas escritas para tomar la determinación. Imagen adaptada de Saygin, 2000.[1]

El test de Turing (o prueba de Turing) es una prueba de la habilidad de una máquina de exhibir un comportamiento inteligente similar, o indistinguible, del de un humano. Alan Turing propuso que un humano evaluara conversaciones en lenguaje natural entre un humano y una máquina diseñada para generar respuestas similares a las de un humano. El evaluador sabría que uno de los miembros de la conversación es una máquina y todos los participantes serían separados de otros. La conversación estaría limitada a un medio únicamente textual como un teclado de computadora y un monitor por lo que sería irrelevante la capacidad de la máquina de transformar texto en habla.[2] En el caso de que el evaluador no pueda distinguir entre el humano y la máquina acertadamente (Turing originalmente sugirió que la máquina debía convencer a un evaluador, después de 5 minutos de conversación, el 70% del tiempo), la máquina habría pasado la prueba. Esta prueba no evalúa el conocimiento de la máquina en cuanto a su capacidad de responder preguntas correctamente, solo se toma en cuenta la capacidad de ésta de generar respuestas similares a las que daría un humano.

Turing propuso esta prueba en su ensayo “ Computing Machinery and Intelligence” de 1950 mientras trabajaba en la Universidad de Mánchester (Turing, 1950; p. 460).[6]

Desde 1950, la prueba ha servido de influencia y criticada, además de ser esencial en el concepto de la filosofía de la inteligencia artificial.[7]

Historia

Contexto filosófico

La incógnita sobre la capacidad de las máquinas de pensar tiene una larga historia, esta se divide entre las perspectivas materialista y dualista de la mente. René Descartes tuvo ideas similares a la prueba de Turing en su texto Discurso del Método (1637) donde escribió:

Cuantos autómatas diferentes o máquinas móviles se pueden construir por la industria del hombre […] Podemos comprender con facilidad el hecho de que una máquina sea diseñada para pronunciar palabras, incluso responder ante acciones tangibles que produzca un cambio en sus órganos; por ejemplo, si se le tocara de una manera particular no preguntaría que le queremos decir; si se le toca en otra parte puede decir que se le está lastimando entre otras cosas. Pero nunca sucede que pueda ordenar su habla en distintas maneras para responder apropiadamente ante todo lo que se diga en su presencia, de la misma manera que la clase más baja de humanos puede hacerlo.[8]

Descartes reconoce que los autómatas son capaces de reaccionar ante interacciones humanas pero argumenta que tal autómata carece de la capacidad de responder de manera adecuada ante lo que se diga en su presencia de la misma manera que un humano podría. Por lo tanto, Descartes abre las puertas para la prueba de Turing al identificar la insuficiencia de una respuesta lingüística apropiada lo que separa al humano del autómata. Descartes no llega a considerar que una respuesta lingüística apropiada puede ser producida por un autómata del futuro y por lo tanto no propone el test de Turing como tal aunque ya razonó los criterios y el marco conceptual.

Denis Diderot plantea en su Pensées philosophiques un criterio de la prueba de Turing:

“Si se encuentra un loro que puede responder a todo, se le consideraría un ser inteligente sin duda alguna."[9]

Esto no significa que él esté de acuerdo pero muestra que ya era un argumento común usado por los materialistas de la época.

Según el dualismo, la mente no tiene un estado físico (o al menos cuenta con propiedades no físicas)[11]

En 1936, el filósofo Alfred Ayer consideraba la pregunta filosófica típica sobre otras mentes: ¿Cómo sabemos que otras personas experimentan el mismo nivel de conciencia que nosotros? En su libro Lenguaje, Verdad y Lógica, Ayer propuso un método para distinguir entre un hombre consciente y una máquina inconsciente: “El único argumento que tengo para asegurar que, lo que parece ser consciente, no es un ser consciente sino un muñeco o una máquina es el hecho de que falle en las pruebas empíricas por medio de las cuales se determina la presencia o ausencia de la conciencia."[12] (Es una propuesta muy similar a la prueba de Turing pero esta se enfoca en la conciencia en vez de en la inteligencia. Además se desconoce si Turing estaba familiarizado con el clásico filosófico de Ayer. En otras palabras, algo no está consciente si reprueba una prueba de consciencia.

Alan Turing

La “inteligencia maquinaria” ha sido un tema que investigadores del Reino Unido han seguido desde 10 años antes de que se fundara el campo de investigación de la inteligencia artificial ( IA) en 1956. [14]

Turing, en particular, había estado trabajando con el concepto de la inteligencia maquinaria desde al menos 1941,[18] y como parte de su investigación, propuso lo que se puede considerar como un predecesor de sus pruebas futuras:

No es difícil diseñar una máquina de papel que juegue bien ajedrez.[20]

El primer texto publicado escrito por Turing enfocado completamente en la inteligencia de las máquinas fue “ Computing Machinery and Intelligence”. Turing inicia este texto diciendo “Me propongo tomar en cuenta la pregunta ‘¿Pueden pensar las máquinas?’”.[22]

Para demostrar este acercamiento, Turing propone una prueba inspirada en el “Juego de imitación”, en este entraban un hombre y una mujer a cuartos separados y el resto de los jugadores intentaría distinguir entre cada uno por medio de preguntas y leyendo las respuestas (escritas a máquina) en voz alta. El objetivo del juego es que los participantes que se encuentran en los cuartos deben convencer al resto que son el otro. (Huma Shah argumenta que Turing incluye la explicación de este juego para introducir al lector a la prueba de pregunta y respuesta entre humano y máquina[23] ) Turing describe su versión del juego de la siguiente manera:

Nos hacemos la pregunta, “¿Qué pasaría si una máquina toma el papel de A en este juego?” ¿Se equivocaría tan frecuentemente el interrogador en esta nueva versión del juego que cuando era jugado por un hombre y una mujer? Estas preguntas sustituyen la pregunta original “¿Pueden pensar las máquinas?”.[22]

Más adelante en el texto se propone una versión similar en la que un juez conversa con una computadora y un hombre.[25]

El texto de Turing consideraba nueve objeciones putativas las cuales incluyen a todos los argumentos mayores, en contra de la inteligencia artificial, que habían surgido en los años posteriores a la publicación de su texto (ver “ Computing Machinery and Intelligence”).[6]

ELIZA y PARRY

En 1966, Joseph Weizenbaum creó un programa que aseguraba pasar la prueba de Turing. Este programa era conocido como ELIZA y funcionaba a través del análisis de las palabras escritas por el usuario en busca de palabras clave. En el caso de encontrar una palabra clave, una regla que transformaba el comentario del usuario entra en acción y se regresaba una oración resultado. Si no se encontraba alguna palabra clave, ELIZA daba una respuesta genérica o repetía uno de los comentarios anteriores.[28] aunque esto es muy controvertido (ver más adelante).

PARRY fue creado por Kenneth Colby en 1972. Era un programa descrito como “ELIZA con carácter”.[31]

En el siglo XXI, versiones de estos programas (llamados “ bots conversacionales”) siguieron engañando a la gente. “CyberLover”, un programa de malware, acechaba a usuarios convenciéndolos de “revelar información sobre sus identidades o de entrar a un sitio web que introduciría malware a sus equipos”.[33]

La habitación china

El texto “Minds, Brains, and Programs” de 1980 escrito por John Searle, proponía el experimento de la “habitación china” y argumentaba que la prueba de Turing no podía usarse para determinar si una máquina podía pensar. Searle observó que software (como ELIZA) podía aprobar la prueba de Turing a través de la manipulación de caracteres que no había entendido. Sin la comprensión no se les puede clasificar realmente como “pensantes” de la misma manera que los humanos, por lo tanto, Searle concluyó que la prueba de Turing no puede probar que una máquina puede pensar. [36]

Argumentos como los de Searle y otros individuos trabajando en la filosofía de mente desataron un debate más intenso sobre la naturaleza de la inteligencia, la posibilidad de máquinas inteligentes y el valor de la prueba de Turing que continuó durante las décadas de los 80s y 90s.[37]

Premio Loebner

El Premio Loebner proporciona una plataforma anual para pruebas de Turing prácticas con su primera competencia siendo en noviembre de 1991.[39]

La primera competencia del Premio Loebner en 1991, llevó a una discusión renovada sobre la viabilidad de la prueba de Turing y el valor de continuar persiguiéndola en la prensa[42]

Los premios de plata (únicamente textual) y de oro (visual y aural) no han sido ganados a la fecha, sin embargo, la competencia ha entregado la medalla de bronce cada año al sistema computacional que, según la opinión de los jueces, demuestra el comportamiento conversacional “más humano” entre los otros participantes. A.L.I.C.E. ( Artificial Linguistic Internet Computer Entitity) ha ganado el premio de bronce en 3 ocasiones recientes (2000, 2001 y 2004). La IA aprendiz Jabberwacky ganó en el año 2005 y nuevamente en el 2006.[43]

El Premio Loebner evalúa la inteligencia conversacional, los ganadores son, típicamente, bots conversacionales. Las reglas de las primeras instancias de la competencia, restringían las conversaciones: cada programa participante y un humano escondido conversaban de un solo tema[47]

Durante la competencia del 2009. Con sede en Brighton, Reino Unido, la interacción permitida era de 10 minutos por ronda, 5 minutos para hablar con la máquina y 5 minutos para hablar con el humano. Se implementó de esta manera para probar la lectura alternativa sobre la predicción de Turing que la interacción de 5 minutos debía ser con la computadora. Para la competencia del 2010, el patrocinador aumento el tiempo de interacción entre interrogador y sistema a 25 minutos.[48]

Competencia en la Universidad de Reading del 2014

El 7 de junio de 2014 se realizó una competencia de la prueba de Turing organizada por Kevin Warwick y Huma Shah para el 60 aniversario de la muerte de Turing y fue llevado a cabo en la Real Sociedad de Londres. Fue ganada por el robot conversacional ruso Eugene Goostman. El robot, durante una serie de conversaciones de 5 minutos de duración, logró convencer al 33% de los jueces del concurso de que era humano. John Sharkley se incluía entre los jueces, patrocinador del proyecto de ley que promueve el perdón gubernamental a Turing, al profesor de IA Aaron Sloman y Robert Llewellyn, actor de Enano Rojo.[52]

Los organizadores de la competencia creyeron que la prueba había sido “aprobada por primera vez” en el evento diciendo: “algunos dirán que la prueba ya ha sido pasada. Las palabras ‘Prueba de Turing’ han sido aplicadas a competencias similares alrededor del mundo. Sin embargo, este evento involucra más pruebas simultáneas de comparación al mismo tiempo como nunca antes visto, fue independientemente verificado y, crucialmente, no se restringieron las conversaciones. Una prueba de Turing verdades no establece las preguntas ni los temas de las conversaciones.”[50]

La competencia ha enfrentado críticas,[54]

Other Languages
العربية: اختبار تورنغ
azərbaycanca: Türinq testi
български: Тест на Тюринг
čeština: Turingův test
Deutsch: Turing-Test
English: Turing test
Esperanto: Testo de Turing
français: Test de Turing
hrvatski: Turingov test
magyar: Turing-teszt
Bahasa Indonesia: Uji Turing
íslenska: Próf Turings
italiano: Test di Turing
한국어: 튜링 테스트
lietuvių: Tiuringo testas
latviešu: Tjūringa tests
Nederlands: Turingtest
norsk bokmål: Turingtest
polski: Test Turinga
português: Teste de Turing
română: Testul Turing
srpskohrvatski / српскохрватски: Turingov test
Simple English: Turing test
slovenčina: Turingov test
slovenščina: Turingov test
српски / srpski: Тјурингов тест
svenska: Turingtest
Türkçe: Turing testi
українська: Тест Тюрінга
Tiếng Việt: Phép thử Turing
中文: 图灵测试