Academia.eduAcademia.edu

Who passes the Turing test? / ¿Quién pasa el test de Turing

2024, ESTUDIOS DE PSICOLOGÍA

https://doi.org/10.1177/02109395241241377

This essay shares a series of intuitions about certain paradoxes that artificial intelligence reveals when confronted with the Turing test. Using chess as an example, we ask about the feasibility of distinguishing intelligent behaviour from the ability to simulate, or even the impossibility of discrimination by the average human. We offer sense-making and corporeity, as opposed to mere computations, as the central attribute of living beings. And in attempting to discern the limits of these simulations, we even consult ChatGPT's own opinion.

1241377 STP0010.1177/02109395241241377Studies in Psychology: Estudios de PsicologíaR. Baquero research-article2024 Position article / Artículo de posición Who passes the Turing test? / ¿Quién pasa el test de Turing? Studies in Psychology: Estudios de Psicología 2024, Vol. 45(1) 166–170 © The Author(s) 2024 Article reuse guidelines: sagepub.com/journals-permissions https://doi.org/10.1177/02109395241241377 DOI: 10.1177/02109395241241377 journals.sagepub.com/home/stp Ricardo Baquero Abstract This essay shares a series of intuitions about certain paradoxes that artificial intelligence reveals when confronted with the Turing test. Using chess as an example, we ask about the feasibility of distinguishing intelligent behaviour from the ability to simulate, or even the impossibility of discrimination by the average human. We offer sense-making and corporeity, as opposed to mere computations, as the central attribute of living beings. And in attempting to discern the limits of these simulations, we even consult ChatGPT's own opinion. Keywords Turing test; corporeity; computer chess; ChatGPT; semiotics Resumen El presente ensayo comparte una serie de intuiciones sobre ciertas paradojas que la inteligencia artificial deja en evidencia al verse enfrentada a la prueba de Turing. Usando el ajedrez como ejemplo, nos preguntamos acerca de la factibilidad de disitinguir el comportamiento inteligente de la capacidad de simulación, o incluso, de la imposibilidad de discriminación por parte de un humano medio. Ofrecemos la creación de sentido y la corporeidad, en oposición a los meros cálculos, como el atributo central de lo viviente. Y en el intento de discernir los límites de estas simulaciones, consultamos incluso a ChatGPT su propio parecer. Palabras clave Test de Turing; corporeidad; ajedrez computacional; ChatGPT; semiótica Received 17 January 2024; Accepted 27 January 2024. Universidad Nacional de Quilmes / Universidad de Buenos Aires English translation provided by the Editors / Traducción al inglés aportada por los Editores Corresponding author / Autor/a para correspondencia: Ricardo Baquero, Departamento de Ciencias Sociales, Universidad Nacional de Quilmes, Roque Saenz Peña 352, Bernal, Provincia de Buenos Aires, Argentina. Email: [email protected] R. Baquero In what follows, I will offer a sampling of intuitions regarding certain paradoxes which arise when we inquire into the properties of AI when confronted with the Turing test. Who passes the Turing test? What is it that we are really evaluating? The simulation capabilities of complex artefacts or algorithms, or rather the inability of the average human being to accurately discriminate in such a context? In the end, from a certain point of view, this is really about human discernment as the criterion for defining the features of an object. A problem which, we should agree, is very old yet nevertheless still controversial. The obvious ambiguity lies in whether we are in fact evaluating the ability to simulate or actual intelligent behaviour. That the litmus test for this should be a human being’s ability to tell both things apart seems at times (and not seldom, at that) trivial. It must be admitted that the impossibility of distinguishing between AI and ‘human’ is undoubtedly falsifiable, but also that Magnus Carlsen, the former world chess champion, was able to identify his opponent’s moves as nonhuman in a real-world event. So much so that he angrily left the match and withdrew from a coming tournament where he was to face the same rival. Such was the strength of his conviction (cf. Chess.com, 2022; CNN Español, 2022). I therefore propose for us to consider the following scenario: To ‘A’, ‘B’ is indistinguishable in appearance from ‘C’. Or rather, A does not notice that B isn’t C. However, ‘M’ can indeed tell that B is not C. Which means that B is only apparently indistinguishable from C to A. There might be an ‘H’ that manages — or at least attempts — to prevent M from noticing that B and C aren’t equal. But then it is H who would be rendering B and C apparently indistinguishable, given that H can certainly tell them apart. 167 I invite the reader to substitute B for Deep Blue, as homage, C for a human chess player, A for a chess aficionado, also a human player and even a good one. M, in turn will stand for Magnus, the world champion up until very recently, and H as the initial in the first name of the player penalized for cheating online with the help of a chess engine, and suspected of doing the same in official matches (which, however, has not been proven). Besides, we already know or could know that B, in fact, is not a human or even a living being. This, of course, is not the focus of Turing’s conundrum. But if so, then how relevant can it really be for us, when what we are actually concerned with in the real world is whether bio-digital hybridization is creating not merely new forms of functioning but new forms of ‘existence’ (Benasayag, 2021). The core issue lies, however, (and not in a small way) in ‘fakes’ and their powerful potential for predation. But then again, this problem is all too human — political, if you will — and not strictly technical or cognitive (Sadin, 2018, 2022). Living beings If we anchor the existence of living beings in their ability to create meaning as opposed to mere calculations, such a distinction warrants being considered as qualitative in nature, not quantitative. And as biologists have abundantly demonstrated, the ‘intelligence’ of living beings, or their development, if you will, lies not in the calculating powers of brain-like formations but rather in a contextually located corporeity which, apart from calculating, interprets and imbues the world with meaning. Calculating or being able to, in and of themselves, are not a self-sufficient adaptation but only one relatively relevant component among many (Benasayag, 2019). As Kull (2022) states, each living being, as a semiotic being, makes choices, interprets and creates meaning, but this comes as a result of an enormously complex chain of long-term environmentally embedded processes, which cannot be reduced to mere calculations. 168 Studies in Psychology: Estudios de Psicología 45(1) Drifting I simply ask ChatGPT If we allow, then, that we really do know the nonhuman nature of AI — unless we are discussing endowing it with life or humanity — I can find no substantive difference between being unable to detect the non-humanness of AI and the makebelieve powers of a nightmare or a hallucination. Other than the odd cult that sings the praises of being a human-made ‘artifice’ rather than the result of mere biological or psychological drifts. A dream’s protagonists are astoundingly real and smart, at times even to the point of being cunning and obscure as to their intentions. They can make our hearts race, our voices turn into screams, or even get us to fall off the bed. Thousands of years ago, dreams — which, as Borges (1980) says, might be the most ancient artistic or dramatic genre — had already passed the Turing test. A substance that causes hallucinations materializes an experience or image which blurs the line demarcating ‘real’ from ‘not real’. We do not scrutinize whether the substance passes the Turing test because its effect is known beforehand. The proper comparison would have to take place with someone wholly unaware of such a hallucinatory effect. But then again, who is it that passes the Turing test or doesn’t? The person who consumes peyote knowing what it can do? The person who takes it not knowing what awaits? Or the peyote itself ? - ‘Do you pass the Turing test?’ ChatGPT ‘No, I cannot pass the Turing test, since I am an artificial intelligence program and I do not have the ability to consciously carry out conversations or have a level of intelligence comparable to that of a human being. The Turing test is used to evaluate whether a machine can imitate human behaviour well enough that a human judge cannot distinguish between the machine and a human in a conversation. My main function is to process and generate text based on the data I was trained with, but I have no consciousness, emotions or self-awareness.’ Paradoxically, its answer seeking to convince me through such a sensible argument that it does not pass the test makes me think, oddly enough, that it actually does pass it. It is clear that I’m not Magnus, I’ve been warned as to what peyote can do and, up until now, I wake from my nocturnal nightmares in order to inhabit the real ones each morning brings. Please excuse the irony. R. Baquero 169 ¿Quién pasa el test de Turing? Presento un simple muestreo de intuiciones acerca de algunas paradojas al preguntarnos por ciertas propiedades de la AI frente a la prueba de Turing. ¿Quién pasa el test de Turing? ¿Evaluamos la capacidad de simulación de un artefacto o algoritmo complejo o la imposibilidad de discriminación de un humano medio? Al fin, se trata, mirado desde cierta perspectiva, de la capacidad de discernimiento humano como criterio para definir los atributos de un objeto. Problema, convengamos, en verdad viejo y aún controvertido. Lo que resulta obviamente ambiguo es si evaluamos la capacidad de simulación o la posibilidad de un comportamiento inteligente. Que el criterio sea si un humano es capaz de distinguirlas o no, por momentos, no pocos, parece trivial. La imposibilidad de distinguir entre AI y ‘humano’ debe admitirse que es sin duda falsable, y también que Magnus Carlsen, el excampeón mundial de ajedrez, en una situación real, pudo identificar las jugadas de su competidor como no humanas. Abandonando, con enojo, la partida y retirándose de un torneo próximo donde estaría el mismo rival. Tal era su convicción (cf. Chess. com, 2022; CNN Español, 2022). Propongo pensar entonces: ‘B’ posee una apariencia indistinguible de ‘C’ para ‘A’. O, si se quiere, A desconoce o no puede advertir que B no es C. ‘M’ puede advertir que B no es C. Por lo tanto, B sólo es aparentemente indistinguible de C para A. Puede haber un ‘H’ que logre, o intente, que M al fin no advierta que B y C no son lo mismo. Pero entonces H pasaría a ser el que vuelve sólo aparentemente indistinguible a B de C, ya que él (H), claramente los distingue. Invito al lector a sustituir B: por Deep Blue, como homenaje, C: por Chess, jugado por un jugador humano; A: ajedrecista, incluso bueno. M: Magnus, el hasta hace poco campeón mundial de ajedrez; H: la inicial del ajedrecista que fuera sancionado por cometer trampas, auxiliado por un motor inteligente, al jugar on line y sospechado, sin estar confirmado, de reiterarlas en tablero. Además, ya sabemos o podríamos saber que B, fácticamente, no es un humano o un organismo viviente. Por supuesto, no es el foco del problema de Turing, pero entonces cuál es su grado de relevancia cuando lo que discutimos fácticamente, en verdad, es si la hibridación bio-digital está creando, o no, nuevas formas de ‘existencia’ y no sólo funcionamiento (Benasayag, 2021). La relevancia pasa, en todo caso, y no es menor, por el potente efecto predador de las ‘fakes’, pero nuevamente es un problema demasiado humano, si se quiere político, no estrechamente técnico o cognitivo (Sadin, 2018, 2022). Lo viviente Si la existencia de lo viviente la definimos como capacidad de crear sentidos y no meramente cálculos, tal distinción amerita que la diferencia es cualitativa, no cuantitativa. Y, como han mostrado de sobra los biólogos, la ‘inteligencia’ de lo viviente, o, si se quiere, su desarrollo, ni siquiera reside en el poder de cálculo de formas de tipo cerebral, sino en una corporeidad situada, que interpreta y da sentido al mundo, además de calcular. El cálculo o la capacidad de cálculo por sí mismos no representarían una adaptación sino un componente más de relevancia relativa (Benasayag, 2019). Como afirma Kull (2022), todo organismo vivo, en tanto semiótico, realiza elecciones, interpretando y creando sentidos, pero esto es resultado de una enorme complejidad de procesos de largo plazo y situacionales, irreductibles a una potencia de cálculo. Derivas Si concedemos, entonces, que en verdad conocemos el carácter no humano de la AI — salvo que estemos discutiendo otorgarle vida o humanidad 170 — no encuentro diferencia sustantiva entre no distinguir el carácter no humano de la AI con el poder alucinatorio de una pesadilla o, al fin, de una alucinación. Salvo el curioso culto de las bondades agregadas de ser un ‘artificio’ humano, no producto de la mera deriva ‘biológica’ o psicológica. Los protagonistas de un sueño son tremendamente reales e inteligentes, incluso astutos y hasta herméticos. Pueden causarnos palpitaciones, gritos, caídas del lecho. Hace miles de años la creación de sueños, tal vez curiosamente el primer género artístico/dramático, al decir de Borges (1980), pasó ya el test de Turing. Una sustancia que causa alucinaciones produce la materialidad de una vivencia o imagen indistinguible entre lo ‘real’ o ‘no real’. No ponemos a prueba si la sustancia pasa el test de Turing porque es conocido de antemano el efecto de la sustancia. La comparación sería con alguien que desconoce o no supone o espera tal efecto alucinatorio. Pero, nuevamente, ¿quién pasa o no, entonces, el test de Turing? ¿Quien consume peyote a sabiendas de sus poderes vs. quien lo consume desconociéndolo? ¿El peyote? Simplemente pregunto al ChatGPT - ‘¿Tú pasas el test de Turing?’ ChatGPT ‘No, yo no puedo pasar el test de Turing, ya que soy un programa de inteligencia artificial y no tengo la capacidad de realizar conversaciones de manera consciente o tener un nivel de inteligencia comparable al de un ser humano. El test de Turing se utiliza para evaluar si una máquina puede imitar el comportamiento humano lo suficientemente bien como para que un juez humano no pueda distinguir entre la máquina y un ser humano en una conversación. Mi función principal es procesar y generar texto basado en los datos con los que fui entrenado, pero no tengo conciencia, emociones ni autoconciencia.’ Studies in Psychology: Estudios de Psicología 45(1) Paradójicamente, su respuesta, por su sensato argumento, al convencerme de que no lo pasa, me deja pensando curiosamente que, en realidad, parece pasarlo. Es claro que no soy Magnus y ya estoy avisado de las propiedades del peyote y, hasta ahora, despierto de mis pesadillas nocturnas para habitar las reales matutinas. Discúlpese la ironía. References / Referencias Benasayag, M. (2019). La singularidad de lo vivo. Prometeo. Benasayag, M. (2021). ¿Funcionamos o existimos? Una respuesta a la colonización algorítmica. Prometeo. Borges, J. L. (1980). Siete noches. Fondo de Cultura Económica. Chess.com. (2022). Hans Niemann report. Chess.com, 10/22. https://www.chess.com/blog/CHESScom/hans-niemann-report CNN Español. (2022). El campeón mundial de ajedrez Magnus Carlsen acusa explícitamente a su rival Hans Niemann de hacer trampas. https://cnnespanol. cnn.com/2022/09/27/ajedrez-magnus-carlsenacusa-hans-niemann-trampas-trax/ Kull, K. (2022). Choices by organisms: On the role of freedom in behaviour and evolution. Biological Journal of the Linnean Society, XX, 1–8. Sadin, É. (2018). La humanidad aumentada. La administración digital del mundo. Caja Negra. Sadin, E. (2022). La era del individuo tirano. El fin del mundo común. Caja Negra.