Teste de Turing. A Máquina contra o Humano
por Gabriel Lagoa | 24 de Abril, 2025
Podem as máquinas pensar? O teste criado por Alan Turing em 1950 propõe uma resposta simples: uma máquina pode ser considerada inteligente quando consegue fazer-se passar por humana numa conversa.
Um estudo feito pela Universidade da Califórnia em San Diego revela que “quando solicitado a adotar uma persona humana, o GPT-4.5 foi considerado humano 73% das vezes: significativamente mais frequentemente do que os interrogadores selecionaram o participante humano real”. Segundo a OpenAI, os eu modelo “dá a sensação de estar a falar com uma pessoa atenciosa”. Mas será que este modelo de IA consegue mesmo enganar um humano no famoso teste de Turing — em que uma pessoa, na posição de interrogador, tenta distinguir entre respostas de humanos e máquinas?
Sim, e não foram poucos os que caíram.
Na base deste estudo está o teste de Turing, proposto em 1950 pelo matemático Alan Turing. No artigo pioneiro “Computing Machinery and Intelligence”, Turing fez uma pergunta: podem as máquinas pensar? Para resolver isto, o académico criou um teste simples que mede se uma máquina consegue imitar um humano de forma convincente.
A ideia é esta: um humano conversa com dois participantes sem os ver – um humano e uma máquina. Se o interrogador não conseguir identificar qual é a máquina apenas pelas respostas, a máquina passa no teste.
Quando conversamos com um modelo de inteligência artificial (IA), é normal perguntarmos se já chegámos ao momento em que os chatbots estão tão desenvolvidos que conseguem fazer alguém pensar que está a falar com uma pessoa, em vez de uma máquina.
Exemplo disso é a evolução do famoso ChatGPT. Lançado no final de 2022, o GPT-3.5 já demonstrava boas capacidades na compreensão de contexto. Meses depois, a OpenAI lançou o GPT-4, que reduziu significativamente os erros de raciocínio e resolveu problemas complexos que a versão anterior não conseguia.
Quem foi o primeiro a passar no teste?
Nos primeiros anos, o teste de Turing parecia impossível de superar. Os programas iniciais, como o ELIZA nos anos 1960, criaram breves momentos de ilusão, mas falharam rapidamente com perguntas mais difíceis.
O teste evoluiu com a tecnologia. Havia até uma competição, a Loebner Prize, que começou em 1991 e oferecia prémios para quem criasse programas que se aproximassem do objetivo de Turing.
Em 2014, o chatbot Eugene Goostman causou debate ao supostamente passar no teste (o primeiro a fazê-lo), mas muitos especialistas questionaram o resultado, já que o programa se apresentava como um adolescente ucraniano com inglês limitado – uma estratégia que os críticos consideraram uma forma de justificar as limitações do sistema.
A verdade é que Alan Turing disse que podia considerar-se que um computador pensa quando consegue enganar os 30% dos interrogadores numa conversa online de cinco minutos. Eugene Goostman conseguiu-o, ao convencer 33% dos 30 elementos do júri.
O teste ainda é útil nos dias de hoje?
Os últimos anos trouxeram muitas mudanças. Com os novos modelos de linguagem, tudo mudou. Os sistemas atuais superam as limitações anteriores e mostram capacidades de entender contextos e gerar texto natural. Os modelos de IA já não seguem apenas regras pré-programadas, mas aprendem padrões a partir de vastas quantidades de texto.
Esta evolução levanta questões sobre o valor do teste original. Há quem ache que o teste de Turing já não serve como única medida de inteligência artificial. As empresas criaram versões mais avançadas, como o teste Winograd Schema, que analisa a compreensão de ambiguidades linguísticas, e métodos que incluem interpretação visual.
Há ainda quem diga que passar no teste de Turing não significa verdadeira compreensão, apenas capacidade de simular respostas. Ou seja, a capacidade de dar respostas que parecem inteligentes sem entender realmente o seu significado. O GPT-4.5, por exemplo, além de respostas tecnicamente corretas, também consegue demonstrar nuances que tradicionalmente associamos à comunicação humana: humor, referências culturais, e até a capacidade de admitir incerteza ou corrigir-se – características que antes eram exclusivas dos humanos.