É o que destaca reportagem do portal Meteored, mostrando que pesquisadores avaliaram a capacidade do modelo de linguagem GPT-4 e concluíram que ele passou pelo teste de Turing, conseguindo se passar por humano e enganar pessoas
Por Agência 24h*
- O uso de modelos de linguagem, como o famoso ChatGPT, está cada vez mais comum dentro da sociedade e o modelo cada vez melhor. Desde o lançamento do ChatGPT, a OpenAI já testou novas versões atualizadas que são melhores do que as versões antigas. Recentemente, a empresa disponibilizou o GPT-4o que tem uma performance ainda melhor comparada com as outras versões – diz a reportagem.
Confira as informações, como se testa a IA
Os modelos são tão bom em conversas e responder perguntas que muitas vezes pode dar a impressão que estamos falando com outro ser humano. O teste se uma inteligência artificial consegue se passar por um ser humano e enganar outros humanos se chama teste de Turing. O teste foi proposto por Alan Turing no seu artigo famoso de 1950 que ele discute sobre máquinas pensantes.
Artigo de 1950
Em 1950, Alan Turing publicou seu famoso artigo Computing Machinery and Intelligence que se tornou um dos artigos mais importantes das Ciências da Computação. No começo do artigo, ele inicia questionando se máquinas podem pensar dando início a uma discussão sobre uma possível inteligência artificial. Esse artigo é tido como um dos pontapés iniciais da busca por uma inteligência artificial.
Um dos pontos chaves do artigo é a discussão que Turing se aprofunda sobre a possibilidade de uma máquina pensar. O artigo tem uma abordagem filosófica bastante aprofundada. Chama atenção principalmente pela discussão sobre como máquinas poderiam aprender através de padrões. O aprendizado através de padrões é a base do aprendizado de máquina nos dias atuais.
Teste de Turing
Dentro do artigo também há a proposta de um teste que ficou conhecido como Teste de Turing. A ideia por trás do teste seria avaliar se uma máquina conseguiria se passar por um ser humano e enganar um outro. Fazer um interrogador acreditar que está conversando com outro humano através de mensagens de texto. Caso a máquina fosse bem sucedida nesse teste, ela poderia ser considerada inteligente.
Modelos de linguagem
Um modelo de linguagem é um model que foi treinado para entender, criar ou interagir com textos. O exemplo mais famoso são os modelos que aprendem a traduzir de uma língua para outra. A ideia é que o modelo de linguagem receba uma entrada, que pode ou não ser um texto, e retorne uma resposta em textos ou frases. A área de especialidade é chamada de processamento de linguagem natural (NLP).
Atualmente, os modelos de linguagem são avançados e conseguem manter uma conversa como responder perguntas e fazer tarefas como resumir um texto. Esses modelos atuais, na maioria, são baseados em redes neurais e uma técnica chamada Transformers. Eles são treinados com uma quantidade grande de textos onde conseguem encontrar padrões, interpretar textos e realizar as tarefas.
Quais modelos passam no teste?
Considerando os modelos atuais de linguagem, um grupo de pesquisadores da Universidade de San Diego propuseram submeter o GPT-3.5 e GPT-4 ao Teste de Turing. A ideia do grupo era colocar pessoas para conversar 5 minutos através de textos com um indivíduo. Esses indivíduo poderia ser uma pessoa real ou algum modelo de linguagem que estava sendo testado.
No artigo, eles concluíram que o GPT-4 conseguiu enganar as pessoas na metade das vezes. Para confirmar o teste, o grupo também utilizou o chatbot Eliza que tem uma performance de cerca de 22%. Dessa forma, o estudo conclui que GPT-4 teria passado pelo Teste de Turing mas os humanos ainda conseguem identificar outros humanos melhor na maioria das vezes.
GPT-4
O GPT-4 é uma versão atualizada dos modelos de linguagem que alimenta o ChatGPT. Esses modelos foram criados pela empresa OpenAI e está na quarta geração. Recentemente a OpenAI anunciou que o ChatGPT teria como modelo uma versão ainda mais otimizada do GPT-4 chamada GPT-4o. Uma das maiores diferenças é a capacidade do GPT-4 de criar textos mais longos e mais coesos.
Além disso, o ChatGPT também possui uma interface que consegue fazer buscas na internet conseguindo responder perguntas atuais. Isso é um avanço em comparação ao GPT-3 que foi um dos primeiros a ser usado no ChatGPT quando este foi introduzido mas só tinha informações até o ano de 2022.
(*) Publicado primeiro em Meteored.tempo.com
Uma nova era pro ChatGPT? GPT-4 pode ter passado pelo famoso Teste de Turing (tempo.com)
Referência da notícia:
Jones & Bergen 2024 People cannot distinguish GPT-4 from a human in a Turing test arXiv