O ChatGPT agora canta e conta histórias de embalar (com “batatas mágicas”)

por Abílio dos Reis (Texto) | 20 de Maio, 2024

Naquilo a que apelidou de “Atualização de Primavera”, a OpenAI voltou a fazer o que já tinha feito em fevereiro quando apresentou vídeos de mamutes gerados pelo seu modelo text-to-video: a impressionar e a fazer-nos pensar, com mais ou menos medo, no futuro. Agora, fê-lo com a sua assistente de voz — que não anda longe da IA do filme “Her”.

Na semana passada, a empresa liderada por Sam Altman anunciou o lançamento de um novo modelo chamado GPT-4o (“o” para “omni”), bem como atualizações que incluíam uma aplicação para desktop (primeiro vai ficar disponível apenas nos Mac, sendo estas as primeiras impressões) e mais uns façanhas incríveis que o ChatGPT vai passar a fazer.

O que faz do GPT-4o especial: alimenta a assistente de voz da OpenAI, que já consegue ter conversas fluidas. É imaginar uma Alexa ou Siri muito mais avançada que faz bem mais do que ligar ou desligar as luzes de casa ou de nos dar música. Ou seja, há uma razão para que circule o rumor que a Apple vai fazer uma parceria com a OpenAI para implementar esta tecnologia no iOS 18, a próxima versão do software do iPhone.
Simplificando: o GPT-4o não é o GPT-5, mas sim um modelo superior aos existentes na hora de trabalhar vídeo e áudio. Ainda assim, consegue ter o mesmo nível de desempenho que o modelo GPT-4 Turbo (a versão paga) em vários parâmetros e melhora a qualidade das respostas em outras línguas que não a inglesa. O GPT-4o está disponível para todos os utilizadores, mas os que tenham o plano Plus (o pago) podem usufruir do modelo sem restrições (o acesso gratuito limita o número de mensagens que se pode mandar).
Originalmente, a assistente de voz da OpenAI vinha com “cinco vozes”, incluindo uma que se chamava Sky, que soava terrivelmente a uma voz familiar para os amantes de cinema: a de Scarlett Johansson. Pelo visto, não foi coincidência. Durante cerca de um ano, Sam Altman tentou negociar com a atriz para que a sua voz se tornasse a do ChatGPT. Johansson rejeitou, mas a Sky continuou — para uns meros dias depois estar em “pausa” (leia-se “retirada”) por causa do que se presume ter que ver com questões legais. A par, a OpenAI não se livrou de críticas na Internet pelo tom “sedutor” e “flirty” de Sky. Há algum tempo que as vozes e personalidades femininas são utilizadas como padrão para os assistentes virtuais, o que, segundo os especialistas, reforça os estereótipos de género e alimenta a misoginia.

Um vídeo de demonstração é precisamente aquilo que o nome sugere ser: uma montra que serve para vender um conceito e uma ideia. Muitas vezes, acontece que a realidade transcende as possibilidades e capacidades do produto. Há erros, há expectativas defraudadas, há o karma do overselling. No entanto, com a OpenAI, o que tem acontecido é um fenómeno causa-efeito: a cada nova revelação, há vislumbre de algo que leva a um espanto que nos deixa boquiabertos. Neste caso, até Sam Altman confessou que as novas ferramentas lhe “pareciam magia”.

E como é que a OpenAI fez magia? Criando muito do “futurismo próximo” presente no filme “Her”, em Portugal rebatizado “Uma História de Amor”, de Spike Jonze. Em 2013, Jonze imaginou um mundo em que a inteligência artificial aquece e ilumina a alma solitária e perdida de Joaquin Phoenix. Em 2024, a OpenAI pode ter apresentado o modelo que nos pode levar até a uma Samantha (a IA de Scarlett Johansson) que só tínhamos visto em Hollywood.

É certo que a IA do GPT-4o ainda não escolhe o próprio nome depois de ler um livro com 180 mil nomes de bebés em 0.02 segundos como a IA da ficção e ainda se baralha um bocado com as suas limitações, mas com os avanços a que temos assistido só podemos assumir que não deverá ser necessário esperar muito até lá.

O futuro da interação entre máquina e humano

Na apresentação, Mira Murati, a Chief Technology Officer, fez saber que internamente o GPT-4o é visto como “o futuro da interação” entre “humanos” e “máquinas”, numa “verdadeira mudança de paradigma”. Não é difícil de entender o que quis dizer, muito menos de acreditar nas suas palavras. Basta ver os vídeos disponibilizados pela OpenAI, que nos mostram uma realidade do presente que não difere muito da que o realizador Spike Jonze imaginou.

Em “Her”, Joaquin Phoenix “pega” em Sam (leia-se coloca um aparelho no bolso da camisa para que a câmara seja os olhos de Sam), sai de casa e viaja até a um paredão de Manhattan Beach, em Santa Monica, na California, que leva a voz entusiasmada de Johansson exclamar “olha, é a praia!”. Num dos vídeos, a câmara do telefone do engenheiro da OpenAI aponta para um prato com um bolo e uma vela — e a inteligência artificial não demorou muito até assumir que “alguém estava a celebrar um dia especial ou que alguém quis arranjar uma desculpa para comer um bolo”. O primeiro caso é óbvio exemplo de ficção, o segundo é real. Mas o tempo de resposta e fluidez do segundo nada deve ao primeiro. E até faz sarcasmo.

Este foi só um exemplo: A IA do GPT-4o também nos conta histórias de embalar com “batatas mágicas”, faz traduções em tempo real, participa em reuniões de equipa no Zoom, dá explicações de matemática ao filho do fundador da Khan Academy, canta e encanta até consegue dizer se o Rei Carlos está ou não no Palácio de Buckingham.

Aplicação do ChatGPT a correr **GPT-4o** num Mac / © OpenAI

As críticas…

A OpenAI diz que o GPT-4o foi submetido a uma “extensa avaliação” de uma equipa com mais de 70 peritos externos em domínios como a psicologia social, a parcialidade e a equidade e a desinformação, “a fim de identificar os riscos que são introduzidos ou amplificados pelas novas modalidades adicionadas”. Mas poucos dias depois de o modelo ter sido anunciado, a empresa voltou a sentir ventos de turbulência e a ser notícia por motivos que não dizem respeito às novidades dos seus produtos.

Jeff Boudier, da Hugging Face, foi um dos que mostrou preocupação com estes avanços porque sente que a sociedade não está preparada para ligar com as repercussões. Isto é, apesar de assumir que estava impressionando com a tecnologia, à agência France-Press (AFP) lembrou que “as pessoas correm o risco de projetar qualidades nos modelos e de se tornarem emocionalmente apegadas” (como, de resto, se verificou com a personagem de Phoenix em “Her”).

…e as saídas

A OpenAI nasceu como empresa sem fins lucrativos e foi fundada para proteger o mundo dos perigos da IA, mas Sam Altman tem-se desviado dessa missão e lançado produtos a uma velocidade alucinante — algo que tem gerado desconforto interno e tem levado a saídas de quadros importantes. As de Ilya Sutskever, cofundador e cientista-chefe e uma das pessoas que esteve na origem da novela do afastamento de Altman há uns meses, e a de Jan Leike, ex-investigador da DeepMind, foram as mais notórias.

Mas mais do que lidar com as saídas de mentes que ajudaram a desenvolver os projetos de ouro da casa – ChatGPT e GPT-4 -, Sam Altman vai ter responder nos próximos tempos às preocupações de todos aqueles – dentro e fora da empresa – que estão a questionar o compromisso da OpenAI com a segurança. É que dois dias depois da saída de Ilya Sutskever, a OpenAI desmantelou a equipa “Superalignment”, que estava encarregue de garantir que a inteligência artificial geral (AGI) não se volta contra a humanidade.

Segundo a Axios, a convicção de Altman é a de que a IA precisa de ser rapidamente difundida e utilizada — já, no agora, porque na sua opinião, só assim é que a sociedade vai conseguir beneficiar da tecnologia e adaptar-se à mudança, que é inevitável.

Subscreva a nossa newsletter NEXT, onde todas as segundas-feiras pode ler as melhores histórias do mundo da inovação e das empresas em Portugal e lá fora.