Inteligência Artificial: quem é o verdadeiro artista?
por Luís Sarmento | 27 de Janeiro, 2023
Há 25 anos discutíamos Photoshop, hoje discutimos sistemas como DALL-E, Stable Diffusion ou Midjourney. E continuamos a confundir criatividade com autoria.
1. O computador é uma máquina que não perdoa
Há quase 40 anos que programo computadores. E uma coisa muito engraçada nestas décadas de experiência é que, sempre que havia alguma coisa que não batia certo num programa que estava a desenvolver, quem estava certo era o computador e não eu. Sempre! Isto é muito curioso, e talvez não seja tão visível noutras áreas, mas o computador acaba por ser uma máquina implacável, que está sempre certo.
Há, por isso, uma certa pressão psicológica sobre os programadores. Se calhar, talvez seja essa uma das razões para as suas estereotípicas incapacidades sociais, timidez ou até falta de confiança. Estamos sempre a apanhar porrada de uma máquina. Não sei qual o impacto que lidar com uma máquina que nos vence sempre pode ter na psicologia das pessoas. Mas olhando para trás acredito que tem algum. Acredito que a minha própria personalidade tem muito a ver com o facto de ter trabalhado sempre com uma máquina que nunca está errada.
De facto, o computador talvez seja, de todos os instrumentos, de todos os objetos que existem, aquele que terá absorvido mais produtos da inteligência humana. No hardware e no software, nos sistemas operativos e nas aplicações, o computador absorveu o esforço de milhões e milhões de pessoas super-inteligentes que condensaram toda a sua inteligência numa caixinha mágica. E, apesar de muitas vezes nos esquecermos disso, são essas caixinhas que estão por trás do que chamamos de Inteligência Artificial.
Por isso é que eu prefiro termo “Inteligência Condensada” em vez de “Inteligência Artificial”: gerações de pessoas inteligentes destilaram e condensaram incrementalmente a sua inteligência num “objetozinho”. Como é que eu, um “programador anónimo”, poderia alguma vez “vencer” uma máquina criada e refinada por milhões de pessoas ao longo de várias gerações? De vez em quando tento, humildemente, lembrar-me disso para não ficar a sentir-me muito mal. Mas como já ando há quase 40 anos nisto, acho que já estou habituado…
2. Grão a grão
Talvez por ter acompanhado mais de próximo a evolução do Processamento de Linguagem Natural (PLN) nestes últimos anos, não fiquei assim tão impressionado com o sucesso do ChatGPT. Tenho acompanhado a construção e desenvolvimento de cada um dos componentes que compõem estes sistemas. Começaram todos como coisas muito pequeninas, muito ingénuas. Foram evoluindo lentamente, talvez apenas com a exceção de um ou outro raro salto conceptual, até se tornarem nos sistemas sofisticada que agora vemos. E é importante perceber que o ChatGPT não resulta só de um avanço da Inteligência Artificial: eIe é também produto de um avanço de todo o ecossistema computacional, que inclui uma enorme variedade de componentes, desde o hardware até a uma panóplia de ferramentas de software.
Porque acompanhei menos o respetivo percurso, estou muito mais “impressionado” com sistemas de geração de imagem a partir de texto, como o DALL-E ou o Midjourney. Claro que, numa inspeção mais cuidado, volto a constatar que estes grandes sistemas de geração de imagem são compostos por pequenos blocos que resultam da acumulação de muitos pequenos passos dados por muitas pessoas ao longo de muitos anos. Este encadear de pequenos avanços técnicos é particularmente interessante quando os colocamos no contexto das discussões que estão a acontecer nas comunidades artísticas e filosóficas acerca destes modelos, do seu uso, e de questões acerca da essência da criatividade.
Eu vejo aqui imensas questões difíceis. Comecemos por reparar que quando falamos de modelos de PLN, como o ChatGPT, todos temos a capacidade de sermos críticos ferozes, bastando-nos olhar para a linguagem produzida por estes sistemas para rapidamente detetarmos a presença de um erro, de uma inverdade ou de algo estranho. Mas quando estamos a trabalhar no domínio da imagem, a avaliação é muito mais subjetiva: como sabemos se uma imagem destas é “boa” ou não do ponto de vista de criatividade? Muitas destas imagens produzidas automaticamente são, perante o meu olho destreinado, espetaculares e “criativas”. E isto, levanta questões que me parecem muito difíceis de resolver sobre o que é ou não a essência da criatividade, e se estes modelos podem ser considerados uma ameaça aos artistas.
3. Déjà vu
Há quase 25 anos, o meu primeiro emprego foi dar aulas de tecnologia numa escola de artes. Nessa altura estávamos no meio de um grande boom daquilo que se chama Desktop Publishing. Tratava-se de ferramentas como o Photoshop, o Pagemaker e coisas do género, que permitiam às pessoas criarem a sua própria revista ou jornal com aspeto profissional, de ponta a ponta. Foi revolucionário! O Photoshop, em particular, era uma ferramenta muito poderosa e vinha com uma biblioteca de filtros que permitiam fazer operações sobre as imagens com grande potencial artístico. Surgiu toda uma “nova” estética, a “estética Photoshop”, criada pelo facto de haver uma ferramenta poderosa que se tinha democratizado e que estimulou um grande experimentalismo visual.
Na altura, todo o processo de manipulação da imagem com o Photoshop era ainda muito manual, mas não deixava de ser potenciado por uma ferramenta digital. E já se discutia acerca de uma zona cinzenta na atribuição autoral. Nesse fim de milénio, não era claro se a autoria da imagem resultante do trabalho do artista com o Photoshop era exclusivamente dele, isto é do artista, ou se seria também, pelo menos em parte, dos engenheiros que tinham produzido aqueles filtros e possibilidades de manipulação computacional de imagem. Seria o Photoshop apenas como um “pincel”, um objeto inanimado que só participa num ato de criação pelas mãos do artista? Ou seria algo mais que isso, uma ferramenta que co-compõe com o artista e potencia uma estética própria que vem da sua natureza computacional?
Nesses anos idos, cunhou-se o termo “artistas de Photoshop”, usado para classificar pessoas que não eram verdadeiramente “artistas”, eram apenas “técnicos” de edição de imagem, nada criativos. Curiosamente, assisti a algo paralelo uns anos mais tarde com o boom das ferramentas edição 3D, em que o processo de geração de imagem ainda é mais sofisticado e envolve motores de simulação física e processo complexos de “renderização”, todos eles programados, e todos eles estimulando uma estética própria. Aliás, quando hoje vemos os créditos de um filme de animação da Pixar, podemos verificar que grande parte da equipa é composta por engenheiros, eles próprios usando tecnologias desenvolvidas ao longo de muitas décadas por enormes comunidades da área da computação.
25 anos depois, perante ferramentas como o Midjourney ou o DALL-E, não tenho a certeza se não estamos mais uma vez a assistir a uma repetição desta discussão. Pessoalmente, não acredito que haja “artistas de Photoshop”, como se falava há 25 anos, mas acredito em artistas com valor próprio e que usam todas as ferramentas digitais a que têm acesso para expandir as possibilidades de de criação e questionamento. Mas também acredito que o passo que nos irá levar à automatização completa da mera criação de imagens, e até de filmes, não é assim tão grande. Há aqui uma zona cinzenta e pantanosa que nos vai levantar muitas questões nos próximos tempos. Acredito que os artistas irão, como sempre, saber superar estes pântanos.
4. O verdadeiro artista
Uma coisa que para mim não é cinzenta é a questão da criatividade associada a estas imagens geradas automaticamente. Estou convicto que as imagens produzidas pelos métodos de IA, como o Midjourney, o DALL-E ou Stable Diffusion, são produtos criativos porque são o resultado de uma enorme cadeia de criatividade humana. Não podemos estar a falar de criatividade apenas quando se pensa na criação de uma imagem com um pincel ou na produção de uma música com um piano. Acho que devemos igualmente atribuir o dom da criatividade quando falamos da criação de certo tipo de software, e da forma como esse software foi desenhado, desenvolvido e treinado para produzir aquelas imagens que agora vemos: tudo isto é criatividade humana.
O que parece claro também é que as imagens geradas por IA não são o resultado da criatividade de uma única pessoa. O simples facto destes sistemas de IA serem treinados com imagens de autores humanos levanta imensas questões, mesmo que os sistemas automáticos gerem sempre algo diferente do que “viram” no seu treino. Como dizia o outro: um bom artista imita, um grande artista rouba. Será mesmo assim? Tal como no software, acho que a questão da autoria artística, individual ou coletiva, será cada vez mais difícil de estabelecer, e vai ocupar-nos por muito tempo, tanto filosoficamente como legalmente.