E se o futuro da Inteligência Artificial fosse alojado em Portugal?
por Luís Sarmento | 3 de Abril, 2023
Os Large Language Models (LLMs), dos quais a “família” GPT é a mais conhecida, vieram para ficar. No entanto, uma das facetas menos abordadas, talvez por ser praticamente “invisível”, é o facto de toda a sua existência ser sustentada por infra-estruturas de supercomputação.
Os Large Language Models (LLMs), dos quais a “família” GPT é a mais conhecida, vieram para ficar. Muito se tem falado do impacto destes modelos em várias áreas de ciência e indústria, assim como dos seus supostos perigos societais. No entanto, uma das facetas menos abordadas, talvez por ser praticamente “invisível”, é o facto de toda a sua existência ser sustentada por infra-estruturas de supercomputação. Treinar, refinar e correr “em produção” estes modelos exige hardware caríssimo em quantidades colossais, cuja compra e manutenção não é para qualquer organização.
Têm sido reportados custos de “treino” destes modelos na ordem dos milhões de dólares (ver aqui e aqui). Estima-se que correr o ChatGPT (i.e. já depois de “treinado”) esteja a custar centenas de milhar de dólares por dia. Mesmo aplicando técnicas de destilação, compressão e esparsificação a estes modelos, que os tornarão mais económicos computacionalmente, não é disparatado estimar que, com o aumento do número utilizadores, manter aplicações construídas sobre estes grandes modelos possa custar milhões de dólares por dia.
Mas isto é só parte da história. Na realidade, o próprio processo de I&D que leva à criação destes mega modelos exige um enorme poder computacional, para que se possa realizar experimentação e teste em grande escala. Ou seja, o desenvolvimento da tecnologia base é também um processo tão caro que só um restrito grupo de “suspeitos do costume”, muito bem financiados, é que conseguirão fazer o progresso decisivo nesta área. A consequência é que, pelo menos para já, a linha da frente dos LLM e das tecnologias de IA Generativa é um jogo para os “grandes”.
Isto é preocupante do ponto de vista da perpetuação das desigualdades económicas a nível mundial, já que países atrasados em termos de recursos de supercomputação terão tendência para ficar cada vez mais atrasados nas tecnologias centrais de IA. E sendo as capacidades de IA consideradas chave para a economia (e já agora, para a defesa nacional), a questão das infra-estruturas computacionais nacionais deveria estar na ordem do dia.
Portugal tem deixado escapar oportunidades sucessivas de se tornar um país com uma economia assente em tecnologia. Temos preferido ser um país de turismo e de alojamento local, e de outros serviços que, infelizmente, geram uma economia de baixo valor acrescentado e, consequentemente, de empregos mal pagos. Mas a ascensão destes LLMs e de toda a corrente de IA Generativa pode ser uma nova oportunidade para Portugal. Que tal fazermos o “upgrade” de um país de alojamento local para “camones” para um país de alojamento de mega-modelos de IA?
Vamos a números
Portugal: sol, boas praias, boa comida e gente pacata. Pelo menos é esse o mito. E também um país que tem feito um percurso notável nas últimas décadas em termos da sua capacidade de produção de electricidade a partir de fontes renováveis. Segundo a APREN (Associação Portuguesa de Energias Renováveis) em 2022 foram gerados em Portugal Continental 44 059 GWh de eletricidade dos quais 56,9 % tiveram origem renovável. Só a produção eólica atingiu quase 30% do total. Estes números colocam Portugal na linha da frente dos países da UE27 em termos de percentagem de produção de electricidade de origem renovável.
Para um país que ao longo dos seus quase nove séculos de história foi sempre deficitário do ponto de vista energético, com consequências decisivas para o nosso endémico atraso industrial e tecnológico, estas estatísticas são encorajadoras. E representam também uma enorme vantagem competitiva para Portugal no tempo em que os data centers são as “forjas da IA”.
Mas vamos a mais números, e comecemos por coisas acessíveis. O GPT3 foi treinado em GPU’s da NVidia. Um GPU NVidia “caseiro”, daqueles que muitos “gamers” têm em casa, tem um consumo de cerca de 250W (por baixo). Ou seja, o consumo de um computador “normal”, que inclui CPU, GPU, motherboard, disco, ventoinhas, etc, poderá consumir cerca de 500W. Logo, a potência de consumo de dois computadores equivale aproximadamente a um forno micro-ondas normal.
Obviamente, o GTP3 não foi treinado nestes GPUs caseiros, mas sim em GPUs V100 bem mais poderosos e eficientes energeticamente (mas também muito mais caros). Mesmo assim, cada GPU V100 consome cerca de 300W. Segundo dados da Microsoft, que em 2020 forneceu à OpenAI o data center para treinar o GPT3, foram usados mais de 10000 GPUs para treinar este modelo. Isto já nos coloca na escala dos 3 MW só em potência elétrica para os GPUs. Se incluirmos todos os outros componentes envolvidos para que este processo de treino fosse possível (CPU, rede, armazenamento, refrigeração, equipamentos de apoio e segurança, etc), estamos a falar provavelmente de potências de 10 MW. E relembramos que o treino deverá ter demorado quase de duas semanas.
treinar o GPT3 deverá ter consumido tanta energia como 400 restaurantes a operar 24h/24h durante duas semanas.
Mais um facto interessante: a potência contratada aconselhada para manter um restaurante é de 27,6 kVA. A conversão deste valor de kVAs para kW depende do chamado factor de potência, mas para simplificar a análise iremos dizer que o valor 27.6kVA corresponderá aproximadamente a 25kW. Logo, treinar o GPT3 deverá ter consumido tanta energia como 400 restaurantes a operar 24h/24h durante duas semanas. Vale a pena mastigar isto com calma.
Uma forja para o futuro da IA
E se Portugal se tornasse um país com dezenas de data centers, cuja procura irá provavelmente aumentar consistentemente nos próximos anos? E se tivéssemos como objetivo tornar-nos um país que, pelo seu perfil energético verde, pudesse vir a ser uma das “forjas da IA” verdes? Não seríamos, certamente, o primeiro país a tentar seguir um tal rumo, já que a Irlanda embarcou numa trajetória semelhante há vários anos, com cerca de 14% do seu consumo elétrico a ser feito em data centers. Mas poderíamos seguir o exemplo, e ser um país que se destaca por ser um contribuidor mais ecológico para uma revolução que é imparável.
A questão da electricidade verde para suportar data centers e infraestruturas de super computação não é uma questão menor. A pegada ecológica destas infraestruturas é absolutamente central para o futuro desta tecnologia. Não é por acaso que vários dos grandes players da indústria computacional estabeleceram um pacto para atingir a neutralidade climática em 2030. Estas exigências são uma oportunidade para Portugal.
E este seria o mote para ajudar a desenvolver em Portugal uma nova área da economia de elevadíssimo valor acrescentado. De facto, montar data centers é uma tarefa complexa, que envolve competências que vão para além da simples colocação de computadores a funcionar em rede. A criação de um data center de grande escala inclui o desenho de edifícios especializados, a concepção de uma infra-estrutura de segurança física contra o mais diverso tipo de ameaças, o desenvolvimento de um complexo sistema de refrigeração, a criação de uma infraestrutura de alimentação eléctrica altamente robusta, e com vários níveis de redundância, a instalação de robots para substituição automática dos componentes que vão estragando, e toda uma série de outras facetas com elevado nível de sofisticação.
Obviamente, a posterior manutenção diária dos data centers envolve uma panóplia de competências. Será necessária uma equipa de administração de sistemas e operações, e de desenvolvimento software para serviços que se tornam necessários assegurar. Será necessário desenvolver uma cadeia de fornecimento, reparação de hardware, assim como de reciclagem dos equipamentos que se vão tornando obsoletos. Tudo isto gera empregos bem pagos. E acima de tudo gera uma escola prática numa área chave e um berço de ideias para projectos de I&D e para novas empresas.
Não precisamos desfazer o mito, mas podemos desfazer o enguiço do atraso endémico. Podemos e devemos continuar a ser um país de sol, de boas praias e excelente comida. Um país que recebe bem os turistas e os aloja em locais belíssimos. Mas podemos ser mais ambiciosos. Não gastemos todo o nosso talento — e valiosa energia — a alojar turistas. Que tal investirmos também em alojar futuro da IA? Os nossos filhos merecem não só um país mais avançado como também acesso a melhores empregos em Portugal.