Nuno Guerreiro está cercado no seu trabalho de tecnologias de dimensão e volume de "exascale" (exa escala), ou seja, de dimensão computacional e volume de tratamento de dados gigantescos.
Se há alguém que hoje sente em cada segundo de trabalho o gigantesco aumento contínuo da capacidade da computação e o vertiginoso aumento da potência das várias tecnologias assentes em inteligência artificial (IA) é ele.
Com um mestrado em engenharia mecânica do Instituto Superior Técnico, obtido em 2019, para Nuno Guerreiro estar como está profissionalmente é ter um lugar diário no paraíso.
Guerreiro diz que acompanhou desde o início a explosão global e a potência da IA e não hesitou em arriscar tudo para trabalhar com a tecnologia, ganhando um estágio na Unbabel, que passou a posto de trabalho, e tendo terminado recentemente a sua tese de doutoramento na área.
O que o fascina na inteligência artificial, diz, é, por um lado, o paradigma que esta tecnologia "nos permita aproximar da origem da inteligência", e, por outro lado o facto de aquela possuir "modelos de interpretação de dados que resolvem rapidamente tarefas que são impossíveis de executar por nós", humanos.
Para o engenheiro, estas capacidades servem para "desenvolver um mundo melhor", acrescentando que esta força e esta capacidade podem ser aplicadas em todas as áreas da sociedade e da vida, se o trabalho dos peritos estiver direcionado para este sentido.
O seu trabalho com tecnologia "exascale" está concentrado em dois projetos.
O primeiro, mais contínuo e vital para a sua empresa, é o Tower, um programa fundamental para a Unbabel de LLM multilingues destinado a tarefas de tradução, que Guerreiro, os seus líderes e os seus colegas tentam tornar o mais eficaz possível.
O Tower usa como origem o LLM LLaMA2, e foi formatado para traduzir em inglês, alemão, francês, espanhol, chinês, português, italiano, russo, coreano e holandês.
No Tower, Guerreiro e a equipa a que pertence tentam, todos os dias, melhorar o desempenho da ferramenta.
Isto passa, entre outras, pelo desempenho de tarefas de avaliação da qualidade dos dados que são introduzidos no código, em tratar os dados para os adaptar a modelos de trabalho definidos, e em avaliar a qualidade que o Tower consegue na tradução, ou na execução de um "prompt", um guia de instrução endereçado à "máquina" que a coloca a realizar, neste, uma tarefa linguística.
Num resumo muito limitado, Guerreiro diz que o objetivo final é sempre o de tentar conseguir que o Tower produza traduções e textos com elevada qualidade.
O segundo projeto "exascale" onde Guerreiro e as equipas da Unbabel dedicadas estão envolvidos é uma enorme aposta da União Europeia.
Não querendo perder o comboio do estado da arte da IA, onde os Estados Unidos da América e a China estão na liderança, os Estados europeus pretendem levantar o EuroLLM, um modelo LLM de código aberto que suporte as vinte e quatro línguas oficiais europeias, e outras línguas de importância estratégica, como são a chinesa, a coreana, ou a russa.
Guerreiro diz que o EuroLLM, onde a Unbabel participa em consórcio com várias empresas e entidades de investigação europeias, incluindo portuguesas, destina-se a contribuir para um mundo onde a língua de comunicação entre pessoas, empresas e Estados não seja dominada pelo inglês, ou seja, diminuir o domínio de um mundo "english-centric".
A função dele e dos engenheiros e programadores envolvidos é criar no modelo a capacidade para produzir texto fiável e traduzir texto nas línguas já referidas, para processar e traduzir comunicação por voz, bem como outro tipo de tarefas relacionadas com linguagem.
Para atingirem os seus objetivos, os profissionais terão disponíveis 1,8 milhões de horas de processamento e 3 milhões de horas de computação num dos três supercomputadores europeus, situado em Barcelona.
O grande desafio, aponta o engenheiro, é exatamente o de conseguir que o modelo adquira capacidade para processar com a mesma eficiência todas as línguas, já que, em algumas delas, não existem dados em quantidade e qualidade como os disponíveis em inglês.
Digamos que Nuno Guerreiro e os seus pares nacionais e europeus estão envolvidos num desafio de tamanho "exascale".
Mas, com o seu entusiasmo e dedicação, e com os dos seus colegas, e sempre apoiados pelo tremendo poder de código e de processamento de dados gerado e suportado pela inteligência artificial, decerto que irão tornar realidade o EuroLLM.