Um novo e significativo player acaba de entrar no cenário global de inteligência artificial generativa. Uma colaboração entre a EPFL, a ETH Zurich e o Centro Suíço de Supercomputação (CSCS) resultou no Apertus, o primeiro modelo de linguagem de grande escala aberto e multilíngue da Suíça.
Uma IA realmente aberta
O projeto representa um marco importante no movimento por mais transparência e diversidade na IA. Seu nome, que significa “aberto” em latim, reflete sua característica mais distintiva: todo o processo de desenvolvimento, incluindo arquitetura, pesos do modelo, dados de treinamento e receitas, é acessível de forma aberta e totalmente documentado, garantindo reprodutibilidade completa.
O Apertus foi treinado em um corpus de 15 trilhões de tokens, abrangendo mais de 1.000 línguas. Dando um passo importante para combater o viés anglófono comum nesse campo, uma porção de 40% desses dados é composta por idiomas não-ingleses. Isso inclui línguas historicamente sub-representadas em LLMs, como o suíço-alemão e o romanche, além de inúmeros outros idiomas de todas as partes do mundo.
Disponibilizado em dois tamanhos (8 bilhões e 70 bilhões de parâmetros), o modelo é lançado sob um misto de licenças mais ou menos permissivas, permitindo uso livre em educação, pesquisa e uma ampla gama de aplicações comerciais e sociais. Ele serve como um bloco de construção para desenvolvedores e organizações criarem aplicações, como chatbots, sistemas de tradução e ferramentas educacionais.
Soberania digital
O compromisso com a ética e conformidade legal é um pilar do projeto. O Apertus foi desenvolvido em estrita consideração às leis suíças de proteção de dados e direitos autorais, bem como às obrigações de transparência da Lei de IA da UE. Seu material de treinamento é composto apenas por dados publicamente disponíveis, meticulosamente filtrados para respeitar pedidos de opt-out, remover dados pessoais e conteúdo indesejado antes do treinamento.
O modelo já está disponível para download na plataforma Hugging Face e pode ser testado em uma interface de chat no site PublicAI, oferecendo respostas pouco satisfatórias em nossos testes em português. Seu lançamento insere a Suíça como uma força competitiva e no cenário global de IA, defendendo os princípios de abertura, diversidade linguística e responsabilidade ética. Esta é mais uma iniciativa Europeia em busca de soberania digital, conceito que vem ganhando cada vez mais relevância.




