Conteúdo mostrar

Enquanto a indústria de tecnologia nos convence de que precisamos do hardware mais recente para qualquer tarefa, um grupo de pesquisadores da EXO Labs resolveu desafiar essa lógica. Eles pegaram um computador de 1997, equipado com um processador Pentium II com míseros 128 MB de RAM, e fizeram algo que muitos considerariam impossível: rodar um modelo de linguagem moderno baseado no Llama 2.

Se você está imaginando uma máquina engasgando e travando a cada comando, prepare-se para se surpreender. O experimento não só funcionou, como alcançou uma velocidade respeitável de 39,31 tokens por segundo – o suficiente para gerar textos coerentes sem fazer o usuário envelhecer enquanto espera.

O hardware que (quase) virou museu

O protagonista dessa história é um computador Elonex com um Pentium II de 350 MHz, 128 MB de RAM e um disco rígido de 1,6 GB – sim, menos espaço que um único episódio de série em qualidade HD hoje em dia. Para completar, o sistema operacional era o Windows 98, um software que já era considerado ultrapassado quando os computadores se popularizaram no Brasil.

Um computador de 1997 rodou um modelo moderno de inteligência artificial (1) — Imagem: EXO Labs

Os desafios começaram antes mesmo de instalar qualquer modelo de IA. Primeiro, os pesquisadores descobriram que periféricos modernos, como teclados e mouses USB, simplesmente não funcionavam. A solução foi recorrer aos antigos conectores PS/2.

Um computador de 1997 rodou um modelo moderno de inteligência artificial (2) — Imagem: EXO Labs

Transferindo arquivos como em 1999

Com o hardware funcionando, veio o próximo obstáculo: como transferir os arquivos necessários para um computador que não reconhece pendrives modernos nem discos de grande capacidade? A resposta foi tão retrô quanto a máquina em si: FTP.

Usando um servidor FTP no MacBook Pro de um dos pesquisadores e uma conexão Ethernet (com adaptador USB-C, porque ironias tecnológicas são inevitáveis), os arquivos foram transferidos linha por linha. E aqui vai uma curiosidade: executáveis só rodavam se transferidos em modo binário.

Um computador de 1997 rodou um modelo moderno de inteligência artificial (3) — Imagem: EXO Labs

Se engana quem pensa que o maior desafio foi o hardware. O software também impôs suas barreiras. Compilar código moderno em um ambiente tão antigo exigiu criatividade. A solução foi usar o Borland C++ 5.02, um ambiente de desenvolvimento que já era velho quando o Windows XP foi lançado.

O código escolhido foi o llama2.c, uma implementação minimalista do Llama 2 em apenas 700 linhas de C puro, criada por Andrej Karpathy (ex-diretor de IA da Tesla e um dos fundadores da OpenAI). Mesmo assim, ajustes foram necessários:

Substituir long long por DLONGWORD (porque o compilador não reconhecia tipos modernos);
Declarar todas as variáveis no início das funções;

Trocar clock_gettime por GetTickCount().

Um computador de 1997 rodou um modelo moderno de inteligência artificial (5) — Imagem: EXO Labs

Depois de algumas horas de ajustes, o milagre aconteceu: um modelo de 260 mil parâmetros rodando a quase 40 tokens por segundo em um Pentium II.

Um computador de 1997 rodou um modelo moderno de inteligência artificial (4) — Imagem: EXO Labs

A revolução que permite IA em hardware antigo

Mas como um computador que mal conseguia rodar Age of Empires consegue processar um modelo de linguagem? A resposta está no BitNet, uma arquitetura de rede neural que usa pesos ternários (-1, 0, 1) em vez dos tradicionais valores de ponto flutuante.

Essa abordagem reduz drasticamente o tamanho e a complexidade dos modelos. Enquanto um Llama 2 tradicional de 7 bilhões de parâmetros ocuparia dezenas de gigabytes, uma versão em BitNet caberia em apenas 1,38 GB. Isso não só permite rodar IA em hardware antigo, como também reduz o consumo de energia e abre portas para modelos maiores em CPUs modestas.

Segundo a EXO Labs, responsável pelo projeto, um modelo de 100 bilhões de parâmetros poderia rodar em uma única CPU comum, gerando texto em velocidade próxima à da leitura humana.

Além do feito técnico, esse experimento tem implicações práticas importantes:

Democratização da IA: Países em desenvolvimento, escolas e pequenas empresas poderiam usar inteligência artificial sem depender de hardware caro;
Sustentabilidade: Reutilizar máquinas antigas reduz o lixo eletrônico e a pegada de carbono da fabricação de novos equipamentos;
Eficiência energética: Modelos otimizados consomem menos energia, tornando a IA mais viável em larga escala.

Se um Pentium II de 1997 consegue rodar um modelo de linguagem, talvez estejamos subestimando o potencial do hardware que já temos. E quem sabe, no futuro, a próxima grande inovação em IA não venha de um supercomputador, mas de uma velha máquina esquecida no fundo de uma garagem.

Fique por dentro das principais notícias da semana sobre tecnologia e Linux: receba nossa newsletter!

Um computador de 1997 rodou um modelo moderno de inteligência artificial

O hardware que (quase) virou museu

Transferindo arquivos como em 1999

A revolução que permite IA em hardware antigo

Confira o novo Diocast!

Xbox Portátil chegou! SteamDeck já era? - Diocast

Imperdíveis da semana

Ubuntu dá adeus definitivo ao Xorg

Xbox Portátil chegou! SteamDeck já era? - Diocast

Samsung DeX: o computador que mora no seu bolso

O Steam OS está revolucionando o mercado de games

Ubuntu Touch OTA-9 traz melhorias no VoLTE e atualizações no Waydroid

Ariel Bonfim

Sobre o autor