Imagine a cena: uma das maiores empresas de tecnologia do mundo, dona do Facebook, Instagram e WhatsApp, baixando torrents de livros piratas para treinar sua inteligência artificial. É a realidade da Meta, que está no centro de uma polêmica envolvendo direitos autorais, pirataria e ética corporativa. Vamos desvendar essa história, que mistura tecnologia, leis e uma pitada de ironia.
A Meta usou livros piratas para treinar IA?
A polêmica veio à tona em janeiro de 2025, quando autores como Richard Kadrey (de Sandman Slim), Christopher Golden (conhecido por adaptações literárias de séries como Buffy: A Caça-Vampiros) e a comediante Sarah Silverman entraram com um processo contra a Meta. Qual acusação? A empresa teria usado milhões de livros protegidos por direitos autorais, obtidos ilegalmente de plataformas como LibGen e Z-Library, para treinar seu modelo de IA generativa, o Llama.
Segundo documentos judiciais recentemente divulgados, a Meta baixou pelo menos 81,7 TB de dados de bibliotecas “sombrias” (as famosas shadow libraries), incluindo 35,7 TB da Z-Library e da LibGen. E, em uma ocasião anterior, teria baixado outros 80,6 TB da LibGen. Tudo isso usando o protocolo BitTorrent, que, além de permitir o download, também faz com que o usuário compartilhe os arquivos com outros — o que, em tese, configuraria distribuição ilegal.
Os e-mails internos da Meta, agora públicos, mostram que os funcionários sabiam que estavam lidando com material pirata. Em uma das mensagens, um engenheiro de pesquisa da empresa, Nikolay Bashlykov, expressou preocupação: “Fazer torrenting de um laptop corporativo não parece certo”, escreveu ele, acompanhando a frase com um emoji sorridente. Em outro e-mail, ele foi mais direto: “Usar torrents envolve ‘semear’ os arquivos — ou seja, compartilhar o conteúdo externamente. Isso pode não ser legalmente OK.”
Apesar dos alertas, a Meta seguiu em frente com os downloads, tomando medidas para esconder sua atividade, como evitar o uso de servidores do Facebook e ajustar as configurações para minimizar o compartilhamento de arquivos. Tudo isso em um esforço que um funcionário descreveu como operando em “modo stealth”.
“Fair use” e falta de provas
A Meta não nega ter usado os livros para treinar sua IA, mas alega que o fez sob a doutrina do “fair use” (uso justo), que permite o uso limitado de material protegido por direitos autorais sem permissão, desde que seja para fins transformadores, como a criação de algo novo. Além disso, a empresa argumenta que os autores não apresentaram provas concretas de que seus livros foram distribuídos pela Meta via torrent.
No entanto, os autores rebatem: “A magnitude do esquema de pirataria da Meta é impressionante”, dizem em documentos judiciais. Eles destacam que até mesmo atos menores de pirataria já resultaram em investigações criminais, sugerindo que a Meta não deveria ser tratada com leniência.
Outro ponto polêmico é o envolvimento de Mark Zuckerberg na decisão de usar a LibGen. Inicialmente, o CEO da Meta negou qualquer participação, mas e-mails divulgados mostram que a decisão foi escalada para ele, referido internamente como “MZ”. Isso coloca Zuckerberg no centro da controvérsia, levantando questões sobre sua responsabilidade direta nas ações da empresa.
Esse caso vai além da Meta e dos livros piratas. Ele levanta questões importantes sobre como as empresas de tecnologia estão treinando suas IAs e quais limites éticos e legais devem ser respeitados. Se a Meta for considerada culpada, isso pode estabelecer um precedente significativo para outras empresas que dependem de grandes volumes de dados para desenvolver suas tecnologias.
Por outro lado, se a Meta conseguir se safar com o argumento do “fair use”, isso pode abrir um precedente onde o uso de material protegido por direitos autorais se torne ainda mais comum no desenvolvimento de IA.
A história da Meta e seus 81,7 TB de livros piratas é, no mínimo, curiosa. De um lado, temos uma empresa que parece ter arriscado sua reputação para avançar no desenvolvimento de IA. De outro, temos autores que veem seu trabalho sendo usado sem consentimento ou compensação.
E você, o que acha? A Meta cruzou a linha, ou o “fair use” justifica o uso de livros piratas para treinar IA? Deixe sua opinião nos comentários e interaja com a comunidade do fórum Diolinux Plus!