Você já deve ter esbarrado na internet com aquele meme famoso do “Dois pesos, duas medidas” que acaba de nos ser enviado. De um lado, um jovem prodígio da programação que baixou milhares de artigos acadêmicos para distribuir de graça e acabou enfrentando a fúria implacável da justiça. Do outro, um dos homens mais ricos do mundo, cuja empresa sugou dezenas de terabytes de livros pirateados para treinar sua Inteligência Artificial, mas que continua jantando com chefes de Estado e bilionários como se nada tivesse acontecido.
Parece um roteiro distópico sobre como o sistema funciona para os peixes pequenos em comparação aos tubarões do Vale do Silício. Mas, prepare-se, porque a realidade por trás dessa imagem é ainda mais revoltante do que a internet consegue resumir em poucas linhas. Parece ficção, mas Isso Existe… e os detalhes são de cair o queixo.
Para entender essa discrepância bizarra, precisamos voltar a 2011 e lembrar de Aaron Swartz. Co-criador do formato RSS e fundamental nos primórdios do Reddit, Swartz não era apenas um gênio da informática; ele era um “hacktivista” movido por uma crença inabalável de que o conhecimento humano deveria ser livre e acessível a todos, independentemente de contas bancárias ou afiliações universitárias de elite. Foi com essa mentalidade que ele conectou um notebook em um armário de fiação do Massachusetts Institute of Technology (MIT) e fez o download de cerca de 4,8 milhões de artigos acadêmicos do repositório pago JSTOR. A ideia? Libertar esses papers científicos das “muralhas de pagamento” (paywalls) e distribuí-los gratuitamente para a humanidade.

A reação do governo dos Estados Unidos foi de uma ferocidade desproporcional. Promotores federais enquadraram Swartz na severa Lei de Fraude e Abuso de Computadores (CFAA). Eles o acusaram de múltiplos crimes federais, empilhando denúncias que, somadas, poderiam resultar em uma pena assombrosa de 35 anos de prisão em segurança máxima, além de multas de 1 milhão de dólares. O JSTOR chegou a retirar as queixas civis após reaver os arquivos, mas a promotoria federal insistiu em usar o jovem como um “exemplo” contra a pirataria digital. A pressão psicológica e financeira do julgamento iminente foi esmagadora. Em 11 de janeiro de 2013, aos 26 anos, Aaron Swartz tragicamente tirou a própria vida. O sistema o esmagou por tentar compartilhar PDFs.
Avançamos agora para a atualidade e a era da corrida pelo ouro da Inteligência Artificial. No centro do palco está a Meta, o império digital de Mark Zuckerberg. Para que modelos de linguagem massivos (como o LLaMA) aprendam a falar, escrever e raciocinar, eles precisam ser “alimentados” com quantidades oceânicas de texto humano. E onde você arruma tanto texto de qualidade da noite para o dia? Em livros, é claro. E é aqui que a balança da justiça começa a pender de forma vergonhosa.
Documentos internos revelados recentemente em processos judiciais movidos por autores e editoras (incluindo figuras como a comediante Sarah Silverman e o jornalista Ta-Nehisi Coates) mostraram que a Meta não foi exatamente à livraria pagar pelo que consumiu. O meme menciona mais de 70 terabytes, mas os laudos judiciais são ainda piores: a empresa baixou o equivalente a pelo menos 81,7 terabytes de dados do Library Genesis (LibGen), um dos maiores repositórios de pirataria do mundo, através de torrents. Pior ainda: e-mails internos confirmam que executivos e o próprio Zuckerberg sabiam que o material era pirateado, mas teriam decidido prosseguir mesmo assim, ignorando os direitos autorais para não ficar para trás na corrida da IA.

A disparidade no tratamento é o que torna a imagem tão dolorosamente real. Quando Aaron Swartz copiou dados para democratizar o acesso à ciência sem fins lucrativos, o Estado mobilizou sua força máxima para trancafiá-lo por décadas, tratando-o como um inimigo público. Quando a Meta de Zuckerberg fez o download de um volume incalculavelmente maior de obras protegidas por direitos autorais — ciente da ilegalidade — para treinar um produto estritamente comercial que gerará bilhões de dólares, a resposta criminal do Estado foi: silêncio absoluto. Até o momento, o caso da Meta está restrito à esfera civil (processos por perdas e danos). Não há agentes federais invadindo sedes, não há promotores ameaçando Zuckerberg com 35 anos de cadeia, nem risco de falência pessoal.
Isso Existe?! Para você ter uma ideia do absurdo dessa escala: um e-book comum, apenas com texto, pesa em média entre 1 e 2 Megabytes. Se fizermos uma matemática básica, 81,7 Terabytes equivalem a algo entre 40 milhões e 80 milhões de livros pirateados! É literalmente mais texto do que qualquer ser humano conseguiria ler em mil vidas, engolido pelos servidores da Meta sem que um único centavo fosse pago aos seus criadores originais. E acredite, Isso Existe!
No fim das contas, a triste lição que a história recente nos ensina é que a gravidade de um “crime digital” muitas vezes não é medida pela ação em si, mas pelo saldo bancário e pelo poder de influência corporativa de quem aperta o botão de “Download”. Aaron Swartz foi martirizado por tentar abrir a biblioteca da humanidade. Hoje, os gigantes da tecnologia saqueiam essa mesma biblioteca para vender o acesso de volta para nós, embalado como um chat inteligente. E, enquanto isso, a vida (e o lucro) segue normalmente no topo da pirâmide.
Você acha que algum dia veremos leis rigorosas punindo grandes corporações com o mesmo peso que punem indivíduos comuns, ou a impunidade digital continuará sendo um luxo para os bilionários?
Fontes: The Guardian: Reddit co-founder accused of stealing 4.8m JSTOR documents from MIT The Jakarta Post: Meta knew it used pirated books to train AI, authors say One Man & His Blog: Meta pirated books — and trained AI on them.
