## Reddit vs. Anthropic: A Batalha Ética pela Alma da Inteligência Artificial
O Reddit acusa a Anthropic, empresa de IA, de construir seus modelos Claude às custas dos usuários do Reddit, sem permissão e sem a devida compensação. A alegação é que a Anthropic estaria usando dados do Reddit para treinar seus modelos de IA, sem ter um acordo formal para isso.
O Reddit argumenta que qualquer pessoa que utilize a plataforma, inclusive bots, concorda com os termos de uso, que proíbem a utilização do conteúdo do site para fins comerciais sem um acordo por escrito. A acusação é que os bots da Anthropic estariam coletando conversas e posts em grande escala para treinar e aprimorar o Claude.
O processo é particularmente interessante devido à reputação da Anthropic. A empresa se posiciona como uma empresa de IA ética e confiável, mas o Reddit questiona essa imagem, chamando-a de "truque de marketing vazio".
O Reddit alega que a Anthropic afirmou ter interrompido a coleta de dados do Reddit em julho de 2024, mas o Reddit afirma ter evidências de que os bots da Anthropic tentaram acessar o site mais de cem mil vezes nos meses seguintes.
A questão central é a privacidade dos usuários. Quando um usuário exclui um post ou comentário no Reddit, espera que ele seja removido permanentemente. O Reddit tem acordos com outras empresas de IA, como Google e OpenAI, que incluem medidas técnicas para garantir que o conteúdo excluído pelos usuários também seja removido dos dados de treinamento da IA.
O Reddit alega que a Anthropic não possui um acordo semelhante e se recusou a firmar um. Isso significa que, se a IA da Anthropic foi treinada com um post que um usuário excluiu posteriormente, esse conteúdo ainda pode estar presente na base de conhecimento do Claude, ignorando a escolha do usuário de removê-lo.
O Reddit busca uma liminar para impedir a Anthropic de usar os dados do Reddit imediatamente, além de proibi-la de vender ou licenciar qualquer produto construído com esses dados. Isso poderia significar a retirada do Claude do mercado.
Este caso levanta uma questão importante: o fato de um conteúdo estar "disponível publicamente" na internet significa que ele pode ser usado por qualquer empresa para fins comerciais? O Reddit argumenta que não, e o resultado desse caso pode mudar as regras do desenvolvimento de IA.