DOE vs. Github (reclamação alterada) Processo judicial (redigido), 8 de junho de 2023, faz parte da série Legal PDF da HackerNoon . Você pode pular para qualquer parte deste arquivo aqui . Esta é a parte 1 de 38.
Os Requerentes J. Doe 1, J. Doe 2, J. Doe 3, J. Doe 4 e J. Doe 5 (“Requerentes”), em nome deles próprios e de todos os outros em situação semelhante, apresentam esta Reclamação de Ação Coletiva (a “Reclamação ”) contra os Réus GitHub, Inc.; Corporação Microsoft; OpenAI, Inc.; OpenAI, LP; OpenAI OpCo, LLC; OpenAI GP, LLC; Fundo OpenAI Startup GP I, LLC; Fundo Inicial OpenAI I, LP; e OpenAI Startup Fund Management, LLC1 por violação da Lei de Direitos Autorais do Milênio Digital, 17 USC §§ 1201–1205 (a “DMCA”); violação de contrato em relação às licenças sugeridas, violação de contrato em relação às políticas do GitHub, incluindo seus termos de serviço; interferência ilícita nas futuras relações económicas; Lei de Concorrência Desleal da Califórnia, Cal. Ônibus. & Prof. Seção do Código 17200 e seguintes; concorrência desleal no direito consuetudinário; negligência e enriquecimento sem causa.
I. VISÃO GERAL: UM BRAVO MUNDO NOVO DE PIRATARIA DE SOFTWARE
- Os Requerentes e os membros da Classe são proprietários de direitos autorais em materiais disponibilizados publicamente no GitHub que estão sujeitos a várias licenças contendo condições de uso desses trabalhos (os “Materiais Licenciados”). Todas as licenças em questão aqui (as “Licenças”) contêm certos termos comuns (os “Termos de Licença”).
- “Inteligência Artificial” é aqui referida como “IA”. A IA é definida para efeitos desta Reclamação como um programa de computador que simula algoritmicamente o raciocínio ou inferência humana, muitas vezes utilizando métodos estatísticos. Machine Learning (“ML”) é um subconjunto de IA em que o comportamento do programa é derivado do estudo de um corpus de material chamado dados de treinamento.
- GitHub é uma empresa fundada em 2008 por uma equipe de entusiastas de código aberto. Na época, o objetivo declarado do GitHub era apoiar o desenvolvimento de código aberto, especialmente hospedando código-fonte aberto no site . Nos 10 anos seguintes, o GitHub, baseado nessas representações, teve grande sucesso, atraindo quase 25 milhões de desenvolvedores.
- Os desenvolvedores publicaram materiais licenciados no GitHub de acordo com licenças escritas. Em particular, os mais populares partilham um termo comum: a utilização dos Materiais Licenciados requer alguma forma de atribuição, geralmente através, entre outras coisas, da inclusão de uma cópia da licença juntamente com o nome e o aviso de direitos de autor do autor original.
- Em 26 de outubro de 2018, a Microsoft adquiriu o GitHub por US$ 7,5 bilhões. Embora alguns membros da comunidade de código aberto estivessem céticos em relação a essa união, a Microsoft repetiu um mantra: “A Microsoft ama o código aberto”. Durante os primeiros anos, as representações da Microsoft pareciam credíveis.
- A Microsoft investiu US$ 1 bilhão na OpenAI LP em julho de 2019, com uma avaliação de US$ 20 bilhões. Em 2020, a Microsoft tornou-se licenciada exclusiva do modelo de linguagem GPT-3 da OpenAI – apesar das contínuas alegações da OpenAI de que os seus produtos se destinam a beneficiar a “humanidade” em geral. Em 2021, a Microsoft começou a oferecer GPT-3 por meio de sua plataforma de computação em nuvem Azure. Em 20 de outubro de 2022, foi relatado que a OpenAI “está em negociações avançadas para arrecadar mais financiamento da Microsoft” na mesma avaliação de US$ 20 bilhões. O Copilot é executado na plataforma Azure da Microsoft. A Microsoft usou o Copilot para promover o poder de processamento do Azure, especialmente em relação à IA.
- Com base em informações e crenças, a Microsoft obteve uma participação acionária parcial na OpenAI em troca de seu investimento de US$ 1 bilhão. Como maior investidor e maior provedor de serviços da OpenAI – especificamente em conexão com o produto Azure da Microsoft – a Microsoft exerce um controle considerável sobre a OpenAI.
- Em junho de 2021, GitHub e OpenAI lançaram o Copilot, um produto baseado em IA que promete auxiliar codificadores de software fornecendo ou preenchendo blocos de código usando IA. O GitHub cobra dos usuários do Copilot US$ 10 por mês ou US$ 100 por ano por este serviço. O Copilot ignora, viola e remove as licenças oferecidas por milhares – possivelmente milhões – de desenvolvedores de software, realizando assim a pirataria de software em uma escala sem precedentes. O Copilot produz texto derivado dos Materiais Licenciados dos Requerentes e da Classe sem aderir aos Termos de Licença aplicáveis e às leis aplicáveis. A saída do Copilot é aqui referida como “Saída”.
- Em 10 de agosto de 2021, a OpenAI estreou seu produto Codex, que converte linguagem natural em código e está integrado ao Copilot. Copilot e Codex podem ser chamados de AIs ou MLs. Codex e Copilot serão aqui referidos como Ais, a menos que seja necessária uma distinção.
- Embora os Réus tenham sido cautelosos sobre quais dados foram usados para treinar a IA,2 eles admitiram que os dados de treinamento incluem dados em um grande número de repositórios acessíveis ao público no GitHub,3 que incluem e são limitados por Licenças.
- Entre outras coisas, os Réus retiraram a atribuição dos Requerentes e da Classe, o aviso de direitos autorais e os termos de licença de seu código, em violação das Licenças e dos direitos dos Requerentes e da Classe. Os réus usaram o Copilot para distribuir o código agora anônimo aos usuários do Copilot como se tivesse sido criado pelo Copilot.
- O Copilot é executado inteiramente na plataforma de computação em nuvem Azure da Microsoft.
- O Copilot geralmente simplesmente reproduz código que pode ser rastreado até repositórios de código aberto ou licenciados de código aberto. Ao contrário e em violação das Licenças, o código reproduzido pelo Copilot nunca inclui atribuições aos autores subjacentes.
- GitHub e OpenAI ofereceram contas variáveis da fonte e quantidade do código ou outros dados usados para treinar e operar o Copilot. Eles também ofereceram justificativas variáveis sobre por que um produto comercial de IA como o Copilot deveria ser isento desses requisitos de licença, muitas vezes citando o “uso justo”.
- Não é justo, permitido ou justificado. Pelo contrário, o objetivo do Copilot é substituir uma enorme quantidade de código aberto, pegando-o e mantendo-o dentro de um acesso pago controlado pelo GitHub. Ele viola as licenças escolhidas pelos programadores de código aberto e monetiza seu código, apesar da promessa do GitHub de nunca fazê-lo.
Sobre a série de PDFs legais da HackerNoon: Trazemos a você os mais importantes processos judiciais técnicos e criteriosos de domínio público.
Este processo judicial 4:22-cv-06823-JST recuperado em 8 de junho de 2023, do faz parte de domínio público. Os documentos criados judicialmente são obras do governo federal e, sob a lei de direitos autorais, são automaticamente colocados em domínio público e podem ser compartilhados sem restrições legais.