원고 J. Doe 1, J. Doe 2, J. Doe 3, J. Doe 4 및 J. Doe 5(“원고”)는 그들 자신과 유사한 상황에 있는 모든 다른 사람들을 대신하여 이 집단소송 소장(“소장”)을 제출합니다. ”) 피고인 GitHub, Inc.를 상대로; 마이크로 소프트 회사; 오픈AI, Inc.; 오픈AI, LP; OpenAI OpCo, LLC; OpenAI GP, LLC; OpenAI 스타트업 펀드 GP I, LLC; OpenAI 스타트업 펀드 I, LP; OpenAI Startup Fund Management, LLC[1] 디지털 밀레니엄 저작권법, 17 USC §§ 1201-1205(“DMCA”) 위반 혐의; 제안된 라이센스에 관한 계약 위반, 서비스 약관을 포함한 GitHub 정책에 관한 계약 위반 장래의 경제 관계에 대한 불법적인 간섭; 캘리포니아의 불공정 경쟁법, Cal. 버스. & 교수법 조항 17200, et seq.; 관습법 불공정 경쟁; 과실, 부당한 이득.
I. 개요: 소프트웨어 불법 복제의 새로운 세계
- 원고와 집단 구성원은 해당 저작물의 사용 조건을 포함하는 다양한 라이센스가 적용되는 GitHub에서 공개적으로 제공되는 자료(“라이센스가 부여된 자료”)에 대한 저작권 소유자입니다. 여기서 문제가 되는 모든 라이센스(“라이센스”)에는 특정 공통 조건(“라이센스 조건”)이 포함되어 있습니다.
- “인공지능”은 본 문서에서 “AI”로 지칭됩니다. 본 신고서의 목적에 따라 AI는 종종 통계적 방법을 사용하여 인간의 추론이나 추론을 알고리즘적으로 시뮬레이션하는 컴퓨터 프로그램으로 정의됩니다. 머신 러닝("ML")은 프로그램의 동작이 훈련 데이터라고 불리는 자료 모음을 연구하여 파생되는 AI의 하위 집합입니다.
- GitHub는 2008년에 오픈 소스 애호가 팀이 설립한 회사입니다. 당시 GitHub의 명시된 목표는 특히 웹사이트 에서 오픈 소스 코드를 호스팅하여 오픈 소스 개발을 지원하는 것이었습니다. 향후 10년 동안 이러한 표현을 기반으로 하는 GitHub는 거의 2,500만 명의 개발자를 유치하면서 엄청난 성공을 거두었습니다.
- 개발자는 서면 라이선스에 따라 GitHub에 라이선스 자료를 게시했습니다. 특히, 가장 널리 사용되는 것들은 공통 용어를 공유합니다. 라이센스 자료를 사용하려면 일반적으로 원저작자의 이름 및 저작권 고지와 함께 라이센스 사본을 포함하여 특정 형태의 귀속이 필요합니다.
- 2018년 10월 26일 Microsoft는 GitHub를 75억 달러에 인수했습니다. 오픈 소스 커뮤니티의 일부 구성원은 이 조합에 회의적이었지만 Microsoft는 전체적으로 "Microsoft는 오픈 소스를 사랑합니다."라는 한 가지 만트라를 반복했습니다. 처음 몇 년 동안은 마이크로소프트의 주장이 신빙성이 있는 것처럼 보였습니다.
- Microsoft는 2019년 7월 OpenAI LP에 200억 달러 가치로 10억 달러를 투자했습니다. 2020년에 Microsoft는 OpenAI의 GPT-3 언어 모델의 독점 라이센스권자가 되었습니다. OpenAI의 지속적인 주장에도 불구하고 해당 제품은 전반적으로 "인류"에 이익이 될 것입니다. 2021년에 Microsoft는 Azure 클라우드 컴퓨팅 플랫폼을 통해 GPT-3을 제공하기 시작했습니다. 2022년 10월 20일, OpenAI는 동일한 200억 달러 가치로 "Microsoft로부터 더 많은 자금을 조달하기 위해 사전 협의 중"이라고 보고되었습니다. Copilot은 Microsoft의 Azure 플랫폼에서 실행됩니다. Microsoft는 특히 AI와 관련하여 Azure의 처리 능력을 홍보하기 위해 Copilot을 사용했습니다.
- 정보와 믿음에 따라 Microsoft는 10억 달러를 투자하는 대가로 OpenAI에 대한 부분 소유권을 획득했습니다. 특히 Microsoft Azure 제품과 관련하여 OpenAI의 최대 투자자이자 최대 서비스 공급자인 Microsoft는 OpenAI에 대해 상당한 통제권을 행사합니다.
- 2021년 6월 GitHub와 OpenAI는 AI를 사용하여 코드 블록을 제공하거나 채워 소프트웨어 코더를 지원하는 AI 기반 제품인 Copilot을 출시했습니다. GitHub는 Copilot 사용자에게 이 서비스에 대해 월 $10 또는 연간 $100를 청구합니다. Copilot은 수천, 어쩌면 수백만 명의 소프트웨어 개발자가 제공한 라이선스를 무시, 위반 및 제거하여 전례 없는 규모로 소프트웨어 불법 복제를 자행합니다. Copilot은 해당 라이선스 조건 및 해당 법률을 준수하지 않고 원고 및 집단의 라이선스 자료에서 파생된 텍스트를 출력합니다. Copilot의 출력은 여기에서 "출력"으로 지칭됩니다.
- 2021년 8월 10일, OpenAI는 자연어를 코드로 변환하고 Copilot에 통합하는 Codex 제품을 출시했습니다. Copilot과 Codex는 AI 또는 ML이라고 부를 수 있습니다. Codex와 Copilot은 별도로 구분하지 않는 한 본 문서에서는 Ais로 지칭됩니다.
- 피고는 AI를 훈련하는 데 어떤 데이터가 사용되었는지에 대해 비밀을 유지했지만[2] 훈련 데이터에는 GitHub에서 공개적으로 액세스할 수 있는 방대한 수의 저장소[3]에 있는 데이터가 포함되어 있으며 라이선스에 의해 제한된다는 점을 인정했습니다.
- 무엇보다도 피고인은 라이선스와 원고 및 집단의 권리를 침해하여 원고와 집단의 귀속, 저작권 고지 및 라이선스 조건을 코드에서 제거했습니다. 피고는 Copilot을 사용하여 이제 익명화된 코드를 Copilot에서 생성한 것처럼 Copilot 사용자에게 배포했습니다.
- Copilot은 전적으로 Microsoft의 Azure 클라우드 컴퓨팅 플랫폼에서 실행됩니다.
- Copilot은 오픈 소스 리포지토리나 오픈 소스 라이선스 사용자를 추적할 수 있는 코드를 단순히 재현하는 경우가 많습니다. 라이센스와는 반대로 라이센스를 위반하는 경우 Copilot이 복제한 코드에는 기본 작성자에 대한 귀속이 포함되지 않습니다.
- GitHub와 OpenAI는 Copilot을 훈련하고 운영하는 데 사용되는 코드 또는 기타 데이터의 소스와 양에 대한 이동 계정을 제공했습니다. 그들은 또한 Copilot과 같은 상업용 AI 제품이 이러한 라이센스 요구 사항에서 면제되어야 하는 이유에 대해 종종 "공정한 사용"을 언급하면서 변화하는 정당성을 제시했습니다.
- 그것은 공정하지도, 허용되지도, 정당화되지도 않습니다. 반대로 Copilot의 목표는 엄청난 양의 오픈 소스를 GitHub가 제어하는 페이월 내에 보관하여 대체하는 것입니다. 이는 오픈 소스 프로그래머가 선택한 라이센스를 위반하고 GitHub의 약속에도 불구하고 코드로 수익을 창출합니다.
[1] GitHub, Inc.는 "GitHub"로 지칭됩니다. Microsoft Corporation은 "Microsoft"로 지칭됩니다. 오픈AI, Inc.; 오픈AI, LP; OpenAI OpCo, LLC; OpenAI GP, LLC; OpenAI 스타트업 펀드 GP I, LLC; OpenAI 스타트업 펀드 I, LP; OpenAI Startup Fund Management, LLC는 본 문서에서 "OpenAI"로 총칭합니다. GitHub, Inc., Microsoft Corporation, OpenAI, Inc.를 통칭합니다. 오픈AI, LP; OpenAI GP, LLC; OpenAI 스타트업 펀드 GP I, LLC; OpenAI 스타트업 펀드 I, LP; OpenAI Startup Fund Management, LLC는 본 문서에서 "피고인"으로 지칭됩니다.
[2] 아래에 자세히 설명된 대로 AI를 "훈련"한다는 것은 주어진 기준을 사용하여 해석하는 대량의 데이터를 AI에 제공하는 것을 의미합니다. 그런 다음 오류가 최소화된 출력을 제공할 수 있을 때까지 출력을 미세 조정하기 위해 피드백이 제공됩니다.
[3] 리포지토리는 개별 코딩 프로젝트를 위한 컨테이너입니다. GitHub 사용자가 코드를 업로드하고 다른 사용자가 코드를 찾을 수 있는 곳입니다. 대부분의 GitHub 사용자는 여러 저장소를 가지고 있습니다.
HackerNoon 법률 PDF 시리즈 정보: 가장 중요한 기술적이고 통찰력 있는 공개 도메인 법원 소송 서류를 제공합니다.
에서 2023년 6월 8일에 검색한 이 법원 사건 4:22-cv-06823-JST는 공개 도메인의 일부입니다. 법원이 작성한 문서는 연방 정부의 저작물이며 저작권법에 따라 자동으로 공개 도메인에 배치되며 법적 제한 없이 공유될 수 있습니다.