저작권 및 AI 교육 관련 어도비 상대 집단 소송 제기

  • 저자들은 어도비가 저작권이 있는 책을 이용해 SlimLM 모델을 학습시켰다고 비난하고 있습니다.
  • 이번 집단 소송은 SlimPajama-627B, RedPajama 및 Books3 데이터 세트를 중심으로 진행됩니다.
  • 이번 소송은 미국과 유럽에서 저작권 및 AI 훈련에 관한 중요한 선례를 만들 수 있습니다.
  • 이번 논란은 생성형 AI의 데이터 모델과 어도비가 약속한 "책임감 있는 AI"에 대한 의문을 제기합니다.

저작권 및 AI 교육 관련 어도비 상대 집단 소송 제기

법적 공방을 둘러싼 저작권이 있는 저작물을 사용하여 인공지능 모델을 훈련시키는 것 어도비가 폭풍의 중심에 서면서 새로운 장이 열렸습니다. 역사적으로 창작 분야와 밀접한 관계를 맺어온 이 회사는 이제 위기에 직면해 있습니다. 집단 소송 이는 근본적으로 해당 회사가 인공지능 중 하나를 훈련하는 데 사용된 일부 데이터를 어떻게 얻었는지에 대한 의문을 제기합니다.

소송의 핵심은 다음과 같습니다. 슬림LM특히 문서 지원 작업을 위해 설계된 경량 언어 모델 제품군입니다. 모바일고소장에는 다음과 같은 것들이 이 시스템을 훈련하는 데 사용되었다고 주장합니다. 불법 복제 서적 및 기타 저작권 보호 대상 저작물 저작권자의 허가 없이 데이터를 사용하는 것은 어도비뿐만 아니라 전체 생성형 AI 산업, 특히 AI를 위한 데이터의 합법적 사용에 대한 논쟁이 뜨거워지고 있는 유럽과 스페인에도 민감한 문제를 야기합니다.

집단 소송의 배경 및 분쟁 발생 원인

어도비를 상대로 한 집단 소송의 법적 배경

El 17 12월 2025어도비는 통보를 받았습니다. 제안된 집단 행동 캘리포니아 북부 지방 연방 법원에서 심리 중입니다. 이 소송은 오리건 주 출신 작가가 제기했습니다. 엘리자베스 라이온회사가 부당 이득을 취했다고 비난한다 해적판 책 그는 자신의 작품을 포함한 여러 자료를 인공지능 모델의 사전 학습에 활용했습니다.

소송에서는 어도비가 그의 문자 메시지를 일부로 사용했다고 주장합니다. 처리된 부분집합 SlimLM의 기반이 된 데이터입니다. 이 자료는 AI 생태계에서 잘 알려진 데이터 세트의 일부를 형성합니다. 책3에 통합됨 레드파자마그리고 차례로 데이터 세트에 통합됩니다. 슬림파자마-627B원고들에 따르면, 이 과정에서 수천 건의 저작물이 허가, 출처 표기 또는 보상 없이 사용되었다고 합니다.

리옹은 자신이 연기하고 있다고 주장합니다. 다른 저작자 및 저작권자를 대신하여 비슷한 상황에 처하게 될 사람들이 있다는 점에서 이 사건은 더욱 중요해집니다. 파급 효과가 클 것으로 예상되는 집단 소송구체적인 금액은 아직 공개되지 않았지만, 소송은 상당한 금전적 보상, 법적 및 기타 손해 배상, 변호사 비용 지급, 그리고 어도비의 고의적 침해에 대한 명확한 선언을 요구하고 있습니다.

회사 측은 다음과 같이 주장했습니다. SlimLM은 SlimPajama-627B로 학습되었습니다.2023년 6월 Cerebras사에서 공개한 오픈 소스 데이터 세트로 설명되며, 데이터는 다음 출처에서 가져온 것으로 추정됩니다. 다수의 개방형 및 중복 제거된 코퍼스이번 법적 분쟁의 핵심은 바로 이러한 "개방형" 특성이 저작권자의 동의 없이 데이터 세트에 포함될 수 있는 보호 대상 저작물의 사용을 합법화하기에 충분한지 여부를 판단하는 데 있습니다.

현재로서는 이 과정이 초기 단계에 있습니다. 어도비는 공개적으로 자세한 내용을 밝히는 것을 피했고, 로이터와 같은 언론 매체들은 어도비가 일부 논평 요청에 응답하지 않았다고 보도했습니다. 하지만 리옹은 이 과정이 진행 중임을 강조했습니다. 대의를 확고히 추진하기로 결심했다 또한, 소송을 끝까지 끌고 갈 자원을 보유하고 있으며, 이는 길고 대대적으로 보도될 법정 공방을 예고합니다.

SlimLM은 어도비의 AI 전략에 어떻게 부합하는가?

어도비의 SlimLM 모델 및 AI 학습

이 사건을 특히 주목할 만하게 만드는 요소 중 하나는 문제의 모델이 그렇지 않다는 점입니다. 개똥 벌레어도비의 가장 눈에 띄는 일반 대중에게 공개된 크리에이티브 제작 도구 모음이지만, 슬림LM훨씬 더 신중한 시스템으로, 특정 작업에 맞춰 설계되었습니다. 문서 및 지원 기능 관련 지원 백그라운드에서 작동하는 AI를 말하는 것입니다. 즉, 광고 캠페인을 위한 화려한 이미지를 생성하는 AI가 아니라, 애플리케이션의 백그라운드에서 텍스트를 처리, 요약 또는 관리하는 데 도움을 주는 모델을 의미합니다.

지금까지 어도비는 AI에 대한 이야기를 파이어플라이에 크게 의존해 왔습니다. “책임감 있는 AI”의 예시회사 자체 발표에 따르면, 은 과 을 훈련시켰다. 라이선스 콘텐츠 (어도비 스톡과 같은) 공개 자료 및 자사가 명확한 권리를 주장하는 기타 리소스를 활용하고 있습니다. 또한, 해당 회사는 이를 홍보해 왔습니다. 보상 프로그램 어도비 스톡 콘텐츠 제작자들을 위해, 사진작가, 일러스트레이터, 콘텐츠 크리에이터들의 든든한 조력자로서의 이미지를 강화하는 것을 목표로 합니다.

하지만 소송의 초점은 그처럼 눈에 띄는 부분에 있지 않습니다. 관심은 SlimLM과 그 외 여러 곳에 쏠려 있습니다. 사전 학습에 사용된 데이터의 출처최종 사용자에게는 잘 보이지 않는 영역에서 정확히 이러한 차이가 발생합니다. 이러한 차이는 저작권이 있는 저작물의 사용에 대한 논쟁이 화려한 이미지나 창의적인 텍스트를 생성하는 도구에만 국한되지 않고, 그 외의 영역에도 적용된다는 것을 보여주기 때문에 중요합니다. 이는 소음이 적은 지원 모델에도 영향을 미칩니다.일상용품에 통합되어 있습니다.

제시된 문서에 따르면 SlimLM은 다음으로부터 학습되었을 것입니다. 슬림파자마-627B더 큰 데이터 세트의 변형입니다. 레드파자마인공지능 커뮤니티에서 매우 인기 있는 기술입니다. 이는 또한 다음을 통합합니다. 책3약 100개 정도의 모음 191.000 권의 도서 이는 저작권 소송에서 반복적으로 인용되어 왔습니다. 소송 측은 SlimPajama가 RedPajama에서 직접 파생되었고, RedPajama에 Books3가 포함되어 있다면, 리옹과 다른 저자들의 작품은 사전 훈련 과정에서 복사 및 처리되었을 것이다. 명확한 법적 근거 없이.

어도비에게 있어 이 문제는 서비스 확장을 진행 중인 매우 민감한 시기에 발생했습니다. 생성형 인공지능 및 보조 도구 크리에이티브 및 오피스 제품 생태계에 통합되어 있습니다. 다른 기술 대기업과 차별화하기 위해 신중하게 구축해 온 크리에이터 보호 기업이라는 이미지는 스페인과 유럽의 크리에이티브 전문가들을 포함하여 특히 집중적인 검토 대상이 되고 있으며, 이들은 포토샵, 일러스트레이터, 아크로뱃, 프리미어와 같은 도구를 매일 사용하고 있습니다.

Books3, RedPajama 및 SlimPajama 데이터 세트의 역할

이러한 요구가 왜 단지 개별적인 사례에 그치지 않는지 이해하려면 현재의 AI 모델이 어떻게 훈련되는지 잠시 생각해 볼 필요가 있습니다. 대규모 언어 모델과 많은 생성형 AI는 엄청난 양의 텍스트로부터 학습합니다.웹 페이지, 기사, 서적, 코드, 기술 문서 등. 데이터 처리 및 시스템 설계가 적절하다는 가정 하에, 이러한 데이터 모음이 다양하고 방대할수록 모델의 성능이 향상되는 경향이 있습니다.

이러한 맥락에서, 다음과 같은 데이터 세트가 사용됩니다. 책3출처가 오랫동안 의혹을 불러일으켰던 방대한 양의 책들, 그리고 레드파자마이 프로젝트는 대형 연구소에서 모델 훈련에 사용하는 방식의 데이터셋을 재현하는 것을 목표로 합니다. 슬림파자마-627B 이는 Cerebras가 2023년에 커뮤니티에 공개 데이터 세트로 제공한 해당 자료의 중복 제거 및 정제된 변형일 것입니다.

어도비를 상대로 제기된 소송에 따르면, 슬림파자마는 다음과 같은 이유로 제작되었다고 합니다. "복사 및 조작" RedPajama에는 Books3 섹션도 포함되어 있습니다. 이론적으로 이러한 포함이 바로 그 이유입니다. 수천 개의 저작권 보호 작품 전체 공급망에 걸쳐 사기 행위가 발생했다는 주장입니다. 어도비가 직접 도서를 편집하지 않았더라도, 해당 도서를 포함하는 데이터 세트를 활용한 것 자체가 사기에 해당한다는 것입니다. 다운로드, 복사 및 반복 처리 전처리 및 사전 학습 단계에서 보호된 자료입니다.

이 논란은 새로운 것이 아닙니다. Books3는 RedPajama입니다. 이러한 데이터는 애플이나 세일즈포스와 같은 기술 기업들이 내부 모델 학습에 이 데이터를 활용했다는 혐의를 받은 소송을 포함하여 다른 기술 기업들을 상대로 제기된 소송에서도 이미 인용되었습니다. 이러한 모든 분쟁의 근본에는 동일한 질문이 자리 잡고 있습니다. 저작권이 있는 저작물을 포함하는 "공개" 데이터 세트를 재사용하는 것이 합법적이라고 볼 수 있을까요? 관련된 모든 저자로부터 사전에 허가를 받지 않고서요?

따라서 어도비에 대한 법적 소송은 다음과 같은 내용을 추가합니다. 소송 건수 이는 업계가 관행을 재검토하도록 압력을 가하고 있습니다. 실제로 새로운 사례가 발생할 때마다 개선 메커니즘을 마련해야 한다는 압력이 가중됩니다. 데이터 추적성창작자를 위한 명확한 거부 시스템과 AI 학습을 위한 구체적인 라이선스 모델은 유럽에서도 영향을 받을 수 있습니다. EU 인공지능 규정 그리고 기존 저작권 규정.

인공지능 산업 전체에 이미 영향을 미치고 있는 법적 전선

어도비를 상대로 한 소송은 갑자기 제기된 것이 아닙니다. 2023년 이후로 여러 건의 소송이 진행되어 왔습니다. 생성형 인공지능을 개발하는 기업들을 상대로 저작권 소송이 잇따르고 있다.OpenAI, Stability AI, Meta, Anthropic, Midjourney 등의 기업들이 포함됩니다. 이러한 사례들은 대부분 저작권이 있는 저작물을 무단으로 사용하여 텍스트, 이미지 또는 음악을 생성하는 모델을 학습시키는 것과 같은 공통된 문제를 다룹니다. 이러한 모델은 때때로 원작자의 스타일과 매우 유사한 결과물을 만들어냅니다.

최근의 중요한 성과 중 하나는 다음과 같습니다. 인류가 합의한 내용그들은 약 얼마를 지불하기로 동의했습니다. 1.500 만 여러 저자들이 챗봇 클로드의 학습에 자신들의 책 불법 복제본이 사용된 것을 비난했습니다. 이 논란이 된 합의는 가능한 해결책으로 해석되었습니다. 변곡점 기술 기업들이 이러한 유형의 소송을 처리하는 방식에 대한 비판이 제기되었고, 향후 소송에서 상당한 보상이 이루어질 것이라는 기대감이 생겨났습니다.

한편, 테크크런치, 로이터, 더버지, 뉴욕타임스 등 미국의 언론 매체들은 이 상황을 보도해왔습니다. 연관된 사례 이러한 문제들은 인공지능 분야의 거의 모든 주요 기업에 영향을 미칩니다. 공통적인 패턴은 다음과 같습니다. 웹 페이지부터 코드 저장소, 심지어 책 한 권 전체에 이르기까지 모든 것을 포함하는 방대한 데이터 세트, 명확한 동의 메커니즘의 부재, 그리고 이러한 자료를 활용하여 정교한 답변, 요약, 분석을 제공하거나 창의적인 콘텐츠를 생성하는 점점 더 강력해지는 모델들입니다.

어도비 사례는 중요한 뉘앙스를 더해줍니다. 이 회사는 자사의 상업적 스토리텔링의 일부를 특정 아이디어를 중심으로 구축해 왔다는 점입니다. 다른 사람들과 "차별화"하기 위해 창작자를 보호하는 것이 중요합니다. 그렇기 때문에 해당 회사의 모델 중 하나가 불법 복제 서적을 기반으로 했을 가능성이 있다는 의혹은 스페인을 비롯한 여러 국가의 창작 분야에 큰 파장을 일으키고 있습니다. 작가, 번역가, 언론인 및 출판업자 그들은 자신들의 카탈로그가 직간접적으로 학습 데이터 세트에 포함될 수 있다는 점을 다소 우려하며 지켜봅니다.

미국 외에도 유럽에서 이러한 문제에 대한 법원 판결을 예의주시할 것입니다. 공정 사용에 관한 미국 판례법 변형적 사용을 위한 복제는 저작권자 보호에 더 중점을 두는 유럽의 법적 틀과 정확히 일치하지 않습니다. 그럼에도 불구하고, 앞으로 나올 판결들은 훈련 목적의 데이터 대량 사용이나 저작자에 대한 특정 보상 필요성 등과 같은 문제들을 유럽 법원이 어떻게 해석할지에 영향을 미칠 수 있습니다.

유럽 ​​및 스페인 크리에이터에게 미칠 수 있는 잠재적 영향

어도비를 상대로 한 소송은 미국 법원에 제기되었지만, 그 영향은 대서양 양쪽 모두에 미칠 수 있습니다. 거대 기술 기업들은 다음과 같은 방식으로 운영됩니다. 글로벌 모델 그리고 그들의 데이터 관리 방식은 단일 관할 구역에 국한되는 경우가 드뭅니다. 만약 미국 법원이 특정 데이터 세트의 사용이 저작권을 침해한다고 최종적으로 판단한다면, 그 결과는 다음과 같을 가능성이 높습니다. 동일한 모델이나 관행을 재검토해야 합니다. 유럽에서도.

어도비의 경우, 자사의 AI 기반 도구들은 이미 다양한 분야에서 광범위하게 사용되고 있습니다. 스페인 디자인 스튜디오, 광고 대행사, 출판사 및 미디어 매체Books3와 같은 데이터 세트에 스페인 문학 작품이 허가 없이 포함될 가능성은 작가와 관련 단체들에게 점점 더 큰 우려를 불러일으키고 있습니다. 스페인에 등록된 도서가 모델 학습에 사용된 것으로 확인될 경우, 새로운 문제들이 발생할 수 있습니다. 개인 또는 집단 불만 제기 채널 유럽 ​​관할권에서도 마찬가지입니다.

El 유럽연합 AI 규정이는 특정 시스템에 대한 투명성 의무와 공동체 규정을 도입하는 것입니다. 저작권이러한 요소들은 어떤 관행이 허용 가능한지를 정의하는 데 핵심적인 역할을 할 것입니다. 예를 들어, 어도비 사례와 같은 경우가 더 흔해진다면, 사용된 데이터 세트를 문서화하거나 권리 보유자에게 명확한 거부 메커니즘을 제공해야 하는 요건이 강화될 수 있습니다.

유럽의 창작 생태계에 있어 이러한 유형의 소송은 그것이 필요하다는 인식을 더욱 강화시켜 줍니다. 새로운 휴가 및 보수 형태를 협상하다 AI 훈련과 관련된 문제입니다. 단순히 무단 사용을 방지하는 것뿐만 아니라, 출판사, 저작권 관리 회사, 기술 플랫폼이 협력하여 문제를 해결할 수 있는 방법을 모색하는 것입니다. 카탈로그 접근 조건에 동의합니다 문학 작품이나 시각 예술 작품을 공정한 보상과 교환하는 것.

혁신적인 관점에서 볼 때, 당면 과제는 다음과 같습니다. 강력한 모델 개발과 지적 재산권에 대한 진정한 존중을 조화시키는 것출판, 시청각 및 광고 산업이 상당한 영향력을 행사하는 스페인에서, 인공지능을 이미 활용하고 있는 기업들과 디지털 법률 및 지적 재산권 전문 로펌들은 어도비를 상대로 한 소송의 결과를 매우 면밀히 주시할 것입니다.

AI를 활용하는 스타트업 및 기술 기업을 위한 교훈

어도비 사례는 다음과 같은 직접적인 메시지를 전달합니다. 기술 스타트업 생태계미국과 유럽 모두에서 데이터의 출처는 매우 중요합니다. 많은 신생 기업들이 자체적으로 대규모 언어 모델을 개발하지는 않지만, 종종 다른 곳에서 제공하는 데이터에 의존합니다. 공개 데이터 세트, 타사 API 및 사전 학습된 모델 자신도 모르는 사이에 현재 법원에서 논의되고 있는 것과 동일한 법적 문제를 안고 있을 수도 있는 사람들.

첫 번째 교훈은 다음과 같은 필요성입니다. 데이터 소스를 철저하게 감사합니다데이터셋에 "오픈"이라는 라벨을 붙이거나 공개 저장소에 게시하는 것만으로는 저작권 안전성이 자동으로 보장되는 것은 아닙니다. 문서를 검토하고 저작권이 있는 구성 요소를 확인하며, 의심스러운 경우 문의해 보세요. 더 친환경적인 대안을 찾거나 특정 라이선스에 대해 협상하십시오. 이는 나중에 발생할 수 있는 심각한 문제를 예방할 수 있습니다.

두 번째는 다음과 관련이 있습니다. 국제 규제 준수스페인이나 라틴 아메리카에서 사업을 운영하지만 유럽이나 미국 시장을 목표로 하는 스타트업은 다음과 같은 규정을 준수해야 할 수 있다는 점을 유념해야 합니다. 여러 관할 구역을 동시에따라서 데이터 수집, 저장, 동의, 삭제 요청 또는 저작권 침해 주장에 대한 대응과 관련하여 처음부터 명확한 정책을 수립해야 합니다.

셋째로, 이는 다음과 같은 비옥한 토양을 열어줍니다. 새로운 비즈니스 모델 책임감 있는 데이터 관리에 중점을 둡니다. 데이터 세트 추적 도구, 권한 확인 서비스, 문화 카탈로그 라이선싱을 용이하게 하는 플랫폼, 또는 저작권자가 AI 시스템에서 자신의 저작물 사용을 모니터링할 수 있도록 하는 솔루션 등이 그 예가 될 수 있습니다. 매우 귀중한 제품 다음 해에

마지막으로, 다음 사항을 기억해 두는 것이 좋습니다. 평판 이는 기술 자체만큼이나 중요한 자산이 되었습니다. AI를 개발하거나 통합하는 모든 기업에게 저작권 콘텐츠 오용을 둘러싼 분쟁에 휘말리는 것은 큰 문제가 될 수 있습니다. 고객, 파트너 및 사용자 간에 불신을 조장하기 위해지적 재산권을 존중하는 문화를 구축하는 것은 법적인 문제일 뿐만 아니라, "윤리적 AI" 또는 "책임 있는 AI"를 약속하는 기업들이 넘쳐나는 시장에서 차별화를 꾀하는 현명한 방법이기도 합니다.

가능한 시나리오와 앞으로 일어날 수 있는 일들

이와 같은 유형의 소송이 대부분 그렇듯, 어도비를 상대로 한 소송 역시 다양한 가능성을 열어두고 있습니다. 법적 시나리오법원은 집단 소송을 완전히 수용하거나, 그 범위를 제한하거나, 충분한 근거가 없다고 판단될 경우 기각하거나, 또는 다른 소송에서처럼 분쟁을 중재를 통해 해결할 수 있습니다. 법정 밖 합의 여기에는 금전적 보상과 회사의 관행 변화에 대한 약속이 포함됩니다.

어도비에게 있어 경제적 비용 외에도 가장 큰 영향은 다음과 같은 필요성에 있을 수 있습니다. 데이터 공급망을 철저히 검토하십시오.여기에는 각 모델에 사용된 데이터 세트, 훈련의 어느 부분이 독점 데이터에 의존하는지, 해당 사용에 적용되는 라이선스는 무엇인지, 그리고 이 모든 것을 고객과 규제 당국에 투명하게 전달하는 방법을 감사하는 작업이 포함됩니다.

기술 산업 전반이 중대한 기로에 서 있습니다. 저작권 소송이 증가하고 규제가 강화됨에 따라, 특히 유럽 연합에서 이러한 규제가 심화되면서, 인공지능 개발을 기존 방식에 기반하는 것이 점점 더 어려워지고 있습니다. 대규모 인터넷 스크래핑 및 의심스러운 서적이나 이미지 모음대신, 훈련된 모델이라는 아이디어가 있습니다. 엄선된 데이터이며, 명확한 권한 설정이 되어 있고, 많은 경우 보상 계약도 함께 제공됩니다..

이처럼 급변하는 환경 속에서 어도비 사례는 법적 문제 없이 AI를 활용하고자 하는 대형 기술 기업과 중소기업 모두에게 중요한 시사점을 제공합니다. 이번 사안에 대한 법원의 결정은 매우 중요할 것입니다. 저작권 및 AI 훈련 관련 집단 소송 이는 SlimLM과 같은 특정 모델에만 영향을 미치는 것이 아니라, 인공지능 시대에 창작 데이터에 접근하는 방식에 대한 인식을 재정립할 수도 있습니다.

책을 출판하는 방법
관련 기사 :
책을 출판하는 방법