طلبت مجموعة هاشيت للكتب ومجموعة سينجيدج من محكمة اتحادية في كاليفورنيا يوم الخميس التدخل في دعوى جماعية تتهم جوجل بانتهاك حقوق النشر في تدريب الذكاء الاصطناعي.
تزعم الناشرون أن جوجل قام بتنزيل كتبهم من مواقع قرصنة، بما في ذلك Z-Library و OceanofPDF، ثم قام بنسخها مرارًا وتكرارًا أثناء تدريب نماذجه.
يُزعم أن مجموعة بيانات تدريب C4 الخاصة بجوجل تستمد من ما لا يقل عن 28 موقعًا مرتبطًا بالقرصنة، مع ظهور رمز حقوق النشر أكثر من 200 مليون مرة.
قدمت أكبر دور نشر للكتب، هاشيت للكتب ومجموعة سينجيدج، طلبًا يوم الخميس للتدخل في دعوى جماعية قائمة تم رفعها العام الماضي ضد جوجل، تتهم العملاق التكنولوجي بتنظيم “انتهاك تاريخي لحقوق النشر” لبناء منصة Gemini الخاصة به.
وتزعم الشكوى المقدمة في محكمة اتحادية بكاليفورنيا أن جوجل “اختارت سرقة كمية هائلة من المحتوى من المدعين والفئة لتدريب نموذج الذكاء الاصطناعي الخاص بها” بدلاً من الحصول على التراخيص المناسبة، معنية بانتهاك متعمد “في كل مرحلة” من التطوير.
تم رفع القضية الموحدة أصلاً في 2023 من قبل مؤلفين فرديين كدعوى حقوق نشر جماعية مقترحة تتهم جوجل بنسخ الكتب لتدريب نماذج الذكاء الاصطناعي التوليدية الخاصة بها.
وتدعي الناشرون أن جوجل قام بتنزيل الكتب من مواقع قرصنة ثم قام بنسخها مرارًا خلال عملية تدريب الذكاء الاصطناعي، أولاً إلى ذاكرة الحاسوب، ثم إلى تنسيقات يمكن لأنظمة الذكاء الاصطناعي قراءتها، ومرة أخرى إلى مجموعات تدريب لكل إصدار جديد من النموذج.
تحتوي مجموعة بيانات C4 الخاصة بجوجل على أعمال محمية بحقوق النشر تم جمعها من Z-Library، وهو مجموعة قرصنة قامت السلطات بمصادرة أكثر من 350 موقعًا ونطاقًا إلكترونيًا منها، وفقًا للشكوى.
وأشار الناشرون إلى أن الكتب نُسخت من b-ok.org، وهو نطاق Z-Library يعرض الآن إشعار مصادرة اتحادي، بالإضافة إلى OceanofPDF و WeLib، “موقع آخر غني بالمحتوى غير المصرح به بحقوق النشر.”
وتشير الشكوى إلى أن مجموعة C4 تحتوي على أعمال من ما لا يقل عن 28 موقعًا حددتها الحكومة الأمريكية كسوق للقرصنة والتزييف.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
الناشرون يسعون لدخول معركة حقوق النشر في Google AI
باختصار
قدمت أكبر دور نشر للكتب، هاشيت للكتب ومجموعة سينجيدج، طلبًا يوم الخميس للتدخل في دعوى جماعية قائمة تم رفعها العام الماضي ضد جوجل، تتهم العملاق التكنولوجي بتنظيم “انتهاك تاريخي لحقوق النشر” لبناء منصة Gemini الخاصة به. وتزعم الشكوى المقدمة في محكمة اتحادية بكاليفورنيا أن جوجل “اختارت سرقة كمية هائلة من المحتوى من المدعين والفئة لتدريب نموذج الذكاء الاصطناعي الخاص بها” بدلاً من الحصول على التراخيص المناسبة، معنية بانتهاك متعمد “في كل مرحلة” من التطوير. تم رفع القضية الموحدة أصلاً في 2023 من قبل مؤلفين فرديين كدعوى حقوق نشر جماعية مقترحة تتهم جوجل بنسخ الكتب لتدريب نماذج الذكاء الاصطناعي التوليدية الخاصة بها. وتدعي الناشرون أن جوجل قام بتنزيل الكتب من مواقع قرصنة ثم قام بنسخها مرارًا خلال عملية تدريب الذكاء الاصطناعي، أولاً إلى ذاكرة الحاسوب، ثم إلى تنسيقات يمكن لأنظمة الذكاء الاصطناعي قراءتها، ومرة أخرى إلى مجموعات تدريب لكل إصدار جديد من النموذج.
تحتوي مجموعة بيانات C4 الخاصة بجوجل على أعمال محمية بحقوق النشر تم جمعها من Z-Library، وهو مجموعة قرصنة قامت السلطات بمصادرة أكثر من 350 موقعًا ونطاقًا إلكترونيًا منها، وفقًا للشكوى. وأشار الناشرون إلى أن الكتب نُسخت من b-ok.org، وهو نطاق Z-Library يعرض الآن إشعار مصادرة اتحادي، بالإضافة إلى OceanofPDF و WeLib، “موقع آخر غني بالمحتوى غير المصرح به بحقوق النشر.” وتشير الشكوى إلى أن مجموعة C4 تحتوي على أعمال من ما لا يقل عن 28 موقعًا حددتها الحكومة الأمريكية كسوق للقرصنة والتزييف.
وتقول الشكوى: “يظهر رمز حقوق النشر (©) أكثر من 200 مليون مرة في مجموعة بيانات C4”، مع ملاحظة أن جوجل استبعدت “إشعارات السياسة” و"شروط الاستخدام"، لكنها شملت “فئات واسعة من الأعمال المحمية بحقوق النشر، والأعمال المقرصنة، والأعمال التي أُخذت من خلف جدران الدفع.” وتزعم الناشرون أن جوجل نسخت أعمالًا من مكتبات تعتمد على الاشتراك مثل Scribd.com، متجاوزة الاتفاقيات القانونية الصحيحة. وعند مواجهتها بهذا الممارسات، رد مزود البيانات غير الربحي Common Crawl بـ"عقلية لوم الضحية، معلنًا 'لم يكن ينبغي عليك وضع محتواك على الإنترنت إذا لم تكن تريد أن يكون على الإنترنت.'" وتزعم الدعوى أن Gemini الآن يُنتج مخرجات “تحل محل الأعمال المحمية بحقوق النشر”، بما في ذلك النسخ الحرفي، والملخصات التفصيلية، و"نسخ مقلدة تكرر العناصر الإبداعية للأعمال الأصلية." ديكرابت تواصلت مع جوجل ومستشاري الناشرين. الذكاء الاصطناعي والناشرون تدافع جوجل في الوقت نفسه عن نفسها ضد دعاوى الاحتكار من شركة بينسكي ميديا كوربوريشن بشأن ميزة نظرات عامة للذكاء الاصطناعي، حيث تدعي أن عرض ملخصات الذكاء الاصطناعي يُعد “تحسينًا قانونيًا للمنتج بدلاً من سلوك مناهض للمنافسة.” يسعى الناشرون للحصول على تعويضات قانونية، وأوامر قضائية لوقف المزيد من الانتهاكات، وأمر يلزم جوجل بتدمير جميع النسخ غير المصرح بها من أعمالهم والكشف عن الكتب التي استُخدمت لتدريب Gemini. وتأتي طلبات التدخل بعد سلسلة من الدعاوى القضائية بحقوق النشر التي رفعها مؤلفون ضد شركات الذكاء الاصطناعي في عام 2023، حيث حقق القضاة الفيدراليون انتصارات جزئية لشركتي Meta و Anthropic، حكموا فيها أن استخدامهما لكتب محمية بحقوق النشر لتدريب نماذجهما يُعد استخدامًا عادلًا بموجب قانون حقوق النشر، لكنهم انتقدوا الشركات للحفاظ على مكتبات دائمة من الكتب المقرصنة.