ناشران دسترسی هوش مصنوعی به آرشیو وب را قطع کردند

انتشار: 11 بهمن 1404

در تازه‌ترین فصل از نبرد میان شرکت‌های هوش مصنوعی و ناشران رسانه‌ای، چند مؤسسه بزرگ خبری تصمیم گرفته‌اند دسترسی «آرشیو اینترنت» (Internet Archive) را به محتوای خود مسدود کنند؛ چرا که نگران‌اند ربات‌های آموزشی هوش مصنوعی، بدون مجوز از این گنجینه برای تغذیه مدل‌های زبانی استفاده کنند.

آرشیو اینترنت که سال‌ها به‌عنوان منبعی ارزشمند برای روزنامه‌نگاران، پژوهشگران و محققان شناخته می‌شد، حالا به نقطه‌ای پرتنش در میدان جنگ حق نشر و یادگیری ماشینی تبدیل شده است.

به گفته‌ی “رابرت هان”، رئیس بخش صدور مجوز در روزنامه‌ی گاردین، شرکت‌های هوش مصنوعی معمولاً به دنبال پایگاه‌های داده‌ی ساختاریافته و در دسترس هستند، و “API بایگانی اینترنت” یکی از ساده‌ترین مسیرها برای دسترسی گسترده به محتوای خبری بود.

پس از گاردین، نیویورک تایمز نیز اعلام کرده که دسترسی ربات‌های Archive.org به وب‌سایت خود را مسدود کرده است. نماینده این روزنامه تأیید کرده که «دسترسی نامحدود Wayback Machine عملاً امکان استفاده‌ی شرکت‌های هوش مصنوعی از محتوای تایمز بدون مجوز را فراهم می‌کرد».

همچنین مجموعه‌هایی مانند فایننشال تایمز و پلتفرم اجتماعی “Reddit” اقداماتی مشابه را برای کنترل نحوه‌ی فهرست‌بندی مطالبشان انجام داده‌اند.

در ماه‌های اخیر، موجی از شکایت‌های حقوقی علیه شرکت‌های بزرگ هوش مصنوعی شکل گرفته است.

– نیویورک تایمز از OpenAI و مایکروسافت شکایت کرده،

– وال‌استریت ژورنال و نیویورک پست از Perplexity،

– و گروهی از ناشران از جمله گاردین، آتلانتیک و پولیتیکو از Cohere به دادگاه رفته‌اند.

حتی “Penske Media”از گوگل شکایت کرده است. تمامی این اعتراض‌ها، نقطه‌ی مشترکی دارند: دسترسی بدون مجوز هوش مصنوعی به محتوای خبری برای آموزش مدل‌های زبانی.

برخی ناشران تلاش کرده‌اند با شرکت‌های توسعه‌دهنده‌ی هوش مصنوعی توافق مالی داشته باشند تا از آرشیو خود برای آموزش مدل‌ها استفاده کنند، اما گزارش‌ها نشان می‌دهد بیشتر این پرداخت‌ها به جیب شرکت‌های انتشاراتی می‌رود، نه نویسندگان یا روزنامه‌نگاران اصلی.

جنگ بر سر حق نشر، حالا فقط مسئله‌ی اخبار نیست؛ از نویسندگان داستان و هنرمندان گرفته تا موسیقی‌دانان، همگی در برابر یک پرسش واحد ایستاده‌اند: آیا هوش مصنوعی باید از آثار انسان بدون اجازه یاد بگیرد؟

کد خبر ۲۰۲۰۴۱۱۱۱.۱۴۳

منبع: انگجت