در تازهترین فصل از نبرد میان شرکتهای هوش مصنوعی و ناشران رسانهای، چند مؤسسه بزرگ خبری تصمیم گرفتهاند دسترسی «آرشیو اینترنت» (Internet Archive) را به محتوای خود مسدود کنند؛ چرا که نگراناند رباتهای آموزشی هوش مصنوعی، بدون مجوز از این گنجینه برای تغذیه مدلهای زبانی استفاده کنند.
آرشیو اینترنت که سالها بهعنوان منبعی ارزشمند برای روزنامهنگاران، پژوهشگران و محققان شناخته میشد، حالا به نقطهای پرتنش در میدان جنگ حق نشر و یادگیری ماشینی تبدیل شده است.
به گفتهی “رابرت هان”، رئیس بخش صدور مجوز در روزنامهی گاردین، شرکتهای هوش مصنوعی معمولاً به دنبال پایگاههای دادهی ساختاریافته و در دسترس هستند، و “API بایگانی اینترنت” یکی از سادهترین مسیرها برای دسترسی گسترده به محتوای خبری بود.
پس از گاردین، نیویورک تایمز نیز اعلام کرده که دسترسی رباتهای Archive.org به وبسایت خود را مسدود کرده است. نماینده این روزنامه تأیید کرده که «دسترسی نامحدود Wayback Machine عملاً امکان استفادهی شرکتهای هوش مصنوعی از محتوای تایمز بدون مجوز را فراهم میکرد».
همچنین مجموعههایی مانند فایننشال تایمز و پلتفرم اجتماعی “Reddit” اقداماتی مشابه را برای کنترل نحوهی فهرستبندی مطالبشان انجام دادهاند.
در ماههای اخیر، موجی از شکایتهای حقوقی علیه شرکتهای بزرگ هوش مصنوعی شکل گرفته است.
– نیویورک تایمز از OpenAI و مایکروسافت شکایت کرده،
– والاستریت ژورنال و نیویورک پست از Perplexity،
– و گروهی از ناشران از جمله گاردین، آتلانتیک و پولیتیکو از Cohere به دادگاه رفتهاند.
حتی “Penske Media”از گوگل شکایت کرده است. تمامی این اعتراضها، نقطهی مشترکی دارند: دسترسی بدون مجوز هوش مصنوعی به محتوای خبری برای آموزش مدلهای زبانی.
برخی ناشران تلاش کردهاند با شرکتهای توسعهدهندهی هوش مصنوعی توافق مالی داشته باشند تا از آرشیو خود برای آموزش مدلها استفاده کنند، اما گزارشها نشان میدهد بیشتر این پرداختها به جیب شرکتهای انتشاراتی میرود، نه نویسندگان یا روزنامهنگاران اصلی.
جنگ بر سر حق نشر، حالا فقط مسئلهی اخبار نیست؛ از نویسندگان داستان و هنرمندان گرفته تا موسیقیدانان، همگی در برابر یک پرسش واحد ایستادهاند: آیا هوش مصنوعی باید از آثار انسان بدون اجازه یاد بگیرد؟
کد خبر ۲۰۲۰۴۱۱۱۱.۱۴۳
منبع: انگجت