شبکه اجتماعی Bluesky اخیراً یک پیشنهاد جدید در GitHub منتشر کرده است که گزینههای جدیدی را برای کاربران مشخص میکند تا تصمیم بگیرند که آیا مایلند پستها و دادههایشان برای اهدافی مانند آموزش هوش مصنوعی مولد و بایگانی عمومی مورد استفاده و جمعآوری (scraping) قرار بگیرد یا خیر.
جی گریبر (Jay Graber)، مدیرعامل Bluesky، این پیشنهاد را اوایل این هفته در سخنرانی خود در South by Southwest مطرح کرد. اما این موضوع جمعه شب پس از آنکه گریبر در Bluesky درباره آن پست گذاشت، توجه بیشتری را به خود جلب کرد. برخی از کاربران با نگرانی به این برنامهها واکنش نشان دادند و آن را به منزلهی عقبنشینی از موضع قبلی Bluesky دانستند؛ چرا که این شرکت پیشتر اعلام کرده بود دادههای کاربران را به تبلیغدهندگان نخواهد فروخت و از پستهای کاربران برای آموزش مدلهای هوش مصنوعی استفاده نخواهد کرد.
یکی از کاربران با نام Sketchette نوشت:
"اوه، نه به هیچ وجه! زیبایی این پلتفرم این بود که اطلاعات به اشتراک گذاشته نمیشد، مخصوصاً برای هوش مصنوعی مولد. الان نباید تسلیم بشید."
گریبر در پاسخ توضیح داد که شرکتهای فعال در زمینه هوش مصنوعی مولد "در حال حاضر در حال جمعآوری دادههای عمومی از سراسر وب هستند" — از جمله از Bluesky — زیرا "همه چیز در Bluesky مانند یک وبسایت عمومی است." به همین دلیل، گریبر گفت که Bluesky در تلاش است تا یک "استاندارد جدید" برای مدیریت این نوع جمعآوری دادهها ایجاد کند؛ مشابه فایل robots.txt که وبسایتها برای تعیین سطح دسترسی خزندههای وب (web crawlers) به دادههای خود استفاده میکنند.
بحثها دربارهی آموزش هوش مصنوعی و حق نشر (کپیرایت) باعث شده است که فایل robots.txt بیشتر مورد توجه قرار بگیرد — اما نکته اینجاست که این فایل از نظر قانونی الزامآور نیست. Bluesky پیشنهاد خود را بهعنوان استانداردی با "سازوکار و انتظارات مشابه" معرفی میکند که "فرمتی قابل خواندن توسط ماشین است که انتظار میرود بازیگران خوشنیت به آن پایبند باشند، اما از نظر قانونی الزامآور نیست."
بر اساس این پیشنهاد، کاربران اپلیکیشن Bluesky (یا اپلیکیشنهای دیگری که از پروتکل زیرین ATProtocol استفاده میکنند) میتوانند از طریق تنظیمات، اجازه استفاده از دادههای خود را در چهار دسته زیر فعال یا غیرفعال کنند:
- هوش مصنوعی مولد
- پلزنی پروتکل (اتصال اکوسیستمهای اجتماعی مختلف)
- مجموعههای دادهی حجیم
- بایگانی وب (مانند Wayback Machine آرشیو اینترنت)
این پیشنهاد میتواند به کاربران کنترل بیشتری بر دادههایشان بدهد — اما این سؤال همچنان باقی است که آیا شرکتهای هوش مصنوعی و بازیگران دیگر به این استاندارد پایبند خواهند بود یا خیر.