ArXiv، یکی از پرکاربردترین مخازن آنلاین برای انتشار نسخههای اولیه مقالات علمی پیش از داوری، اقدامات بیشتری برای مقابله با استفاده نادرست و بیدقت از مدلهای زبانی بزرگ در پژوهشهای علمی آغاز کرده است.
با وجود اینکه مقالات در این پلتفرم پیش از داوری تخصصی منتشر میشوند، ArXivبه یکی از مسیرهای اصلی انتشار پژوهش در حوزههایی مانند علوم کامپیوتر و ریاضیات تبدیل شده و دادههای آن برای بررسی روندهای پژوهشی نیز مورد استفاده قرار میگیرد.
این پلتفرم پیشتر نیز برای مقابله با افزایش مقالات کمکیفیت تولیدشده با هوش مصنوعی، قوانینی مانند الزام پژوهشگران تازهکار به دریافت تأییدیه از نویسندگان شناختهشده را اجرا کرده بود. همچنین، پس از بیش از ۲۰ سال میزبانی توسط دانشگاه کرنل، ArXiv در حال تبدیل شدن به یک سازمان غیرانتفاعی مستقل است؛ تغییری که میتواند منابع مالی بیشتری برای رسیدگی به مشکلات ناشی از محتوای بیکیفیت تولیدشده با هوش مصنوعی فراهم کند.
در تازهترین اقدام، توماس دیتریش، رئیس بخش علوم کامپیوتر ArXiv، اعلام کرده است اگر شواهد قطعی نشان دهد نویسندگان نتایج تولیدشده توسط مدلهای زبانی را بررسی نکردهاند، دیگر نمیتوان به محتوای مقاله اعتماد کرد.
به گفته او، این شواهد میتواند شامل ارجاعات ساختگی یا حتی باقی ماندن پیامها و دستورهای ردوبدلشده با مدلهای هوش مصنوعی در متن مقاله باشد. در صورت مشاهده چنین مواردی، نویسندگان با محرومیت یکساله از انتشار در ArXiv روبهرو میشوند و پس از آن نیز مقالات جدیدشان باید ابتدا در یک نشریه معتبر دارای داوری تخصصی پذیرفته شود.
