مدل های متن باز AI درکارهای مشابه سخت افزار بیشتری نیاز دارند

بهروز فیض
0

 هرچه کسب‌وکارهای بیشتری از هوش مصنوعی استفاده می‌کنند، انتخاب این‌که کدام مدل را به کار بگیرند به یک تصمیم مهم تبدیل شده است. گرچه مدل‌های متن‌باز در ابتدا ارزان‌تر به نظر می‌رسند، اما یک مطالعه‌ی تازه هشدار می‌دهد که این صرفه‌جویی‌ها ممکن است خیلی زود از بین برود، زیرا چنین مدل‌هایی به توان پردازشی بیشتری نیاز دارند.



در واقع، طبق مطالعه‌ای که پنج‌شنبه توسط Nous Research منتشر شد، مدل‌های متن‌باز هنگام انجام وظایف مشابه، منابع محاسباتی به‌مراتب بیشتری نسبت به مدل‌های بسته مصرف می‌کنند.

پژوهشگران ده‌ها مدل هوش مصنوعی را آزمایش کردند، از جمله سیستم‌های بسته‌ی گوگل و OpenAI، و همچنین مدل‌های متن‌باز DeepSeek و Magistral. آن‌ها میزان تلاش محاسباتی موردنیاز برای تکمیل وظایف یکسان در سه دسته—سؤالات دانشی ساده، مسائل ریاضی و معماهای منطقی—را اندازه‌گیری کردند.

برای این کار، آن‌ها از تعداد توکن‌هایی که هر مدل برای حل و پاسخ‌گویی به پرسش‌ها مصرف می‌کرد به‌عنوان معیاری برای منابع محاسباتی استفاده کردند.

به گفته‌ی نویسندگان:
«مدل‌های متن‌باز ۱.۵ تا ۴ برابر بیشتر از مدل‌های بسته توکن مصرف می‌کنند—و در مورد پرسش‌های دانشی ساده حتی تا ۱۰ برابر—که این موضوع باعث می‌شود گاهی با وجود هزینه‌ی کمتر هر توکن، در مجموع هر پرسش گران‌تر تمام شود.»

چرا کارایی توکن اهمیت دارد؟

در هوش مصنوعی، یک توکن بخشی از متن یا داده است—ممکن است یک کلمه، بخشی از یک کلمه، یا حتی علائم نگارشی باشد—که مدل‌ها برای درک زبان به کار می‌گیرند. مدل‌ها متن را توکن‌به‌توکن پردازش و تولید می‌کنند، بنابراین هرچه تعداد توکن‌های مصرفی بیشتر باشد، توان محاسباتی و زمان بیشتری لازم خواهد بود.

از آن‌جا که بیشتر مدل‌های بسته فرایند استدلال خام یا زنجیره‌ی تفکر (Chain of Thought) خود را آشکار نمی‌کنند، پژوهشگران کارایی محاسباتی آن‌ها را با شمارش تعداد توکن‌های مصرف‌شده اندازه‌گیری کردند. چون مدل‌ها بر اساس کل توکن‌های خروجی در فرایند استدلال و تولید پاسخ نهایی صورت‌حساب می‌گیرند، تعداد توکن‌ها شاخصی برای میزان تلاش لازم جهت تولید یک پاسخ محسوب می‌شود.

این موضوع برای شرکت‌هایی که از هوش مصنوعی استفاده می‌کنند از جهات بسیاری حائز اهمیت است.

پژوهشگران نوشتند:
«اول این‌که، هرچند میزبانی مدل‌های متن‌باز ممکن است ارزان‌تر باشد، این مزیت هزینه‌ای می‌تواند به‌راحتی از بین برود اگر آن‌ها برای حل یک مسئله به توکن‌های بیشتری نیاز داشته باشند. دوم این‌که، افزایش تعداد توکن‌ها منجر به زمان طولانی‌تر در تولید پاسخ و افزایش تأخیر خواهد شد.»

برچسب ها

ارسال یک نظر

0 نظرات

ارسال یک نظر (0)
3/related/default