هرچه کسبوکارهای بیشتری از هوش مصنوعی استفاده میکنند، انتخاب اینکه کدام مدل را به کار بگیرند به یک تصمیم مهم تبدیل شده است. گرچه مدلهای متنباز در ابتدا ارزانتر به نظر میرسند، اما یک مطالعهی تازه هشدار میدهد که این صرفهجوییها ممکن است خیلی زود از بین برود، زیرا چنین مدلهایی به توان پردازشی بیشتری نیاز دارند.
در واقع، طبق مطالعهای که پنجشنبه توسط Nous Research منتشر شد، مدلهای متنباز هنگام انجام وظایف مشابه، منابع محاسباتی بهمراتب بیشتری نسبت به مدلهای بسته مصرف میکنند.
پژوهشگران دهها مدل هوش مصنوعی را آزمایش کردند، از جمله سیستمهای بستهی گوگل و OpenAI، و همچنین مدلهای متنباز DeepSeek و Magistral. آنها میزان تلاش محاسباتی موردنیاز برای تکمیل وظایف یکسان در سه دسته—سؤالات دانشی ساده، مسائل ریاضی و معماهای منطقی—را اندازهگیری کردند.
برای این کار، آنها از تعداد توکنهایی که هر مدل برای حل و پاسخگویی به پرسشها مصرف میکرد بهعنوان معیاری برای منابع محاسباتی استفاده کردند.
به گفتهی نویسندگان:
«مدلهای متنباز ۱.۵ تا ۴ برابر بیشتر از مدلهای بسته توکن مصرف میکنند—و در مورد پرسشهای دانشی ساده حتی تا ۱۰ برابر—که این موضوع باعث میشود گاهی با وجود هزینهی کمتر هر توکن، در مجموع هر پرسش گرانتر تمام شود.»
چرا کارایی توکن اهمیت دارد؟
در هوش مصنوعی، یک توکن بخشی از متن یا داده است—ممکن است یک کلمه، بخشی از یک کلمه، یا حتی علائم نگارشی باشد—که مدلها برای درک زبان به کار میگیرند. مدلها متن را توکنبهتوکن پردازش و تولید میکنند، بنابراین هرچه تعداد توکنهای مصرفی بیشتر باشد، توان محاسباتی و زمان بیشتری لازم خواهد بود.
از آنجا که بیشتر مدلهای بسته فرایند استدلال خام یا زنجیرهی تفکر (Chain of Thought) خود را آشکار نمیکنند، پژوهشگران کارایی محاسباتی آنها را با شمارش تعداد توکنهای مصرفشده اندازهگیری کردند. چون مدلها بر اساس کل توکنهای خروجی در فرایند استدلال و تولید پاسخ نهایی صورتحساب میگیرند، تعداد توکنها شاخصی برای میزان تلاش لازم جهت تولید یک پاسخ محسوب میشود.
این موضوع برای شرکتهایی که از هوش مصنوعی استفاده میکنند از جهات بسیاری حائز اهمیت است.
پژوهشگران نوشتند:
«اول اینکه، هرچند میزبانی مدلهای متنباز ممکن است ارزانتر باشد، این مزیت هزینهای میتواند بهراحتی از بین برود اگر آنها برای حل یک مسئله به توکنهای بیشتری نیاز داشته باشند. دوم اینکه، افزایش تعداد توکنها منجر به زمان طولانیتر در تولید پاسخ و افزایش تأخیر خواهد شد.»

