توسعه مدلهای هوش مصنوعی در هند در مقایسه با آمریکا، اروپا و چین با سرعت کمتری پیش رفته است. تنها تعداد محدودی از استارتاپهای هندی مدلهای هوش مصنوعی منتشر کردهاند و بیشتر این محصولات نیز در حوزه مدلهای زبانی بزرگ یا مدلهای صوتی بودهاند.
دولت هند برای تشویق توسعه بیشتر این فناوری، برنامه «ماموریت هوش مصنوعی هند» را با بودجهای حدود ۱.۲ میلیارد دلار راهاندازی کرده است. این طرح، از جمله، به استارتاپهای منتخب دسترسی یارانهای به توان پردازشی مبتنی بر GPU میدهد؛ مشروط بر اینکه مدلهای خود را بهصورت عمومی منتشر کنند.
یکی از ۱۲ استارتاپ منتخب این برنامه، Avataar AI، مدل ویدیویی جدیدی به نام Varya معرفی کرده است. این مدل برای درک بهتر زمینهها و ویژگیهای محلی طراحی شده و میتواند مواردی مانند جشنوارهها، غذاها و پوششهای مختلف را شناسایی کند.
این استارتاپ که با حمایت Peak XV Partners فعالیت میکند و بر توسعه ابزارهای ویدیویی برای تجارت الکترونیک تمرکز دارد، مدل واریا را از ابتدا توسعه نداده است. این شرکت کار خود را بر پایه مدل تولید ویدیوی Wan 2.2 که توسط Alibaba منتشر شده، آغاز کرد و با استفاده از روشی به نام «تقطیر مدل» (Distillation)، تواناییهای آن را در نسخهای سبکتر و سریعتر که برای نیازهای خاص آواتار بهینه شده است، فشردهسازی کرد.
نتیجه این فرایند، مدلی است که به جای ۵۰ مرحله موردنیاز در Wan 2.2، تنها در چهار مرحله اجرا میشود و میتواند ویدیوها را ۱۰ برابر سریعتر و با هزینهای بسیار کمتر تولید کند.
برای نمونه، واریا با استفاده از پردازنده گرافیکی NVIDIA H200 قادر است یک ویدیوی ۵ ثانیهای با کیفیت 720p را در ۴۵ ثانیه تولید کند، در حالی که تولید همان ویدیو با مدل Wan 2.2 حدود ۱٬۲۳۰ ثانیه زمان نیاز دارد.
