رباتها مدتهاست که در محیطهای صنعتی کنترلشده و قابلپیشبینی عملکرد قابلاعتمادی دارند، اما خارج از این فضاها معمولاً با مشکل روبهرو میشوند.
برای کاهش این مشکل، مایکروسافت مدل Rho-alpha را معرفی کرده است؛ نخستین مدل رباتیک برگرفته از سری مدلهای بینایی–زبانی Phi. این شرکت میگوید رباتها برای دیدن بهتر و درک دقیقتر دستورها به ابزارهای پیشرفتهتری نیاز دارند.
مایکروسافت معتقد است این سیستمها میتوانند فراتر از خطوط مونتاژ عمل کنند و بهجای پیروی از دستورالعملهای ثابت، به شرایط متغیر واکنش نشان دهند.
مایکروسافت این رویکرد را به آنچه اکنون «هوش مصنوعی فیزیکی» نامیده میشود مرتبط میداند؛ حوزهای که در آن مدلهای نرمافزاری قرار است ماشینها را در موقعیتهای کمتر ساختارمند هدایت کنند.
این فناوری زبان، ادراک و عمل را با هم ترکیب میکند و وابستگی رباتها به خطوط تولید ثابت یا دستورالعملهای از پیش تعیینشده را کاهش میدهد.
مدل Rho-alpha فرمانهای زبان طبیعی را به سیگنالهای کنترلی رباتیک تبدیل میکند و روی وظایف نیازمند کار دودستی تمرکز دارد؛ کارهایی که هماهنگی میان دو بازوی رباتیک و کنترل دقیق را میطلبد.
مایکروسافت این سیستم را گسترشیافته رویکردهای معمول VLA توصیف میکند، زیرا دامنه ادراک و ورودیهای یادگیری را افزایش میدهد.

