استارتآپ سیلیکون ولی، d-Matrix، که توسط مایکروسافت پشتیبانی میشود، یک راهحل مبتنی بر چیپلت توسعه داده است که برای استنتاج سریع و دستههای کوچک مدلهای زبانی بزرگ (LLMs) در محیطهای سازمانی طراحی شده است. معماری این راهحل از یک رویکرد تماماً دیجیتال محاسبه در حافظه استفاده میکند و از سلولهای SRAM اصلاحشده برای سرعت و بهرهوری انرژی بهره میبرد.
Corsair، محصول فعلی d-Matrix، به عنوان «اولین پلتفرم محاسباتی هوش مصنوعی از نوع خود» توصیف شده است و دارای دو ASIC d-Matrix روی یک کارت PCIe با ارتفاع و طول کامل است که هر ASIC شامل چهار چیپلت میباشد. این محصول در مجموع توان محاسباتی ۹.۶ پتافلاپ FP4 را با ۲ گیگابایت حافظه عملکردی مبتنی بر SRAM ارائه میدهد. برخلاف طراحیهای سنتی که به HBM گرانقیمت متکی هستند، Corsair از حافظه ظرفیتی LPDDR5 استفاده میکند که تا ۲۵۶ گیگابایت در هر کارت برای مدیریت مدلهای بزرگتر یا بارهای کاری استنتاج دستهای فراهم میکند.
d-Matrix ادعا میکند که Corsair در مقایسه با جایگزینهای GPU، مانند Nvidia H100 که بسیار محبوب است، ۱۰ برابر عملکرد تعاملی بهتر، ۳ برابر بهرهوری انرژی و ۳ برابر عملکرد به هزینه بهتری ارائه میدهد.