استارتآپ چینی DeepSeek مدل «DeepSeek‑V۳.۱» را با ساختار استنتاج ترکیبی، سرعت پردازش بالاتر و قابلیتهای تقویتی منتشر کرد. این مدل برای تراشههای نسل بعد داخلی طراحی شده و تعرفه API از ۶ سپتامبر ۲۰۲۵ بهروز میشود.
به گزارش امیت، این مدل جدید با ساختار استنتاج ترکیبی، سرعت پاسخگویی سریعتر و قابلیتهای عامل تقویتشده عرضه شده است. همچنین DeepSeek از ۶ سپتامبر ۲۰۲۵ تعرفههای استفاده از API خود را اصلاح خواهد کرد.
هدف شرکت از عرضه این نسخه ارتقاء عملکرد در کنار تطبیق با تراشههای بومی اعلام شده است که نشان میدهد UE8M0 FP8 precision format این مدل بهمنظور هماهنگی با «تراشههای نسل بعد داخلی» طراحی شده، البته بدون اشاره به نام سازنده یا مدل خاص.
با استفاده از ساختار استنتاج ترکیبی، مدل برای استفاده در دو حالت تفکر (Reasoning) و غیرتفکر (Non‑Reasoning) بهینه شده است. کاربران میتوانند با استفاده از دکمه «تفکر عمیق» در اپلیکیشن یا وبسایت شرکت بین این دو حالت جابهجا شوند؛ هر دو پلتفرم در حال حاضر نسخه V۳.۱ را اجرا میکنند.
DeepSeek تأکید کرده این فرمت FP8 هشتبیتی باعث میشود مدل با مصرف حافظه کمتر و سرعت بیشتر، توان عملیاتی بهتری داشته باشد.
این شرکت پیشتر با مدلهایی همچون R۱ و نسخههای قبلی V۳ شناخته شده بود. تلاش برای استفاده از تراشههای داخلی—خصوصاً تراشههای هواوی برای R۲—با مشکلاتی در سختافزار مواجه شد و باعث تأخیر در انتشار شد. نتایج آنچنان نبود که DeepSeek را راضی کند، و این شرکت در نهایت برای آموزش مدل به تراشههای Nvidia متکی شد و از تراشههای داخلی فقط برای استنتاج بهره گرفت.