عرضه مدل هوش مصنوعی به‌روزشده DeepSeek‑V۳.۱ با پشتیبانی از تراشه‌های داخلی

استارت‌آپ چینی DeepSeek مدل «DeepSeek‑V۳.۱» را با ساختار استنتاج ترکیبی، سرعت پردازش بالاتر و قابلیت‌های تقویتی منتشر کرد. این مدل برای تراشه‌های نسل بعد داخلی طراحی شده و تعرفه API از ۶ سپتامبر ۲۰۲۵ به‌روز می‌شود.

به گزارش امیت، این مدل جدید با ساختار استنتاج ترکیبی، سرعت پاسخگویی سریع‌تر و قابلیت‌های عامل تقویت‌شده عرضه شده است. همچنین DeepSeek از ۶ سپتامبر ۲۰۲۵ تعرفه‌های استفاده از API خود را اصلاح خواهد کرد.

هدف شرکت از عرضه این نسخه ارتقاء عملکرد در کنار تطبیق با تراشه‌های بومی اعلام شده است که نشان می‌دهد UE8M0 FP8 precision format این مدل به‌منظور هماهنگی با «تراشه‌های نسل بعد داخلی» طراحی شده، البته بدون اشاره به نام سازنده یا مدل خاص.

با استفاده از ساختار استنتاج ترکیبی، مدل برای استفاده در دو حالت تفکر (Reasoning) و غیرتفکر (Non‑Reasoning) بهینه شده است. کاربران می‌توانند با استفاده از دکمه «تفکر عمیق» در اپلیکیشن یا وب‌سایت شرکت بین این دو حالت جابه‌جا شوند؛ هر دو پلتفرم در حال حاضر نسخه V۳.۱ را اجرا می‌کنند.

DeepSeek تأکید کرده این فرمت FP8 هشت‌بیتی باعث می‌شود مدل با مصرف حافظه کمتر و سرعت بیشتر، توان عملیاتی بهتری داشته باشد.

این شرکت پیش‌تر با مدل‌هایی همچون R۱ و نسخه‌های قبلی V۳ شناخته شده بود. تلاش برای استفاده از تراشه‌های داخلی—خصوصاً تراشه‌های هواوی برای R۲—با مشکلاتی در سخت‌افزار مواجه شد و باعث تأخیر در انتشار شد. نتایج آن‌چنان نبود که DeepSeek را راضی کند، و این شرکت در نهایت برای آموزش مدل به تراشه‌های Nvidia متکی شد و از تراشه‌های داخلی فقط برای استنتاج بهره گرفت.

دیدگاهتان را بنویسید لغو پاسخ

مطالب مشابه

دیدگاهتان را بنویسید