یکشنبه, خرداد ۱۱, ۱۴۰۴

به‌روزرسانی تازه مدل DeepSeek R1 رسماً معارفه شد + ویدیو_آفتاب شرق

مریم یزدانی
3 Min Read


به گزارش آفتاب شرق

استارتاپ چینی DeepSeek که به‌گفتن یک رقیب جدی برای شرکت‌های هوش مصنوعی آمریکایی فعالیت می‌کند، به‌روزرسانی تازه مدل استدلالی R1 خود را از طریق مطلب‌رسان WeChat معارفه و سپس در پلتفرم Hugging Face انتشار کرده است.

DeepSeek که امسال با مدل R1 دقت بسیاری را به خود جلب کرد، اکنون نسخه جدیدی از این مدل را با مجوز باز MIT روی پلتفرم Hugging Face انتشار کرده است. این مجوز به کاربران اجازه می‌دهد تا از این مدل به‌صورت تجاری منفعت گیری کنند.

به حرف های DeepSeek، این به‌روزرسانی جزئی است و نسبت به نسخه قبلی شامل چندین بهبود می‌شود. با این حال، مخزن مربوط به این مدل در Hugging Face فاقد توضیحات دقیق بوده و فقط شامل فایل‌های پیکربندی و وزن‌های مدل است؛ یعنی همان پارامترهایی که حرکت مدل را تعیین می‌کنند.

مدل تازه R1 دارای ۶۸۵ میلیارد پارامتر است که نشان‌دهنده اندازه عظیم آن است. این حجم بالا علتمی‌شود اجرای مدل بدون تغییرات خاص روی سخت‌افزارهای خانگی ممکن نباشد.

کارکرد مدل تازه DeepSeek R1 از زبان کاربران

مطابق داده‌های منتشرشده توسط برخی کاربران فعال در حوزه مدل‌های هوش مصنوعی، نسخه تازه DeepSeek R1 کارکرد بهتری نسبت به نسخه قبلی خود در بنچمارک Thematic Generation ثبت کرده است. امتیاز این مدل در این آزمون از ۱.۸۰ به ۱.۷۴ افت یافته که نشان‌دهنده بهبود در توانایی مدل برای تشکیل محتوای نوشته‌محور است؛ چرا که در این معیار، امتیاز پایین‌تر نشان‌دهنده کیفیت بالاتر است.

این چنین کاربر فرد دیگر با انتشار کردن ویدیوی زیر که کارکرد DeepSeek-R1-0528 (نسخه تازه) را در برابر Claude-4-Sonnet مشخص می کند، ادعا کرده که این نسخه در حوزه استدلال منطقی با بهبود قابل‌توجهی همراه بوده است. مطابق حرف های این کاربر، مدل تازه در عرصه گسترش فرانت‌اند و منفعت گیری هوشمندانه‌تر از ابزارها نیز پیشرفت کرده است.

این ارتقاها می‌تواند R1 را به گزینه‌ای نیرومندتر برای گسترش‌دهندگان و کاربران حرفه‌ای تبدیل کند.

DeepSeek در اغاز سال جاری با معارفه نسخه اولیه مدل R1 سر و صدای بسیاری به‌پا کرد و حتی با رقبای بزرگی همانند OpenAI قیاس شد. با‌این‌حال، فناوری این استارتاپ چینی دقت برخی نهادهای نظارتی آمریکایی را نیز به خود جلب کرده و برخی آن را تهدیدی برای امنیت ملی ایالات متحده دانسته‌اند.

این حرکت این چنین موج جدیدی از انتشار کردن مدل‌ها توسط شرکت‌های چینی نظیر علی‌بابا و Zhipu AI را به جستوجو داشت.

سریعترین موتور جستجوگر خبر پارسی – اخبار لحظه به لحظه از معتبرترین خبرگزاری های پارسی زبان در آفتاب شرق

دسته بندی مطالب
اخبار سلامتی

اخبار اجتماعی

اخبار ورزشی

فرهنگ وهنر

اخبار تکنولوژی

کسب وکار

Share This Article