به گزارش آفتاب شرق
هلدینگ چینی علیبابا از خانواده تازه مدلهای هوش مصنوعی استدلالگر خود با نام Qwen3 رونمایی کرد. علیبابا ادعا میکند مدلهای تازه این شرکت عملکردی شبیه مدلهای گوگل و OpenAI دارند و حتی در مواردی میتوانند از مدلهای این شرکتها پیشی بگیرند.
به گزارش تک کرانچ، این مدلها تحت مجوز «آزاد» از طریق پلتفرمهای Hugging Face و گیتهاب در دسترس کاربران قرار گرفتهاند یا بهزودی اراعه خواهد شد. اندازه این مدلها از ۰.۶ میلیارد پارامتر تا ۲۳۵ میلیارد پارامتر متغیر است. یک مدل هوش مصنوعی هر چه مقدار پارامترهای بیشتری داشته باشد، در تواناییهای حل قضیه کارکرد بهتری مشخص می کند.
مدلهای استدلالگر Qwen3 علیبابا بهزودی در دسترس کاربران قرار میگیرند
ظهور و اراعه مدلهای استدلالگر چینی همانند Qwen3 به آزمایشگاههای هوش مصنوعی غربی، همانند OpenAI، سختی بیشتری میآورند تا فناوریهای هوش مصنوعی توانمندتری اراعه دهند. رشد شرکتهای چینی در عرصه هوش مصنوعی این چنین علتشده سیاستگذاران کشورهای غربی بهسمت محدودکردن دسترسی شرکتهای چینی به تراشهها و فناوریهای روز حرکت کنند.
به حرف های علیبابا، مدلهای Qwen3 هیبریدی می باشند؛ یعنی هم میتوانند برای حل مسائل پیچیده زمان بگذارند و استدلال کنند هم در سریعترین زمان جواب را در دسترس کاربر قرار دهند. با منفعت گیری از توانایی استدلال، مدلهای هوش مصنوعی میتوانند دائم جوابهای خودشان را بازدید کنند.
برخی مدلها این چنین از معماری ترکیب متخصصان (MoE) منفعت گیری میکنند که میتواند برای جواب به سوالها از نظر محاسباتی کارآمدتر باشد. MoE ماموریت های بزرگ را به ماموریت های کوچکتر تقسیم و پردازش آنها را به مدلهای «متخصص» کوچکتر و تخصصیتر واگذار میکند.
به حرف های علیبابا، مدلهای Qwen3 از ۱۱۹ زبان حمایتمیکنند و روی مجموعهای از دادهها متشکل از نزدیک به ۳۶ تریلیون توکن آموزشدیدهاند. این هلدینگ چینی هفتههای قبل نیز از مدل هوش مصنوعی استدلالگر تصویری خود رونمایی کرده می بود.
علیبابا ادعا میکند قوت محاسباتی مدلهای Qwen3 نسبت به نسل قبلی این مدلها پیشرفت کرده است. هرچند خانواده مدلهای Qwen3 تا این مدت نمی توانند در حد مدلهای o۳ و o4-mini شرکت OpenAI ظاهر شوند، میتوانند هم چنان کارکرد قابلتوجهی از خود نشان دهند و برای از بین بردن نیازهای کاربران مناسب باشند.
دسته بندی مطالب
اخبار سلامتی