اتفاقات معارفه GPT-5 حاشیه‌ساز شد؛ نمایش نمودارهای غیرواقع؟_آفتاب شرق

مریم یزدانی
3 Min Read

[ad_1]
به گزارش آفتاب شرق

در جریان اتفاقات معارفه GPT-5 که شب قبل برگزار شد، OpenAI چند نمودار را نمایش داد که کارکرد مدل تازه را زیاد دیدنی نشان می‌دادند. اما با مقداری دقت، اشکار شد برخی از این نمودارها مشکل بزرگی دارند که علتمی‌شود مصرف‌کنندگان فهمیدن درستی از پیشرفت GPT-5 نداشته باشند.

بر پایه گزارش ورج، یکی از نمودارهای نمایش داده شده مربوط به برسی «فریب» مدل‌ها بوده که مقیاس‌ آن به‌طور شگفت‌و‌غریبی نامرتب بوده است. برای مثال، در قسمت «فریب در کدنویسی»، نمودار روی صحنه نشان می‌داد که GPT-5 در حالت «با تفکر» نرخ فریب ۵۰ درصدی دارد. این عدد با نرخ ۴۷.۴ درصدی مدل کوچک‌تر o3 قیاس شده می بود، اما ستون مربوط به o3 به شکل غیرمنطقی بلندتر ترسیم شده است.

مسئله دلنشین دیگر این که در وبلاگ رسمی OpenAI رقم های متفاوت و درست‌تری وجود دارد و در آن نرخ فریب GPT-5 برابر با ۱۶.۵ درصد ذکر شده است.

مشکل بزرگ نمودارهای مربوط به GPT-5

همانطور که در عکس زیر قابل مشاهده است، امتیازات o3 و GPT-4o در بنچمارک SWE-bench Verified اعداد متغیری را مشخص می کند اما اندازه ستون آنها یکسان ترسیم شده است. این چنین GPT-‌۵ با وجود اختلاف ۵ امتیازی نسبت به o3 ستون زیاد بلندتری دارد.

این اشتباهات به‌قدری آشکار بوده و با انتقاد کاربران در شبکه‌های اجتماعی همراه می بود که «سم آلتمن، مدیرعامل OpenAI، آن را «نادرست بزرگ نموداری» نامید و او گفت نسخه صحیح در وب‌سایت شرکت انتشار شده است.

یکی از اعضای تیم بازاریابی OpenAI هم عذرخواهی کرده و در پست خود نوشت:

«نمودار را در وبلاگ اصلاح کردیم، دوستان. بابت این خطای ناخواسته عذرخواهی می‌کنیم.»

OpenAI تا بحال به خواست رسانه‌ها برای اظهار نظر زیاد تر جواب نداده است. اشکار نیست این نمودارها با پشتیبانی GPT-5 تهیه شده‌اند یا خیر، اما این چنین خطایی در روز رونمایی بزرگ، آن هم وقتی که شرکت روی «پیشرفت دیدنی در افت خطاها و توهمات» مدل تازه اصرار داشت، چندان خوشایند به نظر نمی‌رسد.

دسته بندی مطالب
اخبار سلامتی

سریعترین موتور جستجوگر خبر پارسی – اخبار لحظه به لحظه از معتبرترین خبرگزاری های پارسی زبان در آفتاب شرق

اخبار اجتماعی

اخبار ورزشی

فرهنگ وهنر

اخبار تکنولوژی

کسب وکار

[ad_2]

Share This Article