به گزارش آفتاب شرق
در پژوهشی تازه از دانشگاه کالیفرنیا سندیگو، مدل زبانی بزرگ GPT-4.5 متعلق به OpenAI آزمون تورینگ را با نرخ پیروزی دیدنی ۷۳ درصدی پشت سر گذاشت؛ یعنی در زیاد تر جلسات چت پنجدقیقهای، مخاطبان انسانی فکر کردند GPT-4.5 انسان است. علاوهبرآن، مدل «Llama‑۳.۱‑405B» از متا نیز با نرخ ۵۶ درصدی موفق ظاهر شد.
مطابق گزارش «InterestingEngineering»، این پیروزیها در شرایطی رقم خورد که به این مدلها دستور داده شده می بود در قالب شخصیت (Persona) خاصی سخن بگویید کنند، که علتشباهت زیاد تر گفتگوی آنها به مکالمات واقعی انسانها شد.
آیا آزمون تورینگ تا این مدت معیار هوشمندی است؟
مدل GPT‑4o که بهطور عمومی در چتجیپیتی منفعت گیری میشود، فقط ۲۱ درصد موفق می بود و این تفاوت مشخص می کند منفعت گیری از «پرسونا» تا چه اندازه بر پیروزی در آزمون تورینگ اثرگذار است.
باوجود این پیروزیها، او گفت و گو قدیمی حوالی این که آزمون تورینگ واقعاً معیار مناسبی برای سنجش هوش است، مجدد داغ شده. برخی منتقدان اعتقاد دارند این آزمون بیشتر از آنکه توانمندی واقعی هوش مصنوعی را بسنجد، به توانایی آن در فریب مخاطب انسانی مربوط است؛ بهعبارتدیگر، اگر انسان نتواند فهمید شود با ماشین سخن بگویید میکند، الزاماً به معنی هوشمندی آن ماشین نیست.
طرفداران آزمون تورینگ میگویند همین شباهت گفتاری به انسان و توانایی برقراری گفتگویی طبیعی خود نشانهای از پیشرفت هوش مصنوعی است.
در شرایطی که انسانها بیشتر از هر زمان فرد دیگر با رابطهای گفتگوی مبتنیبر هوش مصنوعی روبه رواند، تعداد بسیاری اعتقاد دارند آزمون تورینگ دیگر همانند قبل ابزاری فقطً فلسفی نیست، بلکه تبدیل به ابزار بازدید فنیتری شده است. درعینحال، مدلهای هوش مصنوعی هم چنان از فهمیدن، خودآگاهی و احساسات انسانی نصیباند اما شکی نیست که در فریب مخاطب بهنحوه چشمگیری پیشرفت کردهاند.
نتایج این آزمایش بهصورت پیشچاپ انتشار شده است.
دسته بندی مطالب
اخبار سلامتی