به گزارش آفتاب شرق
تیمی از محققان هوش مصنوعی در دانشگاه چینهوا چین مدل زبانی بزرگی به نام «LongWriter» ساختهاند که به ادعای سازندگان میتواند خروجی متنی تا ۱۰ هزار کلمه تشکیل کند. باتوجهبه این که مدلهای رایج جاری میتوانند تا نزدیک به ۲ هزار کلمه خروجی تشکیل کنند، LongWriter در عرصه نگارش متنهای طویل زیاد کارآمدتر خواهد می بود. این چنین این مدل متنباز است و گسترشدهندگان میتوانند آن را بهبود دهند.
بر پایه گزارش Tech Xplore، حداکثر خروجی متنی مدلهای هوش مصنوعی جاری تقریباً ۲۰۰۰ کلمه است. محققان گمان خواهند داد این کار به این علت باشد که این مدلها با مطالب مختصر آموزش دیدهاند. محققان میخواستند ببینند اگر مدل خود را با منفعت گیری از مطالب طویلتر آموزش بدهند، خروجی آن نیز طویل خواهد شد یا خیر.
هوش مصنوعی LongWriter با خروجی ۱۰ هزار کلمهای
محققان برای آزمایش ایده خود ابتدا مدل ۹ میلیارد پارامتری را با منفعت گیری از مجموعهای از دادههای معمولی که شامل مطالبی با طول کمتر از ۲۰۰۰ کلمه می بود، آموزش دادند. همان گونه که انتظار میرفت، این مدل زمان گفتگو، نمیتوانست متونی طویلتر از ۲۰۰۰ کلمه تشکیل کند.
در مرحله سپس، محققان دادههایی را جمعآوری کردند که مجموعهای به نام LongWriter-6k است و ۶۰۰۰ نوشته مکتوب با طول ۲۰۰۰ تا ۳۲ هزار کلمه دارد. سپس آنها LLM خود را با منفعت گیری از مجموعه داده تازه آموزش دادند و دریافتند با این کار، طول مطالب خروجی تقریباً به ۱۰ هزار کلمه افزایش مییابد.
این مدل تازه متنباز است و در GitHub نیز انتشار شده. با این چنین مدلی کاربران بهتر میتوانند در عرصههای مختلفمقاله، کتاب یا فیلمنامه تشکیل کنند. یقیناً باتوجهبه این که این چنین مدلی میتواند یک تاثییر مکتوب کامل تشکیل کند، محققان میگویند باید ملاحظات اخلاقی را نیز در نظر گرفت.
مدتی پیش نیز OpenAI از مدل GPT-4o Long Output رونمایی کرد که به کاربران امکان میدهد جوابهای طویل، بهاندازه رمانی ۲۰۰ صفحهای، دریافت کنند.
دسته بندی مطالب
اخبار سلامتی