به گزارش آفتاب شرق
انویدیا بهتازگی مدل هوش مصنوعی جدیدی به نام Fugatto را معارفه کرده است که میتواند دستورات متنی کاربران را به صدا تبدیل یا با منفعت گیری از این دستورها، فایلهای صوتی را ویرایش کند.
انویدیا پادشاه مطلق بازار تراشههای هوش مصنوعی است، اما این شرکت در عرصه ساخت مدلهای نرمافزاری هوش مصنوعی نیز ازجمله پیشگامان محسوب میشود. تازه ترین مدل هوش مصنوعی معارفه شده توسط انویدیا که این شرکت آن را «چاقوی سوئیسی برای صدا» توصیف میکند، میتواند ابزاری زیاد کاربردی برای تولیدکنندگان محتواهای ویدیویی باشد.
Fugatto تا این مدت بهصورت عمومی در دسترس کاربران قرار نگرفته است
به حرف های انویدیا، مدل «Foundational Generative Audio Transformer Opus 1» یا بهاختصار Fugatto میتواند دستوراتش را بهصورت متنی از کاربران دریافت کرده و منطبق با این دستورات، فایلهای صوتی بسازد. کاربران این چنین میتوانند از Fugatto برای ویرایش فایلهای صوتی ازپیشساخته شده نیز منفعت گیری کنند.
این مدل هوش مصنوعی توسط تیمی از متخصصان این حوزه در سراسر جهان ساخته شده. این چنین انویدیا میگوید که این نوشته علتنیرومندتر شدن قابلیتهای چندزبانی و چندلهجهای Fugatto شده است.
«رافائل واله»، یکی از محققان این پروژه و مدیر تحقیقات صوتی کاربردی در انویدیا، دراینباره میگوید تصمیم آنها ساخت مدلی بوده که صدا را همانند انسانها فهمیدن و تشکیل کند. انویدیا برخی از سناریوهای احتمالی برای منفعت گیری از این مدل در دنیای واقعی را فهرست کرده که Fugatto میتواند برای آنها کاربردی باشد.
برای مثال، تولیدکنندگان موسیقی میتوانند از این مدل هوش مصنوعی برای تشکیل مثالهای اولیه یک آهنگ منفعت گیری کرده و سپس بهراحتی آن را ویرایش کنند. مردم عادی، تولیدکنندگان محتوا و گسترشدهندگان بازیهای ویدیویی نیز میتوانند نهایت منفعت گیری را از قابلیتهای مدل Fugatto ببرند. یقیناً Fugatto تا این مدت بهصورت عمومی در دسترس کاربران قرار ندارد، و انویدیا نیز نگفته که چه وقتی دسترسی عمومی به آن فراهم میشود.
شرکتهای متا و گوگل نیز پیشازاین مدلهای هوش مصنوعی شبیهی را معارفه کرده بودند که میتوانست دستورات متنی کاربران را به صدا تبدیل کند. مدل هوش مصنوعی گوگل MusicLM نام دارد و کاربران میتوانند از طریق وبسایت AI Test Kitchen به آن دسترسی داشته باشند.
دسته بندی مطالب
اخبار سلامتی