ارسال به دیگران پرینت ۱۴۰۴/۰۳/۱۸ ۲۱:۵۴:۱۶

هوش مصنوعی eleven v۳

مدل Eleven v3 معرفی شد؛ انقلابی در تبدیل متن به گفتار با احساسات واقعی‌تر | مدل جدید Elevenlabs صدا را با احساسات واقعی‌ بازسازی می‌کند

| شرکت Elevenlabs از جدیدترین مدل تبدیل متن به گفتار خود با نام Eleven v3 (Alpha) رونمایی کرده است؛ مدلی که تمرکز اصلی آن بر بازسازی طبیعی‌تر احساسات انسانی در صداهای مصنوعی است. این نسخه با پشتیبانی از بیش از ۷۰ زبان از جمله فارسی و قابلیت تولید گفتگوهای چندنفره طبیعی، گام مهمی در توسعه فناوری گفتار مصنوعی برداشته است.

نوشین کلاته

شرکت Elevenlabs از جدیدترین مدل تبدیل متن به گفتار خود با نام Eleven v3 (Alpha) رونمایی کرده است؛ مدلی که تمرکز اصلی آن بر بازسازی طبیعی‌تر احساسات انسانی در صداهای مصنوعی است. این نسخه با پشتیبانی از بیش از ۷۰ زبان از جمله فارسی و قابلیت تولید گفتگوهای چندنفره طبیعی، گام مهمی در توسعه فناوری گفتار مصنوعی برداشته است.

شرکت Elevenlabs جدیدترین مدل تبدیل متن به گفتار خود را با نام Eleven v3 (Alpha) معرفی کرده است که تمرکز اصلی آن بر تولید صداهای مصنوعی با بیان احساسات طبیعی‌تر و واقعی‌تر است. این مدل از فارسی هم پشتیبانی می‌کند.

این مدل توانایی بازسازی طبیعی‌تر احساسات متنوعی مانند نجوا، خنده، آه‌کشیدن و واکنش‌های هیجانی را نسبت به نسخه‌های قبلی دارد. هدف اصلی Elevenlabs در این نسخه برطرف‌کردن مشکل انتقال احساسات در صداهای مصنوعی بوده است؛ زیرا پیشتر فقط کیفیت صدا اهمیت داشت اما اکنون با بازطراحی کامل، این مدل می‌تواند صداهایی با احساسات واقعی‌تر و واکنش‌های طبیعی‌تر تولید کند.

قابلیت‌های مدل هوش مصنوعی Eleven v3

یکی از ویژگی‌های برجسته Eleven v3 پشتیبانی از بیش از 70 زبان ازجمله فارسی همچنین امکان اجرای طبیعی و روان گفتگوهای چندنفره است. کاربران می‌توانند از طریق API جدید متن‌های ساختاریافته را که شامل نوبت هر گوینده می‌شود، به مدل ارسال کنند و مدل خودکار مدیریت تغییر نوبت گوینده، تحولات احساسی و حتی قطع کلام‌ها را بر عهده می‌گیرد. این قابلیت برای تولید دیالوگ‌های چندصدایی بسیار کاربردی است و امکان تولید گفتگوهای پیچیده و طبیعی را فراهم می‌کند.کنترل شیوه بیان صداها از طریق برچسب‌های صوتی درون متن نیز از دیگر امکانات مهم Eleven v3 است. این برچسب‌ها که در قالب کروشه‌های کوچک و حروف کوچک نوشته می‌شوند، مانند [sighs] (آه کشیدن)، [excited] (هیجان‌زده) یا [whispers] (نجواکردن)، به کاربران اجازه می‌دهند احساسات مختلف و لحن گفتار را مستقیم تنظیم کنند. حتی می‌توان چندین برچسب را کنار هم قرار داد تا بیان دقیق‌تر و ظریف‌تری ایجاد شود؛ مثلاً We did it! [happily][shouts][laughs] («ما موفق شدیم! [شادی][فریاد][خنده]»).

به گفته شرکت Elevenlabs، این مدل بیشتر برای کاربردهای حرفه‌ای مانند تولید فیلم، کتاب صوتی و رسانه‌های دیجیتال طراحی شده است و نسخه نهایی API عمومی آن به‌زودی عرضه خواهد شد. هم‌اکنون Eleven v3 روی وب‌سایت شرکت در دسترس است و تا پایان ژوئن (خرداد) 80 درصد تخفیف برای استفاده از اپلیکیشن ارائه می‌شود. بااین‌حال، برای کاربردهای بلادرنگ یا گفتگوهای زنده، مدل‌های v2.5 Turbo یا Flash همچنان توصیه می‌شوند؛ زیرا نسخه فعلی v3 برای این موارد بهینه نشده و نسخه بلادرنگ آن در دست توسعه است.همچنین کلون‌های صوتی حرفه‌ای (Professional Voice Clones) فعلاً با این نسخه سازگاری کامل ندارند و نسبت به نسخه‌های قبلی کیفیت کمتری ارائه می‌دهند؛ بنابراین برای پروژه‌هایی که به ویژگی‌های بیانی جدید نیاز دارند، استفاده از کلون‌های صوتی آنی (Instant Voice Clones) یا صداهای ساخته‌شده پیشنهاد می‌شود.

منبع : دیجیاتو

به این خبر امتیاز دهید:

بر اساس رای ۰ نفر از بازدیدکنندگان

هوش مصنوعی

زلزله ویرانگر در ونزوئلا | بیش از ۲۱ هزار نفر مفقود شدند + تصاویر

پیشنهاد ویژه

اخبار مرتبط

دیدگاه تان را بنویسید

کباب لایه‌ای؛ پیشنهادی متفاوت برای مهمانی‌های تابستانی | با نان و مرغ، یک کباب مجلسی و آسان درست کنید +ویدئو

دیدگاه

آل‌بویه و عزاداری عاشورا: زمانی که سوگ کربلا وارد عرصه عمومی شد

در تاریخ تشیع، کمتر رویدادی را می‌توان یافت که به اندازه عزاداری عاشورا در دوره آل‌بویه بر شکل‌گیری هویت شیعی تأثیر…
ایرانیان در کامبوج از پیش از اسلام تا امروز | روایت جنایت خمرهای سرخ علیه ایرانیان شیعه

زینب بهرامی، پژوهشگر و فعال فرهنگی مقیم ژاپن، در روایتی مفصل از یک کنفرانس دانشگاهی در ژاپن، از نتایج تحقیقات بیش از…
تحلیل گران بی اعتبار را بیشتر بشناسیم | نظرات حاتم ‌قادری قبل از جنگ

در روزهای منتهی به جنگ، برخی تحلیلگران و دانشگاهیان تصویری نسبتاً قطعی با صورت بندی مدنظر خود از آینده ارائه می‌کردند…
چرا تمایل جامعه به دانستن کم شده است؟ | نخواستن دانستن

در یک روال عادی و در یک حکمرانی دموکراتیک، یکی از مبانی اصلی این است که امور موثر بر معیشت و رفاه خانوار براساس آرای…

توسعه

دیگر رسانه ها

دانلود فیلم

زلزله ویرانگر در ونزوئلا | بیش از ۲۱ هزار نفر مفقود شدند + تصاویر

قالیباف: آمریکا برای فریب افکار عمومی، دروغ می‌گوید | واشنگتن سویای تراریخته و وعده‌های بی‌ارزش صادر می‌کند

تردید دموکرات‌ها به دیپلماسی ترامپ با ایران | NOTUS: راه دیگری جز ادامه مذاکرات ندارند

هشدار جدی نهاد مدیریت آبراه خلیج فارس | تردد خارج از مسیرهای مجاز، فاقد تضمین ایمنی و پوشش بیمه است

خلاصه‌ای از مهم‌ترین اخبار شبانگاهی | جمع‌بندی مهم‌ترین اخبار ۴ تیرماه 1405

گاردین: طرح عمان برای تنگه هرمز با ایران متفاوت است | الگوبرداری از تنگه‌های مالاکا و سنگاپور

ادعای ونس درباره کانال نظامی ایران و آمریکا | یک مقام سپاه و یک مقام سنتکام در دوحه مستقر خواهند شد!

تنش دریایی در منطقه ادامه دارد| بلومبرگ: سه کشتی از جمله دو ابرنفت‌کش در تنگه هرمز دور زده و بازگشتند

واکنش تند سید رضا نریمانی به اظهارات اخیر پزشکیان +ویدئو

اصابت پرتابه ناشناس به کشتی باری در جنوب شرقی عمان | کشتی باری هدف پرتابه ناشناس قرار گرفت

هوش مصنوعی eleven v۳

مدل Eleven v3 معرفی شد؛ انقلابی در تبدیل متن به گفتار با احساسات واقعی‌تر | مدل جدید Elevenlabs صدا را با احساسات واقعی‌ بازسازی می‌کند

نوشین کلاته

قابلیت‌های مدل هوش مصنوعی Eleven v3

پیشنهاد ویژه

اخبار مرتبط

رشد شخصی با هوش مصنوعی

گوگل مدل زبانی جمینای ۲.۵ پرو را معرفی کرد | برتری هوش مصنوعی جدید در کدنویسی و استدلال منطقی!

عینک هوش مصنوعی که جایگزین تحصیل می‌شود | مترجم همیشه همراه +ویدئو

هوش مصنوعی چه اثری روی عملکرد کارکنان دارد؟ | انسان‌های خودکار

هوش مصنوعی آرزوی مادر شهید را برآورده کرد | لبخند پسر شهید زنده شد +ویدئو

دیدگاه تان را بنویسید

دیدگاه

آل‌بویه و عزاداری عاشورا: زمانی که سوگ کربلا وارد عرصه عمومی شد

ایرانیان در کامبوج از پیش از اسلام تا امروز | روایت جنایت خمرهای سرخ علیه ایرانیان شیعه

تحلیل گران بی اعتبار را بیشتر بشناسیم | نظرات حاتم ‌قادری قبل از جنگ

چرا تمایل جامعه به دانستن کم شده است؟ | نخواستن دانستن

توسعه

دیگر رسانه ها