متا اعلام کرد که ابزار هوش مصنوعی Voicebox قادر است به تسهیل در مکالمه طبیعی با دستیارهای دیجیتال کمک کند.
شرکتهای معتبری همچون مایکروسافت و گوگل در زمینه هوش مصنوعی بسیار فعال هستند و اخیراً توجه زیادی به خود جلب کردهاند. با این حال، شرکت متا نیز در حوزه توسعه محصولات و سرویسهای مبتنی بر هوش مصنوعی فعالیت میکند.
با انتشار یک مقاله در وبلاگ خود، متا اعلام کرد که در حال کار بر روی ابزار هوش مصنوعی Voicebox است. Voicebox قادر است به طور گستردهتری وظایف مختلفی را مرتبط با تولید گفتار به صورت طبیعی، مانند ویرایش، نمونهبرداری و سبکدهی انجام دهد. این وظایف را Voicebox بدون نیاز به آموزش موضوعی میتواند انجام دهد.
توصیف Voicebox توسط متا به شرح زیر است:
- تبدیل متن به صوت با در نظر گرفتن متن در سیاق: با دریافت یک نمونه صوتی دو ثانیهای، Voicebox میتواند نحوه لحن و سبک صدا را یاد بگیرد و سپس متن را با همان سبک به صوت تبدیل کند.
- ویرایش و بازسازی مکالمه با کاهش نویز: این ابزار قادر است بخشی از یک مکالمه صوتی که توسط نویز مختل شده است، بازسازی کند و همچنین کلماتی که به درستی تلفظ نشدهاند را بدون نیاز به ضبط مجدد، اصلاح کند.
- انتقال سبک و متن مکالمه به زبانهای دیگر: Voicebox قادر است نمونهای از یک مکالمه یا بخشی از متن را دریافت کرده و آن را به صورت فایل صوتی در زبانهای انگلیسی، فرانسوی، آلمانی، اسپانیایی، لهستانی و پرتغالی تبدیل کند.
- نمونهبرداری چندگانه برای گفتار: Voicebox از مجموعهای از دادههای متنوع برای تولید گفتار استفاده میکند تا بتواند با دقت بالاتری گفتار را در شش زبان مذکور تولید کند.
متا باور دارد که در آینده، مدلهای چند منظوره هوش مصنوعی مانند Voicebox میتوانند به دستیارهای دیجیتال و شخصیتهای NPC مانند MetaVerse، صداهای طبیعی بیفزایند. از طرفی، افراد کمبینا یا نابینا میتوانند با استفاده از این ابزار، پیامهای متنی دوستان خود را به صورت صوتی بشنوند و خالقان محتوا نیز میتوانند به راحتی قطعات صوتی را ایجاد یا ویرایش کنند.
نظرات کاربران