هوش مصنوعی بهسرعت در حال پیشرفت است و این پیشرفتها میتوانند این فناوری را به ابزاری بسیار مفید برای تولیدکنندگان محتوا تبدیل کنند. صنایع خلاقانه نیاز دارند تا با استفاده از فناوری به جریان مداوم محتوا، مخاطبان را جلب و راضی نگهدارند و این محتوا باید به نحوی خلق شود که جذابیت داشته باشد. هنگامی که به مدلهای سهبعدی اشاره میشود، الگوریتمهای هوش مصنوعی میتوانند با کاهش زمان تولید به تولیدکنندگان محتوا کمک کنند.
تیم تحقیق و توسعه ادوبی و دانشگاه ملی استرالیا با استفاده از مجموعه دادههای بزرگ برای آموزش الگوریتمهای یادگیری ماشینی، یک فناوری جالب توسعه دادهاند که در تولید مدلهای سهبعدی عملکرد شگفتانگیزی دارد. آنها اولین مدل بازسازی بزرگ (LRM) را ایجاد کردهاند که قادر است شکل مدل سهبعدی را از تصویر دوبعدی پیشبینی کند و این کار را در مدت پنج ثانیه انجام دهد.
در مقالهی خود، محققان توضیح دادهاند که الگوریتمهای نسل قبلی برای ساخت مدل سهبعدی، بر اساس مجموعه دادههای محدود بر تصویر آموزش داده شدهاند. در حال حاضر مدل LRM از معماری بسیار مقیاسپذیر و مبتنیبر ترانسفورماتور با بیش از ۵۰۰ میلیون پارامتر آموزش داده شده و از یک میلیون شکل سهبعدی موجود در دادههای Objaverse و MVImgNet بهره میبرد.
تحقیقگران اظهار داشتهاند که مدل LRM قادر است با کیفیت بازسازیهای سهبعدی را از تصاویر مختلف از جمله تصاویر دنیای واقعی تولید کند. علاوه بر این، این مدل قادر است تصاویر عادی ساختهشده با سایر سرویسهای هوش مصنوعی مانند DALL-E و میدجورنی را بهعنوان ورودی دوبعدی دریافت کند.
یوکان هانگ، نویسنده اصلی مقالهی LRM، اظهار میکند که این مدل یک پیشرفت مهم در زمینه بازسازی سهبعدی از تصاویر ساده دارد. الگوریتم هوش مصنوعی قادر است به دقت هندسهای از ویدیو یا تصویر مورد نظر ایجاد کند و بافتهای پیچیده مانند دانههای چوب را بر روی آنها حفظ کند.
به گفته پژوهشگران، LRM قابل استفاده در طیف گستردهای از صنایع از جمله طراحی، سرگرمی و بازی را فراهم میکند. طراحان میتوانند با استفاده از این مدل، فرآیند مدلسازی سهبعدی را سریعتر و با کاهش قابل توجهی در زمان، برای ساخت مدلهای خاص بازیهای ویدیویی یا انیمیشنها انجام دهند.
تولید محتوای سهبعدی در صنعتی که به سرعت در حال تحول است، چالشهای زیادی را برای توسعه این حوزه ایجاد کرده است و شرکتهای هوش مصنوعی سعی دارند با ارائه راهکارهایی نوین، مانند سرویس Stable 3D که تازه توسط Stability AI معرفی شده است، به این چالشها پاسخ دهند.
LRM این امکان را به کاربران عادی میدهد که مدلهای سهبعدی بسیار دقیقی از تصاویری که با دوربین موجود در گوشی هوشمندشان گرفتهاند، بسازند. هرچند LRM هنوز با چالشهایی مانند بافتهای تار مواجه است، اما این فناوری دنیایی پر از فرصتهای خلاقانه را برای افراد و کسبوکارها به ارمغان میآورد.
نظرات کاربران