محققان با استفاده از یک مدل پردازش زبان طبیعی، موفق شدهاند یک سیستم ابداع کنند که توانایی تبدیل توضیحات متنی کاربر به انیمیشن سهبعدی را داراست. تیم تحقیقاتی از دانشگاه ملی استرالیا، دانشگاه آکسفورد و آکادمی هوش مصنوعی پکن، این سیستم هوش مصنوعی جدید را با نام 3D-GPT توسعه دادهاند. این سیستم بهسادگی میتواند از طریق توصیفات متنی ارائه شده توسط کاربر، مدلهای سهبعدی ایجاد کند.
در مقالهای علمی، این سیستم به نام 3D-GPT توضیح داده شده است و به طور مقایسهای، روشی کارآمدتر برای ایجاد مدلهای سهبعدی نسبت به مدلسازیهای فعلی ارائه میدهد.
3D-GPT درخواست کاربر را تحلیل کرده و به اقدامات لازم تجزیه میکند. این سیستم پروژه مدلسازی سهبعدی را به بخشهای قابل دسترس تقسیم کرده و سپس عامل مناسب را برای هر کار تعیین میکند. این سیستم از چندین عامل هوش مصنوعی استفاده میکند، هرکدام به بخشی از درک توصیف متنی و اجرای فرآیند مدلسازی تمرکز دارند.
محققان اظهار داشتهاند: “3D-GPT با بهرهگیری از مدل زبان بزرگ به عنوان راهکار اصلی مسئله، توصیفات متنی پروژه را به صورت اقداماتی تفصیلی مشخص میکند که برای مدلسازی سهبعدی لازم است انجام شوند. سپس برای اجرای هر بخش، عامل مناسب برای آن انتخاب میشود.”
عوامل اصلی این سیستم شامل عامل ارسال وظیفه (که دستورات متنی را تجزیه و تحلیل میکند)، عامل مفهومسازی (که جزئیاتی را افزوده و ممکن است در توصیف اولیه فراموش شده باشد) و عامل مدلسازی (که پارامترها را تنظیم کرده و کدی را تولید میکند تا نرمافزارهای سهبعدی مانند Blender را اجرا کند).
با تجزیه و تحلیل فرآیند مدلسازی و استفاده از عوامل هوش مصنوعی تخصصی، 3D-GPT قادر خواهد بود درخواست کاربر را تفسیر کرده و توصیفات متنی را با افزودن جزئیات لازم بهبود دهد و در نهایت مدل سهبعدی مطابق با نیازهای کاربر ایجاد کند.
این سیستم جدید بر اساس این دستورات آزمایش شد: “صبح بهاری مهآلود، جایی که گلهای نمناک در مرتع سرسبزی رشد میکنند و در اطراف آن درختان در حال شکوفهدادن هستند.” 3D-GPT توانست صحنههای سهبعدی کاملی با گرافیک واقعگرایانهای تولید کند که عناصر توصیفشده در متن را دقیقاً منعکس کند.
پژوهشگران اظهار داشتهاند: «تحقیقات تجربی ما نشان میدهد که 3D-GPT نهتنها دستورها را تفسیر و اجرا میکند و نتایج قابل اعتمادی ارائه میدهد، بلکه با طراحان انسانی بهطور مؤثری همکاری مینماید.»
در مقایسه با ساختن مدلها از ابتدا، 3D-GPT از نرمافزارهای طراحی سهبعدی موجود بهرهمیبرد؛ به همین دلیل، این سیستم امکان انعطافپذیری را برای تولید محتوای 3D با در نظر گرفتن پیشرفتهای تکنیکهای مدلسازی فراهم میکند.
پژوهشگران نتیجه میگیرند که سیستم آنها قابلیتهای بالقوه مدلهای زبان طبیعی در مدلسازی سهبعدی را نشان میدهد و چهارچوب اساسی پیشرفتهای آینده در زمینه تولید محتوا و انیمیشن خواهد بود.
این تحقیق ممکن است صنعت مدلسازی سهبعدی را تغییر دهد و آن را بهعنوان یک فرآیند دسترسپذیرتر نماید. در حالی که به سوی دورهای متاورس پیش میرویم و ایجاد محتوای سهبعدی به عنوان اصلیترین جنبه این فضا معرفی میشود، ابزارهایی چون 3D-GPT میتوانند برای تولیدکنندگان محتوا و تصمیمگیران در زمینههای مختلف، از بازی و واقعیت مجازی تا صنعت سینما و تجربههای چندرسانهای، بسیار ارزشمند باشند.
چهارچوب 3D-GPT هنوز در مراحل ابتدایی و محدودی قرار دارد؛ اما توسعهی آن گام مهمی در مدلسازی سهبعدی مبتنیبر هوش مصنوعی است و امکانات جذابی را برای پیشرفتهای آینده فراهم میکند.
نظرات کاربران