این هوش مصنوعی در ۵ ثانیه عکس دوبعدی را به سهبعدی تبدیل میکند
به گزارش سرگرمی روز، خلاقانههای تولید محتوا نیاز به ایجاد محتوای مناسب برای راضی نگه داشتن مخاطبان دارند، و الگوریتمهای هوش مصنوعی میتوانند با کاهش زمان تولید، به تولیدکنندگان محتوا کمک کنند.
محققان ادوبی و دانشگاه ملی استرالیا، با استفاده از مجموعه دادههای بزرگ برای آموزش الگوریتم یادگیری ماشینی، فناوری جذابی را توسعه دادهاند که عملکرد شگفتانگیزی در تولید مدلهای سهبعدی دارد. محققان اولین مدل بازسازی بزرگ (LRM) را ایجاد کردند که میتواند شکل مدل سهبعدی را از روی تصویر دوبعدی پیشبینی کند و اینکار را فقط در مدت پنج ثانیه انجام میدهد.
محققان در مقالهی خود توضیح میدهند نسل قبلی الگوریتمهای ساخت مدل سهبعدی، براساس مجموعه دادههای متمرکز بر تصویر در مقایس کوچک آموزش داده شدهاند. اکنون مدل LRM از معماری بسیار مقیاسپذیر و مبتنیبر ترانسفورماتور با بیشاز ۵۰۰ میلیون پارامتر آموزش داده شده و از یک میلیون شکل سهبعدی موجود در دادههای Objaverse و MVImgNet بهره میبرد.
محققان میگویند مدل LRM میتواند بازسازیهای سهبعدی با کیفیت را از عکسهای مختلف ازجمله تصاویر دنیای واقعی تولید کند. علاوهبر این، مدل مذکور میتواند تصاویر عادی ساختهشده با سایر سرویسهای هوش مصنوعی مثل DALL-E و میدجورنی را بهعنوان مدل دوبعدی ورودی دریافت کند.
یوکان هانگ، نویسندهی اصلی مقالهی LRM میگوید این مدل پیشرفت مهمی در بازسازی سهبعدی از روی تصاویر ساده است. الگوریتم هوش مصنوعی میتواند هندسهی دقیق را از ویدیو یا تصویر شکل موردنظر، ایجاد و بافتهای پیچیده مثل دانههای چوب را روی آنها حفظ کند.