تبدیل عکس به مدل سهبعدی؛ هوش مصنوعی پیشرفته مالک تیکتاک معرفی شد
تبدیل عکس به مدل سهبعدی؛ هوش مصنوعی پیشرفته مالک تیکتاک معرفی شد
Seed3D 1.0 یک سامانهی کامل مبتنیبر معماری Diffusion Transformer محسوب میشود که با دادههای بسیار گسترده آموزش دیده و هدفش تسلط بر حوزهی مدلسازی سهبعدی مولد است.
در حالیکه ابزارهایی مانند Gaussian Splatting و پروژههای متنباز نظیر Hunyuan3D مرزهای این فناوری را جابهجا کردهاند، بایتدنس میگوید Seed3D 1.0 از نظر کیفیت بافت و دقت هندسی از تمام رقبا، چه متنباز و چه تجاری، عملکرد بهتری دارد. این مدل با تنها ۱٫۵ میلیارد پارامتر به این سطح از دقت رسیده و حتی از مدل بزرگتر Hunyuan3D 2.1 با سه میلیارد پارامتر پیشی گرفته است.
نوآوری اصلی در ترکیب Diffusion Transformer چندوجهی با فرآیند تولید مرحلهای نهفته است. این سیستم ابتدا تصویر ورودی را با کمک یک مدل بینایی-زبانی تحلیل میکند تا سرنخهای فضایی و جزئیات شیء را استخراج کند، سپس مدلهای سهبعدی جداگانه تولید و در نهایت آنها را در قالب یک صحنهی کامل کنار هم قرار میدهد. این ساختار مقیاسپذیر است و از تولید یک صندلی تا طراحی یک دفتر کامل یا حتی شهرهای بزرگ کاربرد دارد.
Seed3D 1.0 همچنین در حفظ یکنواختی بافت از زوایای مختلف عملکردی چشمگیر دارد. این سیستم بهجای استفاده از بافتهای عمومی، متریالهایی تولید میکند که از هر زاویه هماهنگ باقی میمانند و دقت ساختاری مدل را برای استفاده در شبیهسازیهای پیشرفته حفظ میکنند. خروجیهای Seed3D حتی میتوانند بهطور مستقیم در پلتفرمهایی مانند Isaac Sim برای آموزش هوش مصنوعی تجسمی مورد استفاده قرار گیرند.
با ادامهی کمرنگشدن مرز میان محتوای واقعی و مصنوعی، معرفی Seed3D 1.0 را میتوان حرکت بزرگی برای بایتدنس و دنیای تولید محتوای سهبعدی، رباتیک و رایانش فضایی دانست.
منبع : زومیت