Genie 3 دیپ‌مایند، جهان‌های تعاملی سه‌بعدی با ثبات چند دقیقه‌ای خلق می‌کند

آگوست 22, 2025آخرین بروزرسانی: آگوست 22, 2025

Genie 3 دیپ‌مایند، جهان‌های تعاملی سه‌بعدی با ثبات چند دقیقه‌ای خلق می‌کند

گوگل دیپ‌مایند با معرفی Genie 3، مدلی برای خلق جهان‌های تعاملی سه‌بعدی در زمان واقعی ارائه داده که ثبات فیزیکی و بصری را برای دقایق متوالی حفظ می‌کند.

به گزارش نیوزلن و به نقل از The Decoder، در پیشرفتی انقلابی که مرزهای واقعیت مجازی و هوش مصنوعی را درمینوردد، گوگل دیپ‌مایند از Genie 3 رونمایی کرده است؛ مدلی که می‌تواند جهان‌های تعاملی سه‌بعدی را در زمان واقعی و تنها با استفاده از توصیفات متنی ایجاد کند.

گفتنی است این سامانه که با نرخ ۲۴ فریم بر ثانیه و وضوح ۷۲۰p عمل می‌کند، قادر است محیط‌های پیچیده‌ای را تولید کند که ثبات بصری و فیزیکی خود را برای «دقایق متوالی» حفظ می‌نمایند. این دستاورد، گامی بلند به سوی توسعه سامانه‌های هوش مصنوعی عمومی (AGI) محسوب می‌شود.

بر این اساس، Genie 3 برخلاف مدل‌های مرسوم ویدیویی، هر فریم را به صورت خودرگرسیونی تولید می‌کند و تا یک دقیقه از جزئیات محیطی قبلی را در نظر می‌گیرد. بدین ترتیب، این رویکرد به حفظ انسجام بصری در طول تعاملات گسترده کمک شایانی می‌کند.

دمیس هاسیبیس، مدیرعامل دیپ‌مایند، در این باره تأکید می‌کند: «این مدل‌ها برای ساخت هوش مصنوعی عمومی ضروری هستند، چرا که به طور فزاینده‌ای ساختار فیزیکی زیربنایی جهان را درک می‌کنند».

گفتنی است این مدل نوین می‌تواند طیف وسیعی از سناریوها را از مناظر واقع‌گرایانه با اثرات آب‌وهوی پویا مانند گدازه، باد و باران تا محیط‌های فانتزی شامل پورتال‌ها، جزایر پرنده و موجودات متحرک خلق کند. همچنین امکان بازسازی مکان‌های تاریخی مانند ونیز یا کنوسوس باستان نیز با این مدل وجود دارد.

در واقع کاربران با وارد کردن دستورات متنی – که «رویدادهای جهان قابل prompting» نامیده می‌شوند – می‌توانند تغییراتی مانند تحولات آب‌وهویی یا ظهور اشیاء جدید را ایجاد کنند.

یکی از جنبه‌های برجسته Genie 3، توانایی آن در ایجاد محیط‌های آموزشی برای عامل‌های هوش مصنوعی خودمختار است. این مدل بدون نیاز به داده‌های سه‌بعدی از پیش تعریف‌شده، محیط‌ها را مستقیماً از توصیفات متنی و تعامل کاربر تولید می‌کند.

دیپ‌مایند هم‌اکنون از Genie 3 برای آزمایش عامل SIMA داخلی خود استفاده می‌کند که می‌تواند وظایف را به صورت مستقل در این جهان‌های تولید شده انجام دهد.

بی‌تردید، این دموها پرسش‌هایی جدی را درباره‌ی نقش مدل‌های جهانی مانند Genie 3 در آیندهٔ توسعهٔ بازی‌های ویدیویی مطرح می‌کنند. برخی از نمایش‌های دیپ‌مایند، شباهت زیادی به نسخه‌های اولیه‌ی بازی‌های دیجیتال دارند—هرچند هنوز از پیچیدگی و غنای آثار تجاری فاصله دارند.

جیم فان، مدیر هوش مصنوعی انویدیا، این فناوری را پیش‌نمایش «موتور بازی ۲.۰» می‌داند و پیش‌بینی می‌کند: «روزی خواهد رسید که تمام پیچیدگی‌های آنریل انجین توسط یک توده داده‌محور از وزن‌های توجه جذب خواهد شد. آن‌گاه توسعه بازی به شکلی پیشرفته از مهندسی prompting تبدیل خواهد شد.»

Genie 3 امکان ناوبری در لحظه و ساخت تعاملی جهان را فراهم می‌کند و محیط‌های ثابت را برای چند دقیقه با کیفیت 720p حفظ می‌کند.

این مدل هم‌اکنون به عنوان پیش‌نمایش پژوهشی در دسترس گروه منتخبی از پژوهشگران و خلاقان قرار گرفته است. دیپ‌مایند اعلام کرده این رویکرد به شناسایی ریسک‌های بالقوه و هدایت توسعه بیشتر کمک خواهد کرد.

با وجود محدودیت‌های فنی فعلی از جمله محدودیت اقدامات عامل، تعاملات چند دقیقه‌ای و عدم قابلیت اطمینان شبیه‌سازی‌های چندعاملی، کارشناسان کاربردهای گسترده‌ای را در حوزه‌های آموزش، شبیه‌سازی و آموزش تخصصی برای این فناوری متصور هستند.

ریچارد ساتن و دیوید سیلور، پژوهشگران دیپ‌مایند، در مقاله‌ای اخیر بر نیاز به تغییر بنیادین در پژوهش‌های هوش مصنوعی تأکید کرده‌اند: حرکت از سامانه‌های آموزش‌دیده بر داده‌های ایستای انسانی به سوی عامل‌هایی که از تجربیات خود در جهان‌های شبیه‌سازی شده یاد می‌گیرند. Genie 3 دقیقاً برای پشتیبانی از این چشم‌انداز طراحی شده است.

در پایان باید گفت این توسعه نه‌تنها نشان‌دهنده تعهد دیپ‌مایند به پیشبرد مرزهای هوش مصنوعی است، بلکه می‌تواند تحولی اساسی در صنعت بازی‌های ویدیویی، واقعیت مجازی و شبیه‌سازی‌های آموزشی ایجاد کند.

کارشناسان معتقدند چنین فناوری‌هایی می‌توانند به زودی شیوه‌های سنتی تولید محتوای دیجیتال را متحول کرده و دریچه‌ای به سوی خلاقیت‌های نامحدود در جهان‌های مجازی بگشایند.

حتما بخوانید : جدیدترین قیمت رمزارزها

برچسب ها