هوش مصنوعی جدید گوگل میتواند با دقت و کیفیتی مثالزدنی جهانهای تعاملی را در لحظه خلق کند.
دیپمایند، زیرمجموعهی گوگل، نسخهی جدید مدل هوش مصنوعی «جهانساز» خود به نام Genie 3 را معرفی کرد که توانایی ساخت محیطهای سهبعدی تعاملی را دارد؛ کاربر و ایجنتهای هوش مصنوعی میتوانند در این دنیاها بهصورت همزمان و در لحظه تعامل داشته باشند.
برخلاف نسخهی قبلی، مدت تعامل در این فضاها بهطور قابلتوجهی افزایش یافته و مدل توانایی بهخاطر سپردن مکان اجسام را دارد، حتی زمانیکه کاربر برای مدتی از آنها روی برمیگرداند.
مدلهای جهانساز نوعی از سامانههای هوش مصنوعی هستند که محیطهای مجازی شبیه بازی ویدیویی تولید میکنند، اما بهجای طراحی دستی، کل فضا با استفاده از هوش مصنوعی ساخته میشود.
هوش مصنوعی جدید گوگل میتواند در آموزش، سرگرمی یا آموزش ایجنتهای رباتیک بهکار رود. گوگل از مدتها پیش روی این حوزه سرمایهگذاری کرده بود و سال گذشته Genie 2 را معرفی کرد؛ مدلی که میتوانست از روی یک تصویر، دنیای تعاملی بسازد.
تیم توسعهی Genie 3 اکنون توسط یکی از توسعهدهندگان سابق ابزار Sora متعلقبه OpenAI هدایت میشود.
Genie 2 محدودیتهای زیادی داشت؛ از جمله اینکه تعامل با محیط تنها ۱۰ تا ۲۰ ثانیه دوام داشت. اما طبق اعلام دیپمایند، Genie 3 میتواند محیطهایی بسازد که چند دقیقه تعامل پیوسته داشته باشند و اجزای محیط را تا حدود یک دقیقه در حافظهی بصری خود نگه دارد.
اگر کاربر از چیزی روی برگرداند و سپس دوباره به آن نگاه کند، جزئیاتی مانند رنگ دیوار یا نوشتهی تخته سیاه همچنان در جای خود باقی میمانند. خروجیهای این مدل با وضوح 720p و نرخ ۲۴ فریمبرثانیه ارائه میشوند.
ویژگی جدید دیگر در Genie 3، «رویدادهای قابل تغییر با فرمان» است؛ بهطوریکه کاربر میتواند با یک پرامپت، شرایطی مانند وضعیت آبوهوا را تغییر دهد یا شخصیتهای جدیدی به محیط بیفزاید.
Genie 3 فعلاً برای عموم منتشر نخواهد شد. گوگل میگوید این مدل تنها در قالب یک «پیشنمایش پژوهشی محدود» در اختیار گروه کوچکی از پژوهشگران و سازندگان قرار میگیرد تا مخاطرات آن بررسی و کنترل شود.
قابلیتهای تعامل کاربران با این محیطها هنوز محدود است و تولید متن خوانا در فضاهای مجازی تنها در صورتی ممکن خواهد بود که آن متن در ورودی مشخص شده باشد. گوگل میگوید در حال بررسی راههایی برای گسترش دسترسی به Genie 3 در آینده است.