گوگل دیپمایند دسترسی آزمایشی به ابزار جدید خود با نام «Project Genie» را آغاز کرده است؛ سامانهای مبتنی بر مدلهای جهانساز که میتواند تنها با چند متن یا تصویر، دنیای تعاملی شبیه بازی ویدیویی بسازد.
پروژه Genie چیست و چگونه کار میکند؟
در این ابزار، کاربر ابتدا با یک «world sketch» شروع میکند؛ یعنی توصیف متنی محیط و شخصیت اصلی که قرار است در آن دنیا حرکت کند. سپس یک مدل تولید تصویر، نماهای اولیه را بر اساس این توضیحات میسازد و در ادامه، مدل جهانساز دیپمایند آن را به یک دنیای قابل کاوش تبدیل میکند. این سیستم ترکیبی از مدل جهان Genie 3، یک مدل تصویرساز و مدل زبانی جمینی است و فعلاً فقط برای مشترکان Google AI Ultra در ایالات متحده و به شکل یک نمونه تحقیقاتی در دسترس است.
کاربران میتوانند دنیاهای مختلفی با سبکهای گرافیکی گوناگون، از کارتون و انیمه تا حالوهوای کلاسیک هنری بسازند، آنها را بازترکیب کنند یا از گالری دنیاهای آماده الهام بگیرند. با این حال، هر جلسه تولید و گشتوگذار در دنیا فعلاً به حدود یک دقیقه محدود است؛ محدودیتی که دیپمایند آن را به هزینه و نیاز پردازشی بالای مدلهای خود نسبت میدهد.
چرا این ابزار برای صنعت هوش مصنوعی مهم است؟
مدلهای جهان (World Models) یکی از مسیرهای اصلی پژوهشگران برای نزدیک شدن به هوش عمومی مصنوعی محسوب میشوند؛ زیرا این مدلها تلاش میکنند درک درونی از محیط بسازند، پیامد اقدامات را پیشبینی کنند و برنامهریزی انجام دهند. دیپمایند و دیگر آزمایشگاهها فعلاً از این توانایی در ابتدا برای بازیها و سرگرمی استفاده میکنند، اما در ادامه هدف آنها آموزش عاملهای تجسمیافته و رباتها در شبیهسازهاست. ظهور محصولاتی مانند Project Genie و ابزارهای مشابه از استارتاپهایی مثل Runway نشان میدهد رقابت در حوزه مدلهای جهان وارد فاز تازهای شده است.
برای توسعهدهندگان، طراحان بازی و حتی هنرمندان ایرانی، آشنایی با چنین ابزارهایی میتواند الهامبخش باشد؛ زیرا در آینده نزدیک، بخش بزرگی از تولید محتوای تعاملی و تصویری به این مدلها تکیه خواهد کرد. اگر بهدنبال تجربه و کار با مدلهای پیشرفته هستید، استفاده از سرویسهای متنوع از جمله خرید اکانت های هوشمصنوعی میتواند دسترسی شما را به مجموعهای از ابزارهای خلاقانه جهانی سادهتر کند.
محدودیتها و چالشها
بر اساس گزارش تککرانچ، Genie در حال حاضر در ساخت دنیاهای فانتزی و هنری عملکرد درخشانی دارد، اما در تولید صحنههای واقعگرایانه و فوتورئال هنوز ضعف نشان میدهد و گاهی نتیجه بیشتر شبیه بازی ویدیویی ساده است تا تصویری نزدیک به دنیای واقعی. استفاده از تصاویر واقعی نیز همیشه خروجی دقیقی از همان محیط نمیدهد و گاهی اشیاء جابهجا میشوند یا فضا حالت مصنوعی پیدا میکند. از نظر تعاملی هم، حرکت کاراکتر در محیط هنوز گاهی با عبور از دیوارها و اشیای جامد همراه است و کنترل آن برای کاربران غیرگیمر چندان راحت نیست.
با وجود این نواقص، دیپمایند Project Genie را گامی مهم اما آزمایشی در مسیر مدلهای جهان میداند و امیدوار است با جمعآوری بازخورد کاربران، هم کیفیت بصری و هم میزان تعاملی بودن دنیاها را به شکل چشمگیری بهبود دهد. این ابزار اگرچه هنوز «محصول نهایی» نیست، اما تصویری نسبتاً روشن از آیندهای ارائه میکند که در آن، ساخت دنیاهای دیجیتال تنها با چند دستور متنی انجام خواهد شد. منبع خبر: TechCrunch




