استارتاپ تولید تصویر و ویدئوی هوش مصنوعی Runway از اولین «مدل جهان» خود با نام GWM-1 رونمایی کرده و همزمان قابلیت صدا و تولید ویدئوهای بلند و چندشاتی را به تازهترین مدل ویدئویی خود Gen 4.5 افزوده است.
مدل جهان GWM-1 چیست و چه میکند؟
بهگزارش رانوی، GWM-1 یک مدل هوش مصنوعی است که با پیشبینی فریم به فریم، شبیهسازیای از جهان میسازد و درکی از فیزیک و رفتار اجسام در طول زمان دارد. چنین «مدل جهان»هایی سعی میکنند یک شبیهسازی درونی از نحوه کار دنیای واقعی بسازند تا سیستم بتواند در سناریوهای مختلف استدلال و برنامهریزی کند، بدون آنکه برای هر حالت ممکن بهطور جداگانه آموزش داده شود.
رانوی میگوید GWM-1 نسبت به رقبایی مانند Genie-3 گوگل، عمومیتر است و میتواند برای شبیهسازی در حوزههایی مانند رباتیک و علوم زیستی به کار رود. این شرکت چند نسخه تخصصی از این مدل را با نامهای GWM-Worlds، GWM-Robotics و GWM-Avatars معرفی کرده است. GWM-Worlds به کاربران اجازه میدهد با یک پرامپت متنی یا تصویر مرجع، یک فضای تعاملی بسازند که مدل در آن هندسه، فیزیک و نور را در حین حرکت کاربر در صحنه شبیهسازی میکند.
در نسخه GWM-Robotics، رانوی از داده مصنوعی غنیشده با شرایط مختلفی مانند تغییرات آبوهوا یا موانع استفاده میکند تا آموزش رباتها را ایمنتر و منعطفتر کند و حتی موارد احتمالی نقض دستورالعملها را در سناریوهای گوناگون شناسایی کند. GWM-Avatars نیز بر ساخت آواتارهای واقعگرایانه برای شبیهسازی رفتار انسانی تمرکز دارد؛ حوزهای که شرکتهای دیگری هم برای کاربردهایی مانند آموزش و ارتباطات روی آن کار میکنند.
بهروزرسانی Gen 4.5 با صدا و ویدئوی چندشاتی
در کنار مدل جهان، رانوی مدل ویدئویی پایه خود یعنی Gen 4.5 را که اوایل همین ماه عرضه شده بود، بهروزرسانی کرده است. نسخه جدید امکان تولید ویدئوهای یک دقیقهای با حفظ ثبات کاراکتر، دیالوگ بومی، صدای پسزمینه و نماهای پیچیده از زوایای مختلف را فراهم میکند. همچنین کاربران میتوانند صداهای موجود را ویرایش و دیالوگ اضافه کنند و روی ویدئوهای چندشاتی با طول دلخواه کار کنند.
این امکانات جدید، پلتفرم رانوی را به رقبا در حوزه تولید ویدئو نزدیکتر میکند و نشانهای از گذار مدلهای ویدئوی هوش مصنوعی از مرحله نمونه آزمایشی به ابزارهای آماده استفاده حرفهای است. بهگفته شرکت، نسخه بهروزشده Gen 4.5 اکنون برای مشترکان طرحهای پولی در دسترس است و GWM-Robotics نیز از طریق یک SDK به شرکتهای رباتیک و سازمانهای علاقهمند ارائه خواهد شد.
برای فعالان حوزه محتوا، انیمیشن، بازی و حتی پژوهشگران رباتیک در ایران، این نوع مدلهای شبیهساز جهان میتواند در آینده امکان آزمایش سناریوهای پیچیده، تولید داده مصنوعی و ساخت محتوای غنیتر را با هزینه کمتر فراهم کند؛ هرچند دسترسی مستقیم به سرویسها ممکن است به سیاستهای تجاری و محدودیتهای جغرافیایی وابسته باشد.
منبع خبر: TechCrunch




