هوش مصنوعی5 دقیقه مطالعه

ران‌وی نخستین «مدل جهان» خود را با به‌روزرسانی ویدئوی صوت‌دار معرفی کرد

استارتاپ Runway اولین «مدل جهان» خود با نام GWM-1 را برای شبیه‌سازی دنیای واقعی معرفی کرده است. این شرکت هم‌زمان نسل جدید مدل ویدئویی Gen 4.5 را با صدا و تولید چندشاتی به‌روزرسانی کرده است.

برای اینکه تازه‌ترین خبرهای تکنولوژی رو بدونی، کلیک کن! تازه‌ترین خبرهای تکنولوژی اینجاست.

تصویر مفهومی از مدل جهان و ویدئو هوش مصنوعی با صدا

استارتاپ تولید تصویر و ویدئوی هوش مصنوعی Runway از اولین «مدل جهان» خود با نام GWM-1 رونمایی کرده و هم‌زمان قابلیت صدا و تولید ویدئوهای بلند و چندشاتی را به تازه‌ترین مدل ویدئویی خود Gen 4.5 افزوده است.

مدل جهان GWM-1 چیست و چه می‌کند؟

به‌گزارش ران‌وی، GWM-1 یک مدل هوش مصنوعی است که با پیش‌بینی فریم به فریم، شبیه‌سازی‌ای از جهان می‌سازد و درکی از فیزیک و رفتار اجسام در طول زمان دارد. چنین «مدل جهان»‌هایی سعی می‌کنند یک شبیه‌سازی درونی از نحوه کار دنیای واقعی بسازند تا سیستم بتواند در سناریوهای مختلف استدلال و برنامه‌ریزی کند، بدون آن‌که برای هر حالت ممکن به‌طور جداگانه آموزش داده شود.

ران‌وی می‌گوید GWM-1 نسبت به رقبایی مانند Genie-3 گوگل، عمومی‌تر است و می‌تواند برای شبیه‌سازی در حوزه‌هایی مانند رباتیک و علوم زیستی به کار رود. این شرکت چند نسخه‌ تخصصی از این مدل را با نام‌های GWM-Worlds، GWM-Robotics و GWM-Avatars معرفی کرده است. GWM-Worlds به کاربران اجازه می‌دهد با یک پرامپت متنی یا تصویر مرجع، یک فضای تعاملی بسازند که مدل در آن هندسه، فیزیک و نور را در حین حرکت کاربر در صحنه شبیه‌سازی می‌کند.

در نسخه GWM-Robotics، ران‌وی از داده‌ مصنوعی غنی‌شده با شرایط مختلفی مانند تغییرات آب‌وهوا یا موانع استفاده می‌کند تا آموزش ربات‌ها را ایمن‌تر و منعطف‌تر کند و حتی موارد احتمالی نقض دستورالعمل‌ها را در سناریوهای گوناگون شناسایی کند. GWM-Avatars نیز بر ساخت آواتارهای واقع‌گرایانه برای شبیه‌سازی رفتار انسانی تمرکز دارد؛ حوزه‌ای که شرکت‌های دیگری هم برای کاربردهایی مانند آموزش و ارتباطات روی آن کار می‌کنند.

به‌روزرسانی Gen 4.5 با صدا و ویدئوی چندشاتی

در کنار مدل جهان، ران‌وی مدل ویدئویی پایه خود یعنی Gen 4.5 را که اوایل همین ماه عرضه شده بود، به‌روزرسانی کرده است. نسخه جدید امکان تولید ویدئوهای یک دقیقه‌ای با حفظ ثبات کاراکتر، دیالوگ بومی، صدای پس‌زمینه و نماهای پیچیده از زوایای مختلف را فراهم می‌کند. همچنین کاربران می‌توانند صداهای موجود را ویرایش و دیالوگ‌ اضافه کنند و روی ویدئوهای چندشاتی با طول دلخواه کار کنند.

این امکانات جدید، پلتفرم ران‌وی را به رقبا در حوزه تولید ویدئو نزدیک‌تر می‌کند و نشانه‌ای از گذار مدل‌های ویدئوی هوش مصنوعی از مرحله نمونه آزمایشی به ابزارهای آماده استفاده حرفه‌ای است. به‌گفته شرکت، نسخه به‌روزشده Gen 4.5 اکنون برای مشترکان طرح‌های پولی در دسترس است و GWM-Robotics نیز از طریق یک SDK به شرکت‌های رباتیک و سازمان‌های علاقه‌مند ارائه خواهد شد.

برای فعالان حوزه محتوا، انیمیشن، بازی و حتی پژوهشگران رباتیک در ایران، این نوع مدل‌های شبیه‌ساز جهان می‌تواند در آینده امکان آزمایش سناریوهای پیچیده، تولید داده مصنوعی و ساخت محتوای غنی‌تر را با هزینه کمتر فراهم کند؛ هرچند دسترسی مستقیم به سرویس‌ها ممکن است به سیاست‌های تجاری و محدودیت‌های جغرافیایی وابسته باشد.

منبع خبر: TechCrunch

منبع: TechCrunch

توییترتلگرامواتساپ

مقالات مرتبط

شتاب دوباره رشد چت‌جی‌پی‌تی همزمان با دور جدید سرمایه‌گذاری اوپن‌ای‌آی
شتاب دوباره رشد چت‌جی‌پی‌تی همزمان با دور جدید سرمایه‌گذاری اوپن‌ای‌آی

طبق گزارشی از CNBC، سم آلتمان در جلسه‌ای داخلی از شتاب‌گرفتن دوباره رشد چت‌جی‌پی‌تی سخن گفته است؛ هم‌زمان گفته می‌شود اوپن‌ای‌آی در آستانه جذب دور جدیدی از سرمایه‌گذاری با ارزش‌گذاری بسیار بالا است.

5 دقیقه
هشدار اتحادیه اروپا به متا برای عقب‌نشینی از سیاست هوش مصنوعی واتس‌اپ
هشدار اتحادیه اروپا به متا برای عقب‌نشینی از سیاست هوش مصنوعی واتس‌اپ

اتحادیه اروپا به متا هشدار داده که در صورت عدم اصلاح سیاست‌های هوش مصنوعی در واتس‌اپ، اقدام‌های موقت ضدانحصار علیه این شرکت اعمال خواهد شد. بروکسل نگران استفاده متا از داده‌های کاربران برای خدمات هوش مصنوعی است.

5 دقیقه