اُپنایآی در ادامه وضعیت «کد قرمز» و رقابت فشرده با گوگل، نسخه جدید مدل تولید تصویر خود با نام GPT-Image-1.5 را برای کاربران ChatGPT و از طریق API عرضه کرده است. این بهروزرسانی قرار است دقت در پیروی از دستورات، کیفیت ویرایش و سرعت تولید تصویر را بهطور محسوسی افزایش دهد.
GPT-Image-1.5 چه تغییری ایجاد میکند؟
بر اساس گزارشها، نسخه تازه ChatGPT Images میتواند تا چند برابر سریعتر از نسخه قبلی تصویر تولید کند و در عین حال، تغییرات جزئیتری مانند تنظیم حالت چهره، نورپردازی، ترکیببندی و رنگ را بدون بازطراحی کامل تصویر پیاده کند. یکی از ضعفهای رایج ابزارهای تولید تصویر، ناتوانی در حفظ ثبات بصری در تکرارها و ویرایشهای پیاپی است و اُپنایآی میگوید این مدل برای رفع همین مشکل بهبود یافته است.
این مدل جدید همچنین بخشی از راهبرد گستردهتر اُپنایآی برای پسگرفتن جایگاه خود در بازار هوش مصنوعی پس از تقویت محصولات تصویری و زبانی گوگل است. در هفتههای اخیر، گوگل با نسخههای جدید مدلهای زبانی و ابزار تولید تصویر توانسته در برخی بنچمارکها پیشتاز باشد و اُپنایآی با معرفی GPT-5.2 و اکنون GPT-Image-1.5 تلاش دارد سرعت نوآوری خود را بالا نگه دارد.
ویژگیهای تازه در تجربه کاربری ChatGPT
همزمان با این مدل، رابط کاربری ChatGPT برای کار با تصویر هم بازطراحی شده تا شبیه یک «استودیوی خلاق» عمل کند. کاربران میتوانند از بخش اختصاصی تصاویر در نوار کناری، مجموعهای از ابزارهای مشاهده و ویرایش تصویر، الگوهای آماده و پرامپتهای الهامبخش را در یک محیط متمرکز در اختیار داشته باشند. همچنین قرار است نمایش نتایج جستجو در ChatGPT بصریتر شده و در سناریوهایی مثل تبدیل واحدها یا مشاهده نتایج ورزشی، از المانهای گرافیکی و منابع شفاف استفاده شود.
برای مخاطبان ایرانی، چنین تغییراتی نشان میدهد رقابت در حوزه مدلهای تصویری و چندرسانهای وارد مرحلهای شده که از ابزارهای آزمایشی فراتر رفته و به سرویسهای حرفهای نزدیک میشود؛ حوزهای که میتواند بر تولید محتوای دیجیتال، تبلیغات، طراحی گرافیک و حتی صنایع خلاق داخل کشور هم اثرگذار باشد، بهویژه اگر زیرساخت اینترنت و دسترسی به این سرویسها پایدار و قابل اتکا باشد.
منبع خبر: TechCrunch




