طبق گزارش جدیدی که توسط The Information منتشر و توسط تککرانچ بازتاب شده، شرکت OpenAI بهصورت جدی روی نسل بعدی مدلهای صوتی و دستگاههای «صوتمحور» سرمایهگذاری میکند. این شرکت طی ماههای اخیر چندین تیم مهندسی، محصول و تحقیقاتی خود را یکپارچه کرده تا یک مدل صوتی پیشرفته و یک دیوایس شخصی مبتنی بر صدا را برای حدود یک سال آینده آماده کند.
تمرکز OpenAI روی صدا و موج جدید ضدنمایشگر
گزارشها نشان میدهد مدل صوتی جدید OpenAI قرار است طبیعیتر صحبت کند، وقفههای کاربر را مانند یک مکالمه واقعی مدیریت کند و حتی هنگام صحبت کاربر نیز پاسخ بدهد؛ قابلیتی که در بسیاری از مدلهای فعلی وجود ندارد. در کنار این، سناریویی از «خانوادهای از دستگاهها» مطرح شده که ممکن است شامل عینک هوشمند یا اسپیکرهای بدون نمایشگر باشد و بیش از آنکه ابزار صرف باشند، نقش همراه و همصحبت را بازی کنند.
این رویکرد با روند بزرگتر سیلیکونولی همسو است؛ جایی که شرکتهای بزرگ فناوری تلاش میکنند وابستگی کاربران به صفحهنمایش را کاهش دهند و صدا را به رابط اصلی بدل کنند. از اسپیکرهای هوشمند خانگی گرفته تا عینکهای هوشمند و خودروهای متصل، همه به سمت این میروند که کاربر با گفتوگو، نه لمس صفحه، با فناوری کار کند. برای کاربران ایرانی هم این تغییر جهت به سمت رابطهای مکالمهای میتواند اهمیت زیادی داشته باشد؛ از دسترسی راحتتر به ابزارهای هوش مصنوعی تا کاربری در خودرو و خانه هوشمند. در همین راستا، استفاده از ابزارهای متنی و صوتی پیشرفته، مثلاً از طریق خرید اکانت های هوشمصنوعی، میتواند تجربه کار با این نسل جدید دستیارهای هوشمند را در ایران هم در دسترستر کند.
در سطح صنعت، این حرکت OpenAI در کنار تلاشهای دیگر شرکتها قرار میگیرد؛ از قابلیتهای صوتی جدید در عینکهای هوشمند گرفته تا تبدیل نتایج جستوجو به خلاصههای مکالمهای و ادغام مدلهای زبانی بزرگ در خودروها برای کنترل ناوبری و تنظیمات با فرمان صوتی. در مقابل، برخی استارتاپهای پوشیدنیِ بدوننمایشگر به دلیل چالشهای فنی، تجربه کاربری و نگرانیهای حریم خصوصی به داستانهای هشداردهنده تبدیل شدهاند، هرچند این موضوع ظاهراً مانع ادامه آزمونوخطا در این حوزه نشده است.
بهنقل از این گزارش، حضور جانی آیو، طراح مشهور سابق اپل، در تلاشهای سختافزاری OpenAI نیز بر ایده «کاهش اعتیاد به دستگاهها» و استفاده از طراحی صوتمحور برای جبران برخی خطاهای نسل قبلی گجتهای مصرفی تأکید دارد. به این ترتیب، اگر این پروژهها موفق شوند، ممکن است طی سالهای آینده شاهد نسلی از دستگاهها باشیم که بهجای خیرهکردن ما به صفحه، صرفاً به صدای ما گوش میدهند.
منبع خبر: TechCrunch




