استارتاپ هوش مصنوعی صوتی ElevenLabs که با تولید صداهای واقعگرایانه شناخته میشود، به تازگی در یک معامله ثانویه جدید به ارزشگذاری ۶.۶ میلیارد دلاری رسیده است؛ رقمی که ظرف کمتر از یک سال تقریباً دو برابر شده است. این شرکت میگوید مرحله بعدی رشدش دیگر فقط به «صدا» محدود نخواهد بود.
چرخش از مدلهای صوتی به عاملهای مکالمهای
بر اساس گزارش تککرانچ، ElevenLabs سرمایه تازه را از یک عرضه ثانویه به رهبری سرمایهگذاران بزرگی مانند Sequoia و ICONIQ جذب کرده و بازیگران شناختهشدهای مثل a16z نیز در آن حضور داشتهاند. فناوری این استارتاپ امروز در حوزههایی از شخصیتهای بازیهای ویدیویی تا باتهای خدمات مشتری استفاده میشود و در کنار غولهایی مانند OpenAI برای تبدیل شدن به «صدای پیشفرض» سامانههای هوش مصنوعی رقابت میکند.
مدیرعامل ElevenLabs در گفتوگویی در رویداد Disrupt تککرانچ تأکید کرده است که مدلهای صوتی طی چند سال آینده به سرعت commoditize خواهند شد؛ یعنی تولید صداهای طبیعی با هوش مصنوعی به یک قابلیت عمومی و ارزان تبدیل میشود که مزیت رقابتی پایداری ایجاد نمیکند. به همین دلیل، استراتژی شرکت حرکت به سمت ساخت یک پلتفرم عاملهای مکالمهای کامل است که بتواند گفتوگو را فراتر از تبدیل متن به گفتار مدیریت کند.
مقابله با دیپفیک و گسترش به موسیقی و ویدیو
با رشد سریع ابزارهای صوتی، خطر دیپفیکهای صوتی و سوءاستفاده نیز بالا رفته است. ElevenLabs میگوید روی راهکارهایی مانند واترمارکگذاری روی خروجیها، سامانههای شناسایی محتوای تولیدشده با هوش مصنوعی و همچنین مکانیزمهای احراز هویت دستگاه کار میکند تا امکان ردیابی و تشخیص بهتر فایلهای جعلی فراهم شود. این رویکرد میتواند برای تنظیمگران و پلتفرمها در سراسر جهان، از جمله ایران، مهم باشد؛ جایی که سوءاستفاده از صدای افراد در فضای مجازی به یک نگرانی رو به رشد تبدیل شده است.
این شرکت همچنین در حال ورود جدیتر به تولید موسیقی با هوش مصنوعی و همکاریهایی برای ترکیب مدلهای صوتی با مدلهای ویدیویی است. هدف، ساخت نسل جدیدی از ابزارهای خلاقانه است که بتوانند همزمان صدا، موسیقی و تصویر را به شکل یکپارچه تولید کنند؛ چیزی که میتواند برای تولیدکنندگان محتوا، بازیسازان و استودیوهای دوبله در بازارهایی مانند ایران نیز جذاب باشد.
در مجموع، داستان ElevenLabs نشان میدهد که در اکوسیستم هوش مصنوعی، ارزش اصلی به تدریج از «مدل تکی» به «پلتفرمهای جامع عاملهای هوشمند» منتقل میشود؛ پلتفرمهایی که علاوه بر صدا، لایههای تعاملی، امنیتی و چندرسانهای را نیز پوشش میدهند.
منبع خبر: TechCrunch




