استارتاپ آمریکایی Lemon Slice که روی آواتارهای دیجیتال ویدیویی مبتنی بر هوش مصنوعی کار میکند، اعلام کرده ۱۰.۵ میلیون دلار سرمایه اولیه از سرمایهگذارانی چون Matrix Partners و شتابدهنده Y Combinator جذب کرده است. این سرمایهگذاری به شرکت کمک میکند نسل جدید آواتارهای تعاملی خود را برای استفاده در اپلیکیشنها و سرویسهای مختلف گسترش دهد.
مدل Lemon Slice-2؛ آواتار ویدیویی از یک تصویر
محصول اصلی این استارتاپ، مدلی به نام Lemon Slice-2 است؛ یک مدل دیفیوژن ویدیویی با حدود ۲۰ میلیارد پارامتر که میتواند تنها با یک تصویر، آواتار دیجیتال بسازد و آن را به صورت زنده با نرخ حدود ۲۰ فریم بر ثانیه اجرا کند. این آواتار روی یک پایگاه دانش یا سامانه پرسشوپاسخ سوار میشود و میتواند نقشهای مختلفی مثل پاسخگویی به مشتری، کمک آموزشی یا حتی همراهی در حوزه سلامت روان را بر عهده بگیرد.
شرکت میگوید این مدل از طریق API و یک ویجت قابلجاسازی عرضه میشود تا توسعهدهندگان بتوانند با یک خط کد آن را در وبسایت یا سرویس خود ادغام کنند. پس از ساخت آواتار نیز امکان تغییر پسزمینه، استایل و ظاهر فراهم است و علاوه بر چهرههای انسانمانند، کاراکترهای غیرانسانی هم پشتیبانی میشوند. برای صدا نیز از فناوری شرکتی دیگر در حوزه تبدیل متن به گفتار استفاده شده است.
رقابت شدید در بازار آواتار ویدئویی
Lemon Slice در بازاری وارد شده که بازیگران قدرتمندی در آن حضور دارند؛ از استارتاپهای تولید ویدئو مانند D-ID، HeyGen و Synthesia گرفته تا سازندگان آواتارهای دیجیتال دیگر. تیم مؤسس معتقد است استفاده از یک مدل دیفیوژن عمومی و مقیاسپذیر، امکان رسیدن به آواتارهای طبیعیتر را فراهم میکند و میتواند مشکل «حس ترسناک و مصنوعی بودن» آواتارهای فعلی را کاهش دهد.
به گفته سرمایهگذاران، اگر این نسل جدید آواتارها به اندازه کافی طبیعی و تعاملی شوند، میتوانند در حوزههایی مانند آموزش آنلاین، یادگیری زبان، تجارت الکترونیک و آموزش شرکتی نقش مهمی ایفا کنند. این روند برای بازارهایی مثل ایران نیز میتواند جذاب باشد؛ جایی که کلاسهای آنلاین، فروشگاههای اینترنتی و پشتیبانی خودکار به سرعت در حال رشد هستند و راهکارهای بومیسازیشده روی این فناوریها میتوانند تجربه کاربر را ارتقا دهند.
Lemon Slice میگوید برای جلوگیری از سوءاستفاده، از جمله جعل چهره و صدا، سازوکارهایی برای تشخیص و محدودسازی استفاده غیرمجاز در نظر گرفته و از مدلهای زبانی بزرگ برای پایش و تعدیل محتوای تولیدی کمک میگیرد. این استارتاپ فعلاً نام مشتریان خود را اعلام نکرده اما میگوید فناوری آن در حوزههایی مثل آموزش، یادگیری زبان، تجارت الکترونیک و آموزش سازمانی در حال استفاده است. بخش مهمی از سرمایه جدید نیز صرف استخدام نیروهای فنی و تجاری و همچنین تأمین هزینه محاسبات لازم برای آموزش مدلها خواهد شد.
منبع خبر: TechCrunch




