استارتاپ برچسبگذاری داده «هندشیک» (Handshake) استارتاپ Cleanlab را که در حوزه پایش و بهبود کیفیت دادههای برچسبخورده فعالیت میکند، تصاحب کرده است. هدف اصلی این معامله، تقویت توان تحقیق و توسعه هندشیک در تولید دادههای باکیفیت برای مدلهای بنیادین هوش مصنوعی عنوان شده است.
جزئیات معامله و نقش Cleanlab
هندشیک که در ابتدا در سال ۲۰۱۳ بهعنوان پلتفرمی برای استخدام فارغالتحصیلان دانشگاهی راهاندازی شد، حدود یک سال پیش بهطور جدی وارد کسبوکار برچسبگذاری انسانی داده برای شرکتهای سازنده مدلهای بنیادین هوش مصنوعی شد. Cleanlab که در سال ۲۰۲۱ تأسیس شده، نرمافزاری ارائه میدهد که میتواند خطاها و برچسبهای نادرست در دادهها را بدون نیاز به بازبینی انسانی دوم شناسایی کند و کیفیت خروجی برچسبگذاری را بالا ببرد.
به گفته شرکتها، این معامله بیش از هر چیز یک «اکوهایِر» است و ۹ نفر از اعضای کلیدی تیم Cleanlab، از جمله سه همبنیانگذار دارای دکترای علوم کامپیوتر از MIT، به سازمان تحقیقاتی هندشیک میپیوندند. جزئیات مالی و ارزش این معامله افشا نشده، اما Cleanlab پیشتر در مجموع حدود ۳۰ میلیون دلار سرمایه جذب کرده بود و در مقطعی بیش از ۳۰ نفر نیرو داشت.
چرا این خرید برای صنعت هوش مصنوعی مهم است؟
با اوجگیری موج مدلهای بنیادین، تقاضا برای دادههای آموزشی بزرگ، متنوع و در عین حال تمیز و قابلاعتماد بهشدت افزایش یافته است. ابزارهای Cleanlab برای کشف برچسبهای اشتباه و دادههای مسئلهدار میتواند به هندشیک کمک کند تا دادههای دقیقتری به آزمایشگاههای هوش مصنوعی ارائه کند و در نتیجه، مدلهای نهایی پایدارتر و منصفانهتر شوند. هندشیک تاکنون برای چندین آزمایشگاه برتر هوش مصنوعی داده تأمین کرده و طبق گزارشها درآمد سالانه تکرارشونده آن در حال نزدیک شدن به «چند صد میلیون دلار» است.
کلینلب در گذشته از سوی چندین شرکت فعال در برچسبگذاری داده مورد توجه قرار گرفته بود، اما در نهایت این استارتاپ تصمیم گرفت به هندشیک ملحق شود؛ شرکتی که حتی برخی از رقبای دادهلیبلینگ مانند Mercor، Surge و Scale AI از پلتفرم آن برای تأمین نیروی انسانی متخصص (از جمله پزشکان، وکلا و دانشمندان) استفاده میکنند. این موضوع جایگاه هندشیک را بهعنوان «زیرساخت تأمین نیروی متخصص» در زنجیره تأمین داده هوش مصنوعی برجستهتر میکند.
اهمیت موضوع برای مخاطبان ایرانی
برای فعالان و توسعهدهندگان ایرانی حوزه هوش مصنوعی، این خبر یادآور این واقعیت است که کیفیت داده آموزشی در نهایت به اندازه معماری مدل اهمیت دارد. روند جهانی به سمت استفاده ترکیبی از نیروی انسانی متخصص و ابزارهای خودکار برای پاکسازی و پایش دادهها پیش میرود؛ رویکردی که میتواند الگوی مناسبی برای استارتاپهای داخلی نیز باشد. در کنار این تحولات، دسترسی به ابزارها و سرویسهای بینالمللی هوش مصنوعی نیز برای تیمهای ایرانی حیاتی است و تهیه سرویسهای ابری و مدلهای مختلف، از جمله خرید اکانت های هوشمصنوعی میتواند به تسریع آزمایش و توسعه محصولات کمک کند.
منبع خبر: TechCrunch




