گزارشی مفصل از صنعت هوش مصنوعی نشان میدهد شرکتهایی که داده و نیروی متخصص برای آموزش مدلها فراهم میکنند، در حال تبدیل شدن به برندگان اصلی «تب طلا»ی هوش مصنوعی هستند؛ در حالی که بسیاری از سازندگان مدلها هنوز مدل کسبوکار پایداری پیدا نکردهاند.
جهش استارتاپهای داده در سایه نیاز به آموزش مدلها
طبق این گزارش، استارتاپهایی مانند Mercor، Surge AI، Handshake AI و بازیگران قدیمیتری مانند Scale AI با تأمین نیروی متخصص و دادههای بسیار تخصصی برای آزمایشگاههای پیشرو هوش مصنوعی، به درآمدهای صدها میلیون تا میلیارد دلاری رسیدهاند. این شرکتها شبکههای بزرگی از برنامهنویسان، وکلا، مشاوران، متخصصان مالی و حتی کارشناسان حوزههای محدودتر را به کار میگیرند تا دادههایی تولید کنند که برای آموزش مدلهای زبانی پیشرفته و روشهای تقویتی نوین ضروری است.
با کم شدن دادههای عمومی قابل استفاده در وب، آزمایشگاههایی مانند OpenAI و Anthropic برای پیشرفت بیشتر به دادههای سفارشی و «درجهیک» روی آوردهاند؛ دادههایی که اغلب براساس سناریوهای واقعی شغلی و با استفاده از «روبریک»ها یا چکلیستهای بسیار ریز و دقیق ساخته میشوند. همین نیاز، موجی از استارتاپهای جدید و تبدیل شرکتهای قدیمی منابع انسانی و برونسپاری به تأمینکنندگان داده هوش مصنوعی را رقم زده است.
چرا این روند برای صنعت و کاربران مهم است؟
تمرکز بر دادههای تخصصی، جهتگیری توسعه هوش مصنوعی را تغییر میدهد. به جای تکیه صرف بر افزایش اندازه مدلها و مراکز داده، اکنون کیفیت و دقت دادههای انسانی به گلوگاه اصلی تبدیل شده است. سرمایهگذاری چند میلیارد دلاری روی داده و نیروی کار ماهر نشان میدهد که خودکارسازی وظایف واقعی، از برنامهنویسی تا مشاوره و امور حقوقی، بدون مشارکت گسترده انسانها در طراحی معیارها و تولید مثالها هنوز ممکن نیست.
برای خوانندگان ایرانی، این روند دو پیام دارد: از یک سو، نشان میدهد بازار جهانی برای مهارتهای تخصصی و کار از راه دور در حوزه داده هوش مصنوعی بهسرعت در حال گسترش است؛ از سوی دیگر، وابستگی شدید شرکتهای داده به تعداد محدودی مشتری بزرگ و تغییر دائمی تکنیکهای آموزشی، این صنعت را شکننده و رقابتی کرده است. هر تغییر در استراتژی آزمایشگاههای بزرگ یا کند شدن جریان سرمایهگذاری میتواند به سرعت روی این بازیگران اثر بگذارد.
در نهایت، نویسندگان گزارش اشاره میکنند که اگر هوش مصنوعی در عمل شبیه یک «فناوری عادی» مانند اینترنت یا موتور بخار عمل کند، نیاز به دادههای انسانی باکیفیت در حوزههای متعدد برای سالها ادامه خواهد داشت؛ سناریویی که برای استارتاپهای داده جذاب، اما برای توسعهدهندگان مدلها پرهزینه است.
منبع خبر: The Verge




