هوش مصنوعی5 دقیقه مطالعه

سخت‌تر شدن آزمون فنی آنتروپیک برای جلوگیری از تقلب با کلود

تیم بهینه‌سازی عملکرد آنتروپیک مجبور شده چند بار آزمون فنی استخدامی خود را تغییر دهد، چون مدل‌های کلود در حل آن از بیشتر متقاضیان بهتر عمل می‌کنند. این تغییرات برای کاهش امکان تقلب با ابزارهای هوش مصنوعی انجام شده است.

برای اینکه تازه‌ترین خبرهای تکنولوژی رو بدونی، کلیک کن! تازه‌ترین خبرهای تکنولوژی اینجاست.

تصویر مفهومی رقابت برنامه‌نویسان با ابزارهای هوش مصنوعی در آزمون فنی

آنتروپیک، سازنده مدل هوش مصنوعی کلود، اعلام کرده است که طی دو سال اخیر چندین بار آزمون فنی استخدامی خود را بازطراحی کرده تا متقاضیان نتوانند با کمک همین مدل‌ها در فرایند مصاحبه تقلب کنند.

مشکل وقتی شروع شد که کلود از برنامه‌نویس‌ها بهتر شد

به گزارش آنتروپیک، تیم «بهینه‌سازی عملکرد» این شرکت از سال ۲۰۲۴ یک آزمون خانگی برای ارزیابی توانایی فنی متقاضیان استفاده می‌کرد. اما با پیشرفت نسخه‌های جدید کلود، این مدل در چارچوب همان محدودیت زمانی، از بیشتر شرکت‌کنندگان انسانی بهتر عمل کرد و حتی نسخه جدیدتر آن با بهترین متقاضیان برابری کرد. در نتیجه، خروجی کدهای تولیدشده توسط متقاضیانی که از کلود استفاده می‌کردند، عملاً قابل تشخیص از خروجی خود مدل نبود.

این وضعیت برای یک آزمون غیرحضوری چالشی جدی ایجاد می‌کند؛ چون بدون مراقبت حضوری تشخیص این‌که فرد از ابزار هوش مصنوعی کمک گرفته یا نه بسیار دشوار است. این مسئله شبیه همان بحرانی است که مدارس و دانشگاه‌ها در جهان با استفاده دانشجویان از چت‌بات‌ها و ابزارهای تولید کد تجربه می‌کنند، با این تفاوت که این‌بار خود یک شرکت هوش مصنوعی قربانی همین روند شده است.

راه‌حل: طراحی چالش‌های تازه و متفاوت

رهبر این تیم در یک پست وبلاگی توضیح داده که نسخه جدید آزمون به‌جای تمرکز صرف روی بهینه‌سازی سخت‌افزار، به سراغ نوعی مسئله رفته که برای ابزارهای فعلی تا حدی ناآشنا و سخت‌تر است و در نتیجه تکیه کامل بر خروجی مدل‌های هوش مصنوعی برای حل آن دشوارتر می‌شود. آنتروپیک حتی نسخه قدیمی‌تر آزمون را منتشر کرده تا جامعه مهندسان و پژوهشگران ببیند آیا می‌توانند راه‌حل‌هایی بهتر از مدل ارائه دهند یا نه و در صورت موفقیت برای همکاری با شرکت ارتباط بگیرند.

این رویکرد برای صنعت هوش مصنوعی یک پیام مهم دارد: شرکت‌ها نه‌تنها در حال استفاده از مدل‌ها برای افزایش بهره‌وری هستند، بلکه ناچارند فرایندهای استخدام و سنجش مهارت را هم بازطراحی کنند. همین روند برای برنامه‌نویسان ایرانی هم معنا‌دار است؛ چرا که با گسترش استفاده از ابزارهایی مثل چت‌بات‌ها و دستیارهای کدنویسی، تمایز مهارت واقعی از اتکا به ابزار اهمیت بیشتری پیدا می‌کند و در عین حال بسیاری از فعالان حوزه برای دسترسی مطمئن به این سرویس‌ها به سراغ خرید اکانت های هوش‌مصنوعی بین‌المللی می‌روند.

این تغییرات نشان می‌دهد آزمون‌های سنتی برنامه‌نویسی و بهینه‌سازی دیگر به‌تنهایی کافی نیستند و شرکت‌ها باید روی سنجش توانایی تحلیل، طراحی سیستم و همکاری تیمی تمرکز بیشتری داشته باشند؛ حوزه‌هایی که هوش مصنوعی هنوز نمی‌تواند به‌سادگی جای انسان را بگیرد.

منبع خبر: TechCrunch

منبع: TechCrunch

توییترتلگرامواتساپ

مقالات مرتبط

شتاب دوباره رشد چت‌جی‌پی‌تی همزمان با دور جدید سرمایه‌گذاری اوپن‌ای‌آی
شتاب دوباره رشد چت‌جی‌پی‌تی همزمان با دور جدید سرمایه‌گذاری اوپن‌ای‌آی

طبق گزارشی از CNBC، سم آلتمان در جلسه‌ای داخلی از شتاب‌گرفتن دوباره رشد چت‌جی‌پی‌تی سخن گفته است؛ هم‌زمان گفته می‌شود اوپن‌ای‌آی در آستانه جذب دور جدیدی از سرمایه‌گذاری با ارزش‌گذاری بسیار بالا است.

5 دقیقه
هشدار اتحادیه اروپا به متا برای عقب‌نشینی از سیاست هوش مصنوعی واتس‌اپ
هشدار اتحادیه اروپا به متا برای عقب‌نشینی از سیاست هوش مصنوعی واتس‌اپ

اتحادیه اروپا به متا هشدار داده که در صورت عدم اصلاح سیاست‌های هوش مصنوعی در واتس‌اپ، اقدام‌های موقت ضدانحصار علیه این شرکت اعمال خواهد شد. بروکسل نگران استفاده متا از داده‌های کاربران برای خدمات هوش مصنوعی است.

5 دقیقه