یک استارتاپ ۳۰ نفره به نام Arcee AI مدل زبانی عظیم و کاملاً متنبازی به نام Trinity معرفی کرده که ۴۰۰ میلیارد پارامتر دارد و به ادعای شرکت، در برخی آزمونها با Llama 4 Maverick متا و مدلهای بزرگ متنباز چینی رقابت میکند.
مدل Trinity چیست و چه ویژگیهایی دارد؟
Trinity یک مدل پایه (foundation model) عمومی است که تحت لایسنس کاملاً متنباز Apache عرضه میشود؛ موضوعی که آن را از مدلهای متنباز مشروط مانند Llama متا متمایز میکند. نسخه فعلی فقط متنی است اما Arcee اعلام کرده روی افزودن حالتهای دیگر مانند بینایی و گفتار به متن (speech-to-text) کار میکند تا مدل را چندوجهی کند.
به گفته Arcee، نسخه پایه Trinity در مرحله پیشنمایش، در بنچمارکهای مختلف مرتبط با کدنویسی، ریاضیات، استدلال و دانش عمومی در بسیاری از موارد با Llama همسطح یا کمی بهتر ظاهر شده است. این استارتاپ پیشتر دو مدل کوچکتر Trinity Mini و Trinity Nano را هم منتشر کرده بود و اعلام میکند کل خانواده Trinity را ظرف حدود شش ماه و با بودجهای در حد چند ده میلیون دلار و با استفاده از هزاران GPU قدرتمند آموزش داده است.
چرا این مدل برای صنعت و توسعهدهندگان مهم است؟
تمرکز Arcee روی ارائه یک «مدل متنباز دائمی» است؛ یعنی شرکتی که وعده میدهد مدلهایش همیشه با لایسنس آزاد و بدون محدودیتهای تجاری منتشر شود. این رویکرد برای توسعهدهندگان، دانشگاهها و حتی شرکتهایی که به دلایل حقوقی یا حاکمیتی، نسبت به استفاده از مدلهای تحت مالکیت غولهای فناوری یا مدلهای ساخت چین حساساند، جذاب است. برای کسبوکارهایی که قصد شخصیسازی و آموزش تکمیلی دارند، نسخههایی مثل Trinity Large Base و TrueBase بدون دادههای دستوری اضافی عرضه میشوند تا آزادی عمل بیشتری برای تنظیم مدل داشته باشند.
برای مخاطبان ایرانی هم روند رقابت در حوزه مدلهای متنباز مهم است؛ زیرا هرچه گزینههای متنباز قدرتمندتر شوند، دسترسی غیرمستقیم به فناوریهای سطحبالا از طریق پلتفرمها و ابزارهای واسط سادهتر خواهد شد. همزمان، بسیاری از کاربران داخل ایران برای کار روزمره خود از ابزارهای هوش مصنوعی متنوع استفاده میکنند و سرویسهایی که امکان خرید اکانت های هوشمصنوعی را فراهم میکنند، میتوانند دسترسی به این مدلها و سرویسهای مبتنی بر آنها را راحتتر کنند.
Arcee علاوه بر ارائه دانلود رایگان وزنهای مدل، قصد دارد نسخه میزبانیشده (hosted) Trinity را نیز با قیمت API رقابتی عرضه کند و همچنان روی خدمات پسآموزش و سفارشیسازی برای مشتریان سازمانی تمرکز داشته باشد.
منبع خبر: TechCrunch




