2026-04-25
مدل پرچمدار جدید اضافه شد: GPT-5.5
جدیدترین مدل پرچمدار OpenAI یعنی GPT-5.5 اکنون در FigAI در دسترس است. این مدل با عملکردی در سطح جدیدترین فناوری در کدنویسی عاملی، کار دانشی، استفاده از کامپیوتر و تحقیقات علمی، هوشمندترین و شهودیترین مدل تا به امروز است.
جزئیات
OpenAI
ما دسترسی به GPT-5.5 (با نام مدل gpt-5.5) را اعلام میکنیم. این مدل توانمندترین و شهودیترین مدل OpenAI تا به امروز است که برای کار واقعی روی وظایف پیچیده و چندمرحلهای طراحی شده است.
ویژگیهای کلیدی
- پنجره زمینه عظیم: ۱,۰۰۰,۰۰۰ توکن ورودی و ۱۲۸,۰۰۰ توکن خروجی – یعنی میتوانید کل یک کتاب را در یک درخواست تحلیل کنید.
- ورودی متن و تصویر، خروجی متن: قابلیت دریافت هم متن و هم تصویر به عنوان ورودی.
- استدلال پیشرفته: تلاش استدلال قابل تنظیم (بدون استدلال، کم، متوسط، زیاد، خیلی زیاد) – شما انتخاب میکنید که مدل چقدر عمیق فکر کند.
- عملکرد در سطح جدیدترین فناوری: نتایج خیرهکننده در بنچمارکهای معتبر (در ادامه).
- برتری در کدنویسی عاملی: استدلال بلندمدت قویتر، حفظ زمینه در کدبیسهای بزرگ و استفاده مطمئنتر از ابزارها.
- کارایی توکن: برای انجام همان وظایف، توکن مصرفی به مراتب کمتر از GPT-5.4 است – یعنی هم سریعتر و هم مقرونبهصرفهتر.
- پشتیبانی از فراخوانی تابع و ابزارها: مدل میتواند بهطور خودکار ابزارهای مناسب را انتخاب کرده و برای مدت طولانی روی یک وظیفه متمرکز بماند.
نتایج بنچمارکها
GPT-5.5 در بسیاری از معیارهای مهم به رکوردهای جدیدی دست یافته است. در جدول زیر مقایسهای با نسل قبلی (GPT-5.4) میبینید:
| معیار | GPT-5.5 | GPT-5.4 |
|---|---|---|
| Terminal-Bench 2.0 | ۸۲.۷٪ | ۷۵.۱٪ |
| Expert-SWE (داخلی) | ۷۳.۱٪ | ۶۸.۵٪ |
| GDPval (برد یا تساوی) | ۸۴.۹٪ | ۸۳.۰٪ |
| OSWorld-Verified | ۷۸.۷٪ | ۷۵.۰٪ |
| Tau2-bench Telecom | ۹۸.۰٪ | ۹۲.۸٪ |
| Toolathlon | ۵۵.۶٪ | ۵۴.۶٪ |
| BrowseComp | ۸۴.۴٪ | ۸۲.۷٪ |
| FrontierMath Tier 1–3 | ۵۱.۷٪ | ۴۷.۶٪ |
| FrontierMath Tier 4 | ۳۵.۴٪ | ۲۷.۱٪ |
| CyberGym | ۸۱.۸٪ | ۷۹.۰٪ |
| ARC-AGI-2 (Verified) | ۸۵.۰٪ | ۷۳.۳٪ |
همچنین در بازیابی زمینه طولانی (MRCR v2 با ۸ سوزن در ۵۱۲K تا ۱M توکن) امتیاز ۷۴.۰٪ را کسب کرده که نسبت به ۳۶.۶٪ در GPT-5.4 بهبود چشمگیری است.
موارد استفاده
GPT-5.5 برای طیف وسیعی از کارها ایدهآل است، از جمله:
- کدنویسی عاملی: پروژههای مهندسی خودگردان طولانی، بازسازی کد در چندین فایل، دیباگ در کدبیسهای بزرگ.
- کار دانشی: مدلسازی صفحهگسترده، تحقیق عملیاتی، تولید اسناد و اسلایدهای حرفهای.
- استفاده از کامپیوتر: کار با نرمافزارهای مختلف، پیمایش رابطهای کاربری و هماهنگی میان ابزارها.
- تحقیقات علمی: بیوانفورماتیک، زیستشناسی کمی، ریاضیات و تحلیل دادههای چندمرحلهای.
- تحلیل مالی و حقوقی: خلاصهسازی گزارشها، امتیازدهی ریسک، بررسی قراردادها.
- وظایف زمینه طولانی: تحلیل اسناد حجیم، استدلال روی کدبیسهای میلیونخطی.
نکته پایانی
GPT-5.5 یک جهش بزرگ در توانایی مدلهای زبانی است. چه یک برنامهنویس باشید که به دنبال یک دستیار کدنویسی فوقهوشمند است، چه یک محقق که نیاز به تحلیل دادههای پیچیده دارد، این مدل شما را شگفتزده خواهد کرد. همین امروز در FigAI آن را امتحان کنید و تفاوت را احساس کنید.