مدل پرچمدار جدید اضافه شد: GPT-5.5

جزئیات

OpenAI

ما دسترسی به GPT-5.5 (با نام مدل gpt-5.5) را اعلام می‌کنیم. این مدل توانمندترین و شهودی‌ترین مدل OpenAI تا به امروز است که برای کار واقعی روی وظایف پیچیده و چندمرحله‌ای طراحی شده است.

ویژگی‌های کلیدی

پنجره زمینه عظیم: ۱,۰۰۰,۰۰۰ توکن ورودی و ۱۲۸,۰۰۰ توکن خروجی – یعنی می‌توانید کل یک کتاب را در یک درخواست تحلیل کنید.
ورودی متن و تصویر، خروجی متن: قابلیت دریافت هم متن و هم تصویر به عنوان ورودی.
استدلال پیشرفته: تلاش استدلال قابل تنظیم (بدون استدلال، کم، متوسط، زیاد، خیلی زیاد) – شما انتخاب می‌کنید که مدل چقدر عمیق فکر کند.
عملکرد در سطح جدیدترین فناوری: نتایج خیره‌کننده در بنچمارک‌های معتبر (در ادامه).
برتری در کدنویسی عاملی: استدلال بلندمدت قوی‌تر، حفظ زمینه در کدبیس‌های بزرگ و استفاده مطمئن‌تر از ابزارها.
کارایی توکن: برای انجام همان وظایف، توکن مصرفی به مراتب کمتر از GPT-5.4 است – یعنی هم سریع‌تر و هم مقرون‌به‌صرفه‌تر.
پشتیبانی از فراخوانی تابع و ابزارها: مدل می‌تواند به‌طور خودکار ابزارهای مناسب را انتخاب کرده و برای مدت طولانی روی یک وظیفه متمرکز بماند.

نتایج بنچمارک‌ها

GPT-5.5 در بسیاری از معیارهای مهم به رکوردهای جدیدی دست یافته است. در جدول زیر مقایسه‌ای با نسل قبلی (GPT-5.4) می‌بینید:

معیار	GPT-5.5	GPT-5.4
Terminal-Bench 2.0	۸۲.۷٪	۷۵.۱٪
Expert-SWE (داخلی)	۷۳.۱٪	۶۸.۵٪
GDPval (برد یا تساوی)	۸۴.۹٪	۸۳.۰٪
OSWorld-Verified	۷۸.۷٪	۷۵.۰٪
Tau2-bench Telecom	۹۸.۰٪	۹۲.۸٪
Toolathlon	۵۵.۶٪	۵۴.۶٪
BrowseComp	۸۴.۴٪	۸۲.۷٪
FrontierMath Tier 1–3	۵۱.۷٪	۴۷.۶٪
FrontierMath Tier 4	۳۵.۴٪	۲۷.۱٪
CyberGym	۸۱.۸٪	۷۹.۰٪
ARC-AGI-2 (Verified)	۸۵.۰٪	۷۳.۳٪

همچنین در بازیابی زمینه طولانی (MRCR v2 با ۸ سوزن در ۵۱۲K تا ۱M توکن) امتیاز ۷۴.۰٪ را کسب کرده که نسبت به ۳۶.۶٪ در GPT-5.4 بهبود چشمگیری است.

موارد استفاده

GPT-5.5 برای طیف وسیعی از کارها ایده‌آل است، از جمله:

کدنویسی عاملی: پروژه‌های مهندسی خودگردان طولانی، بازسازی کد در چندین فایل، دیباگ در کدبیس‌های بزرگ.
کار دانشی: مدل‌سازی صفحه‌گسترده، تحقیق عملیاتی، تولید اسناد و اسلایدهای حرفه‌ای.
استفاده از کامپیوتر: کار با نرم‌افزارهای مختلف، پیمایش رابط‌های کاربری و هماهنگی میان ابزارها.
تحقیقات علمی: بیوانفورماتیک، زیست‌شناسی کمی، ریاضیات و تحلیل داده‌های چندمرحله‌ای.
تحلیل مالی و حقوقی: خلاصه‌سازی گزارش‌ها، امتیازدهی ریسک، بررسی قراردادها.
وظایف زمینه طولانی: تحلیل اسناد حجیم، استدلال روی کدبیس‌های میلیون‌خطی.

نکته پایانی

GPT-5.5 یک جهش بزرگ در توانایی مدل‌های زبانی است. چه یک برنامه‌نویس باشید که به دنبال یک دستیار کدنویسی فوق‌هوشمند است، چه یک محقق که نیاز به تحلیل داده‌های پیچیده دارد، این مدل شما را شگفت‌زده خواهد کرد. همین امروز در FigAI آن را امتحان کنید و تفاوت را احساس کنید.