קלוד Opus 4.8 הושק: הדגל החדש של Anthropic + טבלת השוואה

קלוד Opus 4.8 הושק: הדגל החדש של Anthropic - וטבלת ההשוואה המלאה
29.5.2026 · Anthropic · Claude · מודלים חדשים
ב-28 במאי 2026 Anthropic הכריזה על Claude Opus 4.8, מודל הדגל החדש שלה. זה לא עוד שדרוג קוסמטי: Opus 4.8 מוביל בכל גרסאות SWE-bench, מביא כלי חדש בשם Dynamic Workflows שמריץ מאות תת-סוכנים במקביל, ולפי Anthropic הוא פי 4 פחות סביר להחזיר קוד עם באגים שלא סומנו. ריכזתי כאן רק את מה שבאמת חשוב - כולל טבלת השוואה ברורה מול Opus 4.7 ו-GPT-5.5.
טבלת ההשוואה - ביצועים
הציונים מתוך ה-System Card של Anthropic. התא המודגש בכל שורה הוא המנצח.
| בנצ'מרק | Opus 4.8 | Opus 4.7 | GPT-5.5 |
|---|---|---|---|
| SWE-bench Verified קוד - תיקון באגים אמיתיים |
88.6% | 87.6% | כ-86% |
| SWE-bench Pro קוד - משימות קשות |
69.2% | 64.3% | 58.6% |
| Terminal-Bench 2.1 עבודה בטרמינל / סוכנים |
74.6% | 66.1% | 78.2% |
| OSWorld-Verified שליטה במחשב (computer use) |
83.4% | 82.3% | 78.7% |
| GPQA Diamond הסקה מדעית |
93.6% | 94.2% | - |
| GDPval-AA עבודת ידע מקצועית (Elo) |
1890 | - | 1769 |
איך לקרוא את זה: Opus 4.8 מנצח בכל מבחני הקוד (SWE-bench) וגם בשליטה במחשב ובעבודת ידע. הנקודות החלשות יחסית: GPT-5.5 עדיין מוביל ב-Terminal-Bench, ו-GPQA כבר כמעט רווי - הנפילה הקטנה מול 4.7 שם זניחה בפועל.
טבלת ההשוואה - תמחור
| מודל | קלט / 1M | פלט / 1M |
|---|---|---|
| Opus 4.8 (רגיל) | $5 | $25 |
| Opus 4.8 Fast פי 2.5 מהירות |
$10 | $50 |
| GPT-5.5 | $3 | $15 |
| Gemini 3.x Pro | $2.50 | $10 |
המחיר הבסיסי זהה ל-Opus 4.7. שימו לב: ה-Fast Mode זול פי 3 מ-Fast Tier הקודם, ויש גם Batch API (50% הנחה) ו-cache hits (90% הנחה על הקלט).
מה באמת חדש ב-Opus 4.8?
Dynamic Workflows
כלי חדש (preview) ש-Claude Code מריץ דרכו מאות תת-סוכנים במקביל עם אימות עצמי - בנוי למשימות ענק כמו מיגרציה של קוד מעל 100K שורות.
Effort Control
ברירת המחדל השתנתה מ-medium ל-high. כדי לשמור על צריכת טוקנים כמו קודם צריך להגדיר במפורש effort: "medium".
Fast Mode
רץ פי 2.5 מהר יותר, ופי 3 זול יותר מה-Fast Tier של Opus 4.7 - מיועד ליישומים רגישים ל-latency.
Adaptive Thinking
מחליף את מודל ה-thinking budget הישן: המודל מקצה טוקני חשיבה אוטומטית לפי מורכבות המשימה, במקום תקציב קבוע.
השורה התחתונה
למי זה חשוב
- צוותי פיתוח: ההפרש ב-SWE-bench Pro (פי 10 נקודות מעל GPT-5.5) ו-"פי 4 פחות באגים" הופכים אותו לבחירה החזקה ביותר לקוד רציני וריצות ארוכות.
- אוטומציות וסוכנים: Dynamic Workflows + שליטה במחשב משופרת = יותר משימות מקצה-לקצה בלי השגחה צמודה.
- מי שרגיש לעלות: GPT-5.5 ו-Gemini עדיין זולים יותר לטוקן. אם המשימה לא קוד-כבד, שווה להשוות בפועל לפני מעבר.
שימו לב: שינוי ברירת המחדל ל-high effort יכול להעלות את החשבונית בלי שתשימו לב - מדדו תעבורה אמיתית אחרי המעבר.
קריאה נוספת: השקת Claude Opus 4.7 · ההכרזה הרשמית של Anthropic
רוצים להישאר צעד אחד קדימה?
הירשמו וקבלו עדכונים שוטפים על כלי AI חדשים, מדריכים מעשיים וטיפים שיחסכו לכם זמן!
השאירו פרטים וקבלו התראה ישירות לתיבת הדואר עם כל פוסט חדש. ערך מובטח, ללא ספאם. 💌