לוגו אמיר משה בינה מלאכותית

אזור אישי

Claude Opus 4.7: כל החידושים, הבנצ’מרקים והשינויים השוברים

Claude Opus 4.7 שוחרר ב-16 באפריל 2026 והוא המודל הזמין המתקדם ביותר של Anthropic. השדרוג הזה מביא קפיצה משמעותית בביצועי קוד, ראייה ברזולוציה גבוהה לראשונה במשפחת Claude, מערכת חשיבה חדשה שמחליפה את Extended Thinking, וטוקנייזר חדש שמשפר ביצועים אך משנה את חישוב העלויות. במאמר הזה נפרק כל שינוי ספציפי, עם מספרים ובנצ’מרקים — כדי שתדעו בדיוק מה השתנה ומה זה אומר בשבילכם.

השינויים המרכזיים ב-Claude Opus 4.7

Anthropic לא הסתפקה בשיפורים קוסמטיים. Opus 4.7 כולל שינויים שוברי תאימות (breaking changes) שדורשים התאמות מצד מפתחים, לצד שיפורי ביצועים מדידים בכל תחום.

ראייה ברזולוציה גבוהה — לראשונה ב-Claude

Claude Opus 4.7 הוא המודל הראשון במשפחת Claude שתומך בתמונות ברזולוציה גבוהה. הרזולוציה המקסימלית קפצה מ-1,568 פיקסלים (1.15 מגה-פיקסל) ל-2,576 פיקסלים על הצלע הארוכה (3.75 מגה-פיקסל) — פי 3 יותר פיקסלים מ-Opus 4.6.

מה זה משנה בפועל?

עד עכשיו, שליחת צילום מסך או דיאגרמה טכנית לקלוד דרשה דאונסמפלינג שהרס פרטים קריטיים. עכשיו, הקואורדינטות של המודל מתאימות 1:1 לפיקסלים האמיתיים — אין צורך בחישובי סקייל. זה שינוי משחק למי שעובד עם Computer Use, ניתוח מסמכים, או הבנת ממשקי משתמש.

שיפורים ספציפיים בראייה

מעבר לרזולוציה, Opus 4.7 משפר את יכולות הלוקליזציה של תמונות — זיהוי bounding boxes, מדידה, ספירה ומשימות תפיסה ברמה נמוכה. בניווט ויזואלי ללא כלים, המודל קפץ מ-57.7% ל-79.5% — שיפור של כמעט 22 נקודות.

Adaptive Thinking מחליף את Extended Thinking

זהו אחד השינויים השוברים ביותר: Extended Thinking עם budget_tokens הוסר לחלוטין. שליחת הפרמטר הישן תחזיר שגיאה 400. במקומו, Anthropic מחייבת שימוש ב-Adaptive Thinking — מערכת שמתאימה את עומק החשיבה לפי מורכבות המשימה.

Adaptive Thinking — מערכת החשיבה החדשה ב-Claude Opus 4.7

מה ההבדל בין Extended Thinking ל-Adaptive Thinking?

ב-Extended Thinking (Opus 4.6), קבעתם מראש כמה טוקנים להקצות לחשיבה. ב-Adaptive Thinking, המודל מחליט בעצמו כמה לחשוב — לפי רמת ה-effort שבחרתם. Anthropic טוענת שבבדיקות פנימיות, Adaptive Thinking עולה בביצועיו על Extended Thinking באופן עקבי.

שינוי חשוב: חשיבה מוסתרת כברירת מחדל

החל מ-Opus 4.7, תוכן החשיבה לא מוצג כברירת מחדל. בלוקי החשיבה עדיין מופיעים בסטרימינג אבל שדה ה-thinking שלהם ריק. אם אתם מציגים חשיבה למשתמשים, צריך להוסיף display: "summarized" — אחרת המשתמש יראה השהייה ארוכה בלי הסבר.

רמת effort חדשה: xhigh

Opus 4.7 מוסיף רמת effort חדשה — xhigh — שיושבת בין high ל-max. Anthropic ממליצה להתחיל עם xhigh למשימות קוד ועבודה אג’נטית, ולהשתמש ב-high כמינימום לכל משימה שדורשת אינטליגנציה.

Task Budgets — פיצ’ר בטא חדש

פיצ’ר חדש שמאפשר להגדיר “תקציב טוקנים” ללולאה אג’נטית שלמה. המודל רואה ספירה לאחור ומתעדף את העבודה בהתאם. זה לא Hard Cap אלא המלצה שהמודל מודע לה — שונה מ-max_tokens שהוא תקרה קשיחה לכל בקשה.

מתי להשתמש ב-Task Budget?

Task Budget מתאים כשאתם רוצים שהמודל יתאים את היקף העבודה לתקציב מסוים — למשל, סקירת קוד בתוך 128K טוקנים. לעומת זאת, למשימות אג’נטיות פתוחות שבהן איכות חשובה מהירות — עדיף לא להגדיר task budget בכלל. המינימום הוא 20K טוקנים.

ביצועי קוד — הקפיצה הגדולה ביותר

תחום הקוד הוא המקום שבו Opus 4.7 מראה את השיפורים הדרמטיים ביותר, עם שיפורים דו-ספרתיים בכל בנצ’מרק מוביל.

בנצ’מרקים ומספרים

הנה ההשוואה הישירה בין Opus 4.6 ל-Opus 4.7:

SWE-bench Pro: 53.4% → 64.3% (קפיצה של 10.9 נקודות)
SWE-bench Verified: 80.8% → 87.6% (קפיצה של 6.8 נקודות)
CursorBench: 58% → 70% (קפיצה של 12 נקודות)
ניווט ויזואלי: 57.7% → 79.5% (קפיצה של 21.8 נקודות)

 

ביצועי קוד משופרים ב-Claude Opus 4.7

מה המספרים האלה אומרים בפועל?

SWE-bench Pro מודד פתרון באגים אמיתיים מ-GitHub — לא תרגילים אקדמיים. קפיצה של כמעט 11 נקודות אומרת שהמודל פותר הרבה יותר בעיות קוד אמיתיות. CursorBench מודד ביצועים בתוך IDE Cursor — כלומר שיפור ישיר בחוויית הפיתוח היומיומית.

שיפור ספציפי: עבודה אג’נטית ארוכת טווח

Anthropic מדגישה שהמודל שומר על קוהרנטיות לאורך משימות ארוכות — אוטומציות, CI/CD, ומשימות שרצות שעות. הוא גם יוצר פחות קריאות כלים מיותרות ומשתמש יותר בחשיבה פנימית, מה שמפחית עלויות ומשפר דיוק.

ידע מקצועי ועבודת ידע

מעבר לקוד, Opus 4.7 מראה שיפורים מדידים בעבודת ידע:

עריכת מסמכי DOCX: שיפור ב-redlining ומעקב שינויים.
עריכת מצגות PPTX: בדיקה עצמית של layout שקפים.
ניתוח גרפים ותרשימים: שיפור בתעתוק נתונים ברמת פיקסל באמצעות כלים כמו PIL.
ניתוח פיננסי: ביצועי State-of-the-Art בהערכת Finance Agent.

זיכרון משופר

Opus 4.7 טוב יותר בכתיבה ושימוש בזיכרון מבוסס קבצים. אם הסוכן שלכם מנהל scratchpad או קובץ הערות בין turns, הוא יהיה טוב יותר ברישום ובשימוש בהערות עתידיות. Anthropic גם השיקה Memory Tool — כלי scratchpad מנוהל צד-לקוח.

שינויי API שוברי תאימות

Opus 4.7 כולל שלושה שינויים שוברי תאימות שדורשים התאמות קוד. אם אתם משתמשים ב-Claude Managed Agents — אין שינויים שוברים.

הסרת פרמטרי דגימה

החל מ-Opus 4.7, שליחת temperature, top_p או top_k עם ערך לא-ברירת מחדל תחזיר שגיאה 400. הדרך הבטוחה היא פשוט להסיר את הפרמטרים האלה מהבקשות. אם השתמשתם ב-temperature=0 לדטרמיניזם — זה ממילא מעולם לא הבטיח פלט זהה.

טוקנייזר חדש — השפעה על עלויות

Opus 4.7 משתמש בטוקנייזר חדש שמשפר ביצועים אבל מייצר עד 35% יותר טוקנים עבור אותו טקסט. המשמעות: למרות שהמחיר לכל מיליון טוקנים נשאר $5 קלט / $25 פלט — העלות בפועל לכל בקשה עשויה לעלות. מומלץ לעדכן את max_tokens ולתת headroom נוסף.

טיפ: איך לשלוט בעלויות

שלוש דרכים לשלוט: (1) רמת effort נמוכה יותר למשימות פשוטות, (2) task budget למשימות אג’נטיות, (3) prompt caching שחוסך עד 90%. Batch processing חוסך 50% נוסף. שילוב נכון יכול למתן את עליית העלויות מהטוקנייזר החדש.

שינויי התנהגות — לא שוברי תאימות

מעבר לשינויים שוברים, Opus 4.7 מתנהג אחרת מ-4.6 בכמה דרכים:

מילוי הוראות מילולי יותר: המודל לא מכליל הוראה מפריט אחד לאחר, ולא מסיק בקשות שלא נעשו.
אורך תשובה מותאם: במקום ברירת מחדל של תשובות ארוכות, המודל מכייל אורך לפי מורכבות המשימה.
טון ישיר יותר: פחות אימוג’ים, פחות ביטויי חיזוק, יותר ענייניות — שינוי בולט לעומת הסגנון החם של 4.6.
פחות קריאות כלים: המודל מעדיף חשיבה על פעולה, אלא אם מעלים את ה-effort.
עדכוני התקדמות תכופים: בטריסים אג’נטיים ארוכים, המודל שולח סטטוס יותר לעתים קרובות.

תמחור וזמינות

Claude Opus 4.7 זמין עכשיו בכל הפלטפורמות:

מחירים ופלטפורמות

מחיר: $5 למיליון טוקני קלט, $25 למיליון טוקני פלט (ללא שינוי מ-4.6).
חלון הקשר: מיליון טוקנים ללא תוספת מחיר.
פלט מקסימלי: 128K טוקנים.
Model ID: claude-opus-4-7
זמין ב: claude.ai, API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry.

השוואת עלויות בפועל מול Opus 4.6

למרות שהמחיר הנקוב זהה, הטוקנייזר החדש מייצר עד 35% יותר טוקנים. כלומר בקשה שעלתה $1 ב-Opus 4.6 עשויה לעלות $1.35 ב-Opus 4.7. חשוב להשתמש ב-כלי AI מודלי שפה ופיצ’רים כמו prompt caching ו-batch processing כדי לאזן את העלויות.

אבטחה ובטיחות

מגבלות סייבר אוטומטיות

Opus 4.7 כולל מערכת הגנה אוטומטית שמזהה וחוסמת בקשות סייבר בסיכון גבוה. יכולות הסייבר הופחתו בכוונה לעומת Claude Mythos. אנשי אבטחה לגיטימיים יכולים להגיש בקשה ל-Cyber Verification Program של Anthropic לגישה מורחבת.

שיפורי כנות ועמידות

המודל מראה שיפור בעמידות מפני Prompt Injection ושיפורי כנות. Anthropic מגדירה אותו כ”מיושר ואמין במידה רבה, אם כי לא אידיאלי לחלוטין” — ומציינת חולשה קלה בתשובות מפורטות מדי על חומרים מבוקרים.

שאלות נפוצות

האם צריך לשנות קוד כשעוברים מ-Opus 4.6 ל-4.7?

כן. שלושה שינויים שוברים: (1) Extended Thinking הוסר — צריך לעבור ל-Adaptive Thinking, (2) temperature/top_p/top_k הוסרו — צריך להסיר מהבקשות, (3) טוקנייזר חדש — צריך לעדכן max_tokens. אם משתמשים ב-Claude Managed Agents, אין שינויים נדרשים.

כמה עולה Opus 4.7 בפועל?

המחיר הנקוב זהה: $5/$25 למיליון טוקנים. אבל הטוקנייזר החדש עשוי להגדיל עלויות עד 35%. prompt caching חוסך עד 90%, ו-batch processing חוסך 50%.

מה הקשר בין Opus 4.7 ל-Claude Mythos?

Mythos הוא מודל חזק יותר שנמצא בשחרור מוגבל בגלל יכולות סייבר מתקדמות. Opus 4.7 הוא המודל הזמין לכולם, עם מגבלות סייבר מכוונות ומערכת הגנה אוטומטית.

האם חלון ההקשר של מיליון טוקנים עולה יותר?

לא. חלון ההקשר של מיליון טוקנים זמין במחיר API רגיל ללא תוספת long-context. הפלט המקסימלי הוא 128K טוקנים.

האם Opus 4.7 תומך בעברית?

כן. Claude Opus 4.7 תומך בעברית ברמה גבוהה, כולל כתיבה, ניתוח ותרגום. הטוקנייזר החדש עשוי להשפיע על ספירת הטוקנים בעברית — מומלץ לבדוק עם endpoint ספירת הטוקנים.

סיכום

Claude Opus 4.7 הוא שדרוג משמעותי עם חידושים ספציפיים: ראייה ברזולוציה גבוהה (3.75MP) לראשונה, Adaptive Thinking שמחליף את Extended Thinking, רמת effort חדשה (xhigh), Task Budgets למשימות אג’נטיות, וקפיצות דו-ספרתיות בבנצ’מרקי קוד. אבל הוא גם מחייב שינויי קוד — הסרת פרמטרי דגימה, מעבר ל-Adaptive Thinking, והתאמה לטוקנייזר חדש שמעלה עלויות עד 35%. המודל זמין עכשיו בכל הפלטפורמות במחיר של $5/$25 למיליון טוקנים.