המודל החכם בעולם? Open AI מציגים את o3

אמיר משה

21 בדצמבר, 2024

אם חשבתם שהחידושים בעולם הבינה המלאכותית נגמרו, OpenAI באה להזכיר לנו שבשבילם זה רק ההתחלה. ביום האחרון של אירועי ה-“Shipmas” (סוג של “חג המשלוחים”) שלהם, הם הציגו את הדגם החדש ביותר שלהם, o3 – ממשיך הדרך של מודל ה-o1 המוכר.

ולא מדובר רק במודל אחד: o3 מגיע כחלק ממשפחה שכוללת גם את o3-mini, גרסה קטנה יותר שמתאימה למשימות ספציפיות.

אז למה זה מעניין? בואו נצלול.

o3 - זה כבר כמעט AGI?

OpenAI הכריזה בגאווה ש-o3, בתנאים מסוימים, מתקרב למה שמכונה AGI (בינה כללית מלאכותית) – חלום שעד כה נשמע כמו מדע בדיוני. אבל רגע, יש לא מעט הסתייגויות בדרך לשם.

AGI, אם תהיתם, הוא סוג של בינה מלאכותית שיכולה לבצע כל משימה שבני אדם מסוגלים לה – ואפילו טוב יותר. OpenAI רמזה שהמודל החדש שלהם מתחיל להראות סימנים בכיוון הזה, במיוחד במבחנים כמו ARC-AGI, שבודק יכולת למידה של משימות חדשות לחלוטין.

המחיר? כש-o3 פועל במצב חישוב גבוה (“High Compute”), הביצועים מרשימים במיוחד, אבל העלות נעה באלפי דולרים לכל משימה – עניין שלא ממש מתאים לכל אחד.

מה ההבדל בין o3 ל-o3-mini?

המודל הרגיל של o3 השתמש בכוח מחשוב משמעותי מאוד כדי להשיג את הציונים הגבוהים שלו במבחן הלא-רשמי, מה שהוביל לעלויות גבוהות לכל משימה. לעומת זאת, המודל הקטן, שפעל תחת מגבלות המחמירות של מבחן ה-ARC, הצליח להגיע לתוצאה מכובדת של 75.7%. ההבדל המרכזי הוא שביצועי המודל הקטן מוגבלים בהתאם לתנאי המבחן, בעוד שהמודל הרגיל נדרש לכמות גדולה יותר של משאבים כדי להפיק תוצאות גבוהות יותר.

רגע, למה קוראים לו o3 ולא o2?

מסתבר שהתשובה די משעשעת. OpenAI בחרו לדלג על השם o2 בגלל התנגשות אפשרית עם חברת התקשורת הבריטית O2. נשמע לכם מוזר? אתם לא לבד. גם מנכ”ל החברה, סם אלטמן, ציין את זה בשידור חי ואישר בעקיפין את הנושא.

o3 ואחיו הקטן - מתי נוכל להשתמש בהם?

כרגע o3 ו-o3-mini עוד לא זמינים לכולם. חוקרי בטיחות יכולים להירשם לגישה מוקדמת ל-o3-mini כבר היום, כאשר o3 המלא צפוי להגיע לשוק רק אחרי השקה מתוכננת של המיני בסוף ינואר 2025.

כמה הוא באמת חכם?

המבחנים הפנימיים של OpenAI, o3 הציג ביצועים מרשימים במיוחד:

96.7% במבחן המתמטיקה האמריקאי AIME, כשהוא מפספס רק שאלה אחת.
שיא עולמי במבחן Frontier Math של EpochAI עם 25.2% הצלחה – תוצאה שאף מודל אחר לא התקרב אליה.
קודפורס (מדד לכישורי תכנות): ציון של 2727, שממקם אותו גבוה ב-99.2% משאר המהנדסים.
אבל לא הכל ורוד. גם במצב חישוב גבוה, o3 עדיין נוטה לטעויות ב”משימות קלות”, כמו משחק איקס-עיגול.

OpenAI משקיעה הרבה כדי שהמודלים שלה יהיו בטוחים לשימוש, אך יש עדיין סיכונים. חוקרי בטיחות גילו שהמודלים הקודמים, כמו o1, נטו לנסות להטעות משתמשים לעיתים קרובות יותר מאשר מודלים רגילים. האם o3 טוב יותר? התשובות יגיעו כשישוחררו תוצאות מבחני הבטיחות.

ההשקה של o3 מצטרפת לגל חדש של מודלים מתקדמים בתעשייה. גם חברות כמו גוגל ואליבאבא מציגות תחרות, אך העלויות הגבוהות של המודלים האלה מעלה שאלות על הכדאיות שלהם לטווח הארוך.

כמה עולה השימוש במודל?

ההבדל במחיר בין המודלים טמון בכמות המשאבים שהמודלים משתמשים בהם כדי להשיג תוצאות. המודל הקטן, o3-mini זול יותר, עלות השימוש בו היא כ-20 דולר למשימה אחת. כן, כן. זה המודל הזול.

לעומת זאת, המודל הרגיל, שמספק תוצאות חזקות יותר, דורש הרבה יותר כוח מחשוב, והעלות לכל משימה יכולה להגיע לאלפי דולרים.

למשתמש רגיל, זה אומר שאם אתה רוצה להשתמש במודל הקטן, המחיר יהיה סביר וניתן לעמוד בו. אם תבחר במודל הרגיל, תצטרך לשלם הרבה יותר על כל משימה, מה שעשוי להיות יקר יותר אם אתה צריך להשתמש בכוח המחשוב הזה לאורך זמן.

לסיכום

o3 הוא צעד גדול קדימה, אבל הוא עדיין לא מושלם. עם ביצועים משופרים בתחומים כמו מתמטיקה ותכנות, לצד שיפורים בבטיחות ובאמינות, נראה ש-o3 מביא את הבינה המלאכותית צעד אחד קרוב יותר לעתיד שבו מחשבים אולי יחשבו ממש כמונו – או אפילו טוב יותר.

אבל הדרך ל-AGI עוד רחוקה, ויש הרבה אתגרים שצריך לפתור. בינתיים, נותר לנו רק להתרשם מהיכולות המרשימות – ולהתחיל לחסוך לאלגוריתם הבא.

אזור אישי

המודל החכם בעולם? Open AI מציגים את o3

אמיר משה

o3 - זה כבר כמעט AGI?

מה ההבדל בין o3 ל-o3-mini?

רגע, למה קוראים לו o3 ולא o2?

o3 ואחיו הקטן - מתי נוכל להשתמש בהם?

כמה הוא באמת חכם?

כמה עולה השימוש במודל?

לסיכום

אולי יעניין אותך גם:

Claude Opus 4.7: כל החידושים, הבנצ’מרקים והשינויים השוברים

המדריך המלא על קלוד מיתוס: המודל החדש של אנתרופיק שמשנה את כללי המשחק בסייבר

סקירת GPT-5.4: כל מה שצריך לדעת על מודל הדגל של OpenAI

צרו קשר