מהפכה בעולם הבינה המלאכותית: DeepSeek מציגה את DeepSeek-R1
חברת DeepSeek חוללה סערה בקהילת הבינה המלאכותית עם השקת שני מודלים חדשניים – DeepSeek-R1-Zero ו-DeepSeek-R1, המסמנים התקדמות משמעותית ביכולות החשיבה
אם חשבתם שהחידושים בעולם הבינה המלאכותית נגמרו, OpenAI באה להזכיר לנו שבשבילם זה רק ההתחלה. ביום האחרון של אירועי ה-"Shipmas" (סוג של "חג המשלוחים") שלהם, הם הציגו את הדגם החדש ביותר שלהם, o3 – ממשיך הדרך של מודל ה-o1 המוכר.
ולא מדובר רק במודל אחד: o3 מגיע כחלק ממשפחה שכוללת גם את o3-mini, גרסה קטנה יותר שמתאימה למשימות ספציפיות.
אז למה זה מעניין? בואו נצלול.
OpenAI הכריזה בגאווה ש-o3, בתנאים מסוימים, מתקרב למה שמכונה AGI (בינה כללית מלאכותית) – חלום שעד כה נשמע כמו מדע בדיוני. אבל רגע, יש לא מעט הסתייגויות בדרך לשם.
AGI, אם תהיתם, הוא סוג של בינה מלאכותית שיכולה לבצע כל משימה שבני אדם מסוגלים לה – ואפילו טוב יותר. OpenAI רמזה שהמודל החדש שלהם מתחיל להראות סימנים בכיוון הזה, במיוחד במבחנים כמו ARC-AGI, שבודק יכולת למידה של משימות חדשות לחלוטין.
המחיר? כש-o3 פועל במצב חישוב גבוה ("High Compute"), הביצועים מרשימים במיוחד, אבל העלות נעה באלפי דולרים לכל משימה – עניין שלא ממש מתאים לכל אחד.
המודל הרגיל של o3 השתמש בכוח מחשוב משמעותי מאוד כדי להשיג את הציונים הגבוהים שלו במבחן הלא-רשמי, מה שהוביל לעלויות גבוהות לכל משימה. לעומת זאת, המודל הקטן, שפעל תחת מגבלות המחמירות של מבחן ה-ARC, הצליח להגיע לתוצאה מכובדת של 75.7%. ההבדל המרכזי הוא שביצועי המודל הקטן מוגבלים בהתאם לתנאי המבחן, בעוד שהמודל הרגיל נדרש לכמות גדולה יותר של משאבים כדי להפיק תוצאות גבוהות יותר.
מסתבר שהתשובה די משעשעת. OpenAI בחרו לדלג על השם o2 בגלל התנגשות אפשרית עם חברת התקשורת הבריטית O2. נשמע לכם מוזר? אתם לא לבד. גם מנכ"ל החברה, סם אלטמן, ציין את זה בשידור חי ואישר בעקיפין את הנושא.
כרגע o3 ו-o3-mini עוד לא זמינים לכולם. חוקרי בטיחות יכולים להירשם לגישה מוקדמת ל-o3-mini כבר היום, כאשר o3 המלא צפוי להגיע לשוק רק אחרי השקה מתוכננת של המיני בסוף ינואר 2025.
המבחנים הפנימיים של OpenAI, o3 הציג ביצועים מרשימים במיוחד:
96.7% במבחן המתמטיקה האמריקאי AIME, כשהוא מפספס רק שאלה אחת.
שיא עולמי במבחן Frontier Math של EpochAI עם 25.2% הצלחה – תוצאה שאף מודל אחר לא התקרב אליה.
קודפורס (מדד לכישורי תכנות): ציון של 2727, שממקם אותו גבוה ב-99.2% משאר המהנדסים.
אבל לא הכל ורוד. גם במצב חישוב גבוה, o3 עדיין נוטה לטעויות ב"משימות קלות", כמו משחק איקס-עיגול.
OpenAI משקיעה הרבה כדי שהמודלים שלה יהיו בטוחים לשימוש, אך יש עדיין סיכונים. חוקרי בטיחות גילו שהמודלים הקודמים, כמו o1, נטו לנסות להטעות משתמשים לעיתים קרובות יותר מאשר מודלים רגילים. האם o3 טוב יותר? התשובות יגיעו כשישוחררו תוצאות מבחני הבטיחות.
ההשקה של o3 מצטרפת לגל חדש של מודלים מתקדמים בתעשייה. גם חברות כמו גוגל ואליבאבא מציגות תחרות, אך העלויות הגבוהות של המודלים האלה מעלה שאלות על הכדאיות שלהם לטווח הארוך.
ההבדל במחיר בין המודלים טמון בכמות המשאבים שהמודלים משתמשים בהם כדי להשיג תוצאות. המודל הקטן, o3-mini זול יותר, עלות השימוש בו היא כ-20 דולר למשימה אחת. כן, כן. זה המודל הזול.
לעומת זאת, המודל הרגיל, שמספק תוצאות חזקות יותר, דורש הרבה יותר כוח מחשוב, והעלות לכל משימה יכולה להגיע לאלפי דולרים.
למשתמש רגיל, זה אומר שאם אתה רוצה להשתמש במודל הקטן, המחיר יהיה סביר וניתן לעמוד בו. אם תבחר במודל הרגיל, תצטרך לשלם הרבה יותר על כל משימה, מה שעשוי להיות יקר יותר אם אתה צריך להשתמש בכוח המחשוב הזה לאורך זמן.
o3 הוא צעד גדול קדימה, אבל הוא עדיין לא מושלם. עם ביצועים משופרים בתחומים כמו מתמטיקה ותכנות, לצד שיפורים בבטיחות ובאמינות, נראה ש-o3 מביא את הבינה המלאכותית צעד אחד קרוב יותר לעתיד שבו מחשבים אולי יחשבו ממש כמונו – או אפילו טוב יותר.
אבל הדרך ל-AGI עוד רחוקה, ויש הרבה אתגרים שצריך לפתור. בינתיים, נותר לנו רק להתרשם מהיכולות המרשימות – ולהתחיל לחסוך לאלגוריתם הבא.
חברת DeepSeek חוללה סערה בקהילת הבינה המלאכותית עם השקת שני מודלים חדשניים – DeepSeek-R1-Zero ו-DeepSeek-R1, המסמנים התקדמות משמעותית ביכולות החשיבה
ChatGPT מתפתח כל הזמן, והפיצ'ר החדש שלו, Tasks, הוא קפיצה משמעותית קדימה. הפיצ'ר מאפשר לכם ליצור משימות מתוזמנות שהמערכת תבצע
גוגל ממשיכה להפתיע עם חידושים פורצי דרך. כעת, ג'מיני, מודל השפה המתקדם של גוגל, מקבל שדרוג משמעותי המאפשר לו להפוך
בין אם אתם מתחילים את דרככם בעולם, מחפשים לשדרג את המיומנויות שלכם בעיצוב, או רוצים ללמוד כיצד לשלב AI בעבודתכם - יש לנו את הקורס המושלם עבורכם.
בואו תשדרגו את עצמכם לרמה של הגדולים. כי היום זה קל מתמיד.
השאירו פרטים לחזרה