תשכחו מ-R1 ו-O1 – קבלו את QwQ-32B, המודל הטוב בעולם?
העולם של הבינה המלאכותית ממשיך להתפתח בקצב מסחרר, והפעם יש לנו חידוש שעשוי לשנות את חוקי המשחק. הכירו את QwQ-32B, מודל עם 32 מיליארד פרמטרים שמציג ביצועים מרשימים המשתווים ואף עולים על אלו של DeepSeek-R1 – מודל עם 671 מיליארד פרמטרים (מתוכם 37 מיליארד מופעלים). אז איך מודל קטן יותר מצליח להדביק ואף לעקוף את הגדולים? התשובה טמונה בסקיילינג נכון של למידת חיזוק (RL).
תשכחו מ-R1 ו-O1 – קבלו את QwQ-32B, המודל הטוב בעולם? Read More »