לוגו אמיר משה בינה מלאכותית

אזור אישי

גוגל משיקה את Genie 3: יצירת עולמות אינטראקטיביים בזמן אמת

Genie 3 של גוגל DeepMind הוא אחד החידושים שממש תפס אותי. זה מודל שמאפשר ליצור סביבות וירטואליות שלמות, כאלו שאפשר לנווט בהן בזמן אמת, והכל מתחיל מתיאור טקסט פשוט או תמונה. זה לא סתם וידאו סטטי, אלא עולם דינמי שמגיב לתנועות שלך. הרקע כאן הוא המאמץ של גוגל לפתח כלים שמקדמים את הבינה המלאכותית לכיוון AGI, כלומר בינה כללית שמסוגלת להתמודד עם משימות מורכבות כמו בני אדם. Genie 3 בנוי על בסיס מחקר קודם, אבל עכשיו הוא זמין יותר ומביא יכולות חדשות כמו יצירה ב-24 פריימים לשנייה ורזולוציה של 720p, מה שהופך אותו לכלי מעשי יותר ליישומים כמו הדרכת AI או סימולציות חינוכיות.

מה זה Genie 3 בדיוק?

Genie 3 הוא סוג של world model, מודל עולם בעברית, שזה אומר שהוא בונה סביבה וירטואלית שלמה שמתנהגת בצורה הגיונית ומגיבה לפעולות. אתה נותן לו הנחיה טקסטואלית, כמו תיאור של נוף או סצנה, והוא מייצר עולם תלת ממדי שאפשר לחקור אותו מיד. מה שמיוחד כאן זה שהוא שומר על עקביות, כלומר אם אתה זז ימינה, העולם ממשיך להתעדכן בזמן אמת בלי קפיצות מוזרות. הוא יכול להחזיק את הזיכרון הקצר טווח לכמה דקות, מה שמאפשר אינטראקציות רציפות. זה שונה ממודלים קודמים כי הוא לא רק מייצר תמונה או וידאו, אלא סביבה אינטראקטיבית שמתאימה ליישומים כמו הדרכת סוכני AI בסביבות בטוחות או יצירת תוכן חינוכי.

סרטון ההשקה הרישמי של Genie 3

איך Genie 3 פועל מאחורי הקלעים?

מאחורי הקלעים, Genie 3 משתמש באלגוריתמים מתקדמים כדי לנבא איך הסביבה תתפתח. זה כמו מוח שחוזה את ההשפעה של פעולה, למשל אם אתה זז קדימה, הוא מחשב את השינויים בפרספקטיבה, בתאורה ובפיזיקה. הוא מאומן על נתונים ציבוריים מהאינטרנט, כולל וידאו ותמונות, כדי ללמוד חוקים בסיסיים כמו כוח משיכה או תנועה. המודל משלב neural networks, רשתות עצביות, שמעבדות את ההנחיה ומפיקות פריימים בזמן אמת. זה מאפשר לו לשמור על עקביות מרחבית, כלומר העולם נשאר הגיוני גם כשאתה מסתובב. ההתקדמות כאן היא ביכולת ליצור ב-24 פרי ימים לשנייה, מה שדורש כוח חישובי חזק אבל הופך את החוויה לזורמת.

איך להשתמש ולמי זה זמין?

כדי להשתמש ב-Genie 3 זמינה כאפליקציה ניסיונית כחלק מ-Google AI Studio למנויי Google AI Ultra בארה”ב. אתה כותב הנחיה טקסטואלית או מעלה תמונה, והמערכת בונה את העולם מיד. אפשר לנווט בו, לשנות אלמנטים או לשלב יצירות קיימות. זה לא זמין לכולם עדיין, כי זה פרויקט מחקרי, אבל גוגל מתכננת להרחיב את הגישה בהדרגה. זה מתאים למי שמתעניין ביצירה דיגיטלית, חינוך או פיתוח AI, כי זה כלי פשוט יחסית שדורש רק דפדפן.
צילום מסך מתוך עולם שיצר המודל. שולחן משרדי ועליו רצה דמות קרטון

צילום מסך מתוך ממשק Genie. עולם שנוצר בזמן אמת

גוגל ממשיכה להוביל את עולמות ה-AI
Genie 3 הוא צעד משמעותי ב-AI, כי הוא הופך רעיונות טקסטואליים לעולמות אינטראקטיביים שמגיבים בזמן אמת. זה מראה איך גוגל דוחפת את הגבולות כדי לבנות כלים שימושיים יותר, עם פוטנציאל ליישומים כמו הדרכת סוכנים או סימולציות. בעתיד, זה יכול להשפיע על תעשיות רבות, אבל כרגע זה הזדמנות להתנסות בטכנולוגיה חדשנית. אם אתה סקרן, שווה לבדוק את זה.

אולי יעניין אותך גם:

השאירו פרטים לחזרה