
מהפכה בעולם הווידאו: Veo 3 של גוגל יוצר קליפים של 8 שניות מתמונה בודדת
עולם הבינה המלאכותית ממשיך להתפתח בקצב מסחרר, וגוגל שוב מוכיחה את עצמה כמובילה בתחום עם השקת הגרסה החדשה של מודל
מידג’רני היא אחת הפלטפורמות המובילות בעולם ליצירת תוכן ויזואלי באמצעות בינה מלאכותית, והיא מוכרת בעיקר בזכות היכולת שלה להפיק תמונות מרהיבות ומעוצבות רק מתוך טקסט. מאז הושקה, היא הפכה לתופעה תרבותית של ממש עם קהילה עצומה שמונה למעלה מ-21 מיליון משתמשים פעילים בדיסקורד. כעת, מידג’רני עושה צעד משמעותי נוסף ומשיקה את מודל הווידאו הראשון שלה – V1. ההכרזה הזו מסמלת את כניסתה הרשמית של מידג’רני לעולם הווידאו מבוסס AI, ומרחיבה את גבולות היצירה הדיגיטלית כפי שהכרנו עד היום.
מאז השקת מידג’רני 7 לפני כחודשיים, הובטח לנו שנקבל עוד הפתעות ואין ספק שעד עכשיו הם מקיימים.
פיצ’ר ה-Oref היה חידוש משמעותי ומעניין אבל כל זה לא משתווה להכרזה של מידג’רני מאתמול:
ההשקה האחרונה של פיצ’ר הווידאו לא מתרחשת בחלל ריק – היא באה בעיצומה של סערה משפטית, ובפרט תביעות חסרות תקדים על הפרת זכויות יוצרים מצד תאגידים כמו דיסני ויוניברסל. המעבר של מידג’רני לעולם הווידאו איננו רק חידוש טכנולוגי, אלא צעד אסטרטגי הכרחי בשוק ה-AI שנמצא במרוץ חימוש מול מתחרות כמו Sora של OpenAI ו-Veo של גוגל. מדובר במהלך שנועד לשמור על הרלוונטיות של מידג’רני ולתת לקהילת המשתמשים שלה סיבה להישאר באקוסיסטם שלה, במקום לנדוד לפלטפורמות אחרות – תגובה הגנתית לא פחות משהיא התקפית.
סרטון השקת מידג'רני וידאו
הפיצ’ר החדש, שזכה לשם הקוד V1, פועל במודל של “תמונה-לוידאו” (Image-to-Video). בניגוד למתחרים, כאן לא מתחילים מתיאור טקסטואלי של סצנה. התהליך מתחיל מתמונה קיימת – כזו שיצרתם במידג’רני או כל תמונה אחרת שהעליתם מהמחשב. באמצעות לחיצה על כפתור “Animate” חדש בממשק האינטרנטי, התמונה הסטטית שלכם מתעוררת לחיים.
כל פקודת אנימציה מייצרת ארבעה סרטוני וידאו שונים באורך 5 שניות כל אחד , מה שמעניק למשתמש מגוון של “מסלולי תנועה” לבחור מהם. מבחינה טכנית, הסרטונים מופקים ברזולוציה סטנדרטית של 480p ובקצב של 24 פריימים לשנייה, וללא תמיכה בסאונד בשלב זה.
מידג’רני מעניקה למשתמשים שליטה יצירתית על התוצאה הסופית באמצעות מספר כלים:
ניתן לבחור בין מצב “אוטומטי”, שבו הבינה המלאכותית מציעה תנועה באופן אקראי, לבין מצב “ידני”, שבו ניתן לתאר באמצעות טקסט את התנועה הרצויה.
קיימות שתי הגדרות עיקריות – “תנועה נמוכה” (Low Motion) לתנועות עדינות וסביבתיות כמו מצמוץ של דמות או תנועת מצלמה איטית, ו”תנועה גבוהה” (High Motion) לתנועה דינמית יותר של הדמות והמצלמה. חשוב לציין שהגדרה זו עלולה לעיתים להוביל לתוצאות “מוזרות” או גליצ’ים ויזואליים.
לאחר בחירת הסרטון המועדף, ניתן להאריך אותו במקטעים של 4 שניות, עד ארבע פעמים, ולהגיע לאורך כולל של כ-21 שניות.
צילום מסך מתוך ממשק מידג'רני. פיצ'ר הנפשת התמונות.
השקת V1 של מידג’רני אולי נראית כמו תגובה למתחרות החזקות בתחום הווידאו כמו Sora של OpenAI או Veo של גוגל, אבל בפועל מדובר במהלך אסטרטגי שמוכיח שמידג’רני לא משחקת לפי אותם חוקים – היא ממציאה את הלוח מחדש. במקום לרדוף אחרי ריאליזם קולנועי ופיצ’רים מתקדמים, היא בחרה לשים את האסתטיקה במרכז: תנועה פשוטה אך יפיפייה, עם מראה עקבי ומובחן בכל פריים. זהו כלי שנבנה עבור יוצרים – אמנים, מעצבים וחובבי חזון – ולא עבור אולפני הפקה. הווידאו לא בא להחליף את תוכנות העריכה, אלא להפיח חיים בתמונות וליצור נישה חדשה: “תמונות חיות” או “אמנות קונספט דינמית”. זוהי מתנה ליוצרים בלי רקע באנימציה – דרך לייצר לוגואים מונפשים, הדמיות מוצר, פוסטים לרשתות ומיתוג חזותי – במהירות, בקלות ובלי לאבד טיפת סגנון.
אבל מאחורי הקלעים, מתרקם חזון הרבה יותר שאפתני. עבור דיוויד הולץ, מנכ”ל מידג’רני, V1 היא רק אבן דרך במסע לעבר מטרה מרחיקת לכת: יצירת מודלים שמסוגלים לבצע סימולציות של עולמות פתוחים בזמן אמת. לא רק ליצור תמונה או סרטון – אלא לבנות יקום. השלבים הבאים כבר מתוכננים: רינדור תלת־ממדי, יצירת חוויות אינטראקטיביות, וכלים שיאפשרו לא רק יצירה של תוכן, אלא חוויית תוכן שלמה. אם זה יצליח, מידג’רני לא תהיה עוד “מחולל תמונות”, אלא תתמודד ראש בראש לא עם מחוללי AI – אלא עם ענקיות כמו Epic Games ו-Unity. V1 היא לא הסוף, אלא רק ההתחלה של מנוע העולמות החדש.
צילום מסך מתוך ממשק מידג'רני. פיצ'ר Expand Video
ראשית, חשוב להבהיר: מידג’רני הוא שירות בתשלום בלבד, ללא גרסת ניסיון חינמית. נקודת הכניסה היא התוכנית הבסיסית בעלות של $10 לחודש. אך כאן נכנס הנתון החשוב ביותר: יצירת וידאו עולה פי
שמונה יותר בזמן עיבוד (GPU) מאשר יצירת תמונה רגילה. זהו הגורם המכריע שירוקן במהירות את מכסת ה-“Fast GPU” החודשית שלכם.
משתמש בתוכנית הבסיסית, שמקבל כ-3.3 שעות (כ-200 דקות) של זמן עיבוד מהיר, יגלה שהקרדיטים שלו נגמרים במהירות מסחררת. מאחר שיצירת וידאו אחת יכולה לצרוך כ-8 דקות GPU, הוא יוכל לייצר כ-25 סרטונים בלבד בחודש לפני שיגיע למגבלה.
כאן נכנס לתמונה “גלגל ההצלה” (שהוא גם מנוע העלייה במחיר): “Relax Mode”. זהו מצב המאפשר יצירה בתור איטי יותר, מבלי לצרוך את דקות העיבוד המהירות. אך שימו לב לפרט הקריטי: גישה בלתי מוגבלת ל-Relax Mode עבור
וידאו זמינה אך ורק בתוכניות Pro ($60 לחודש) ו-Mega ($120 לחודש). זהו הפרט החשוב ביותר עבור כל יוצר וידאו רציני, והוא מהווה את האסטרטגיה המרכזית של מידג’רני לעודד משתמשים לשדרג. למרות העלות הגבוהה יחסית, החברה טוענת שהמחיר עדיין זול פי 25 מפתרונות מתחרים בשוק.
תוכנית | עלות חודשית | זמן GPU (דקות) | אפשרויות וידאו |
---|---|---|---|
Basic Plan | $10 | 200 | עד 25 סרטונים, יצירת סרטון אחד בו-זמנית |
Standard Plan | $30 | 900 | עד 112 סרטונים, יצירת 3 סרטונים בו-זמנית |
Pro Plan | $60 | 1800 | ללא הגבלה במצב “רילקס”, יצירת 2 סרטונים בו זמנית. |
Mega Plan | $120 | 3600 | ללא הגבלה במצב “רילקס”, יצירת 3 סרטונים בו זמנית. |
אז מה המסקנה? V1 של מידג’רני לא נועד להתחרות ב-Sora, אלא מגדיר קטגוריה חדשה – “אמנות חיה” נגישה, איכותית ונאמנה לערכים האמנותיים של הפלטפורמה. למרות מגבלות כמו סרטונים קצרים, היעדר סאונד ורזולוציה נמוכה, הכלי מותאם היטב לצרכים של קהילת המשתמשים היצירתית שלו.
אך מעל הכול מרחף איום משפטי משמעותי – התביעות מצד דיסני ויוניברסל. ובכל זאת, מדובר ברגע מכונן שמחזק את האסטרטגיה של מידג’רני, ומסמן את המעבר מעולם של תמונות סטטיות לעבר עתיד דינמי של יצירת עולמות חיים באמצעות בינה מלאכותית.
עולם הבינה המלאכותית ממשיך להתפתח בקצב מסחרר, וגוגל שוב מוכיחה את עצמה כמובילה בתחום עם השקת הגרסה החדשה של מודל
FLUX Kontext הוא מודל בינה מלאכותית שיודע לקחת תמונה ולשנות אותה לפי מה שאתם מבקשים, במילים פשוטות. כל דבר שתרצו
השבוע, במסגרת אירוע I/O 2025, גוגל חשפה סדרת פיצ’רים חדשים שממחישים עד כמה הבינה המלאכותית תהפוך לחלק בלתי נפרד מחיי
השאירו פרטים לחזרה