
Veo 2 של גוגל: מחולל הווידאו המתקדם בעולם – עכשיו בחינם
גוגל ממשיכה להרחיב את הגישה לכלי הבינה המלאכותית המתקדמים שלה. לאחר ההשקה של Gemini 2.5 – המודל החכם ביותר של
בעולם שבו מודלים של AI ליצירת תמונות משתפרים כל הזמן, עולה שאלה מסקרנת במיוחד:
מי מבין הכלים המובילים מסוגל להבין פרומפט מפורט ומורכב בצורה הטובה ביותר?
לקחתי על עצמי את המשימה לבדוק את זה, והשוותי בין ששת המודלים הבולטים בתחום:
מידג’רני, פיירפליי, ריקראפט, אידאוגרם, דאלי ופלוקס.
במאמר הזה, נציג את הכלים, נסביר כיצד הם מתמודדים עם פרומפטים מורכבים, ונבחן את התוצאות.
כדי להעמיד את המודלים למבחן, יצרנו פרומפט מלא בפרטים ייחודיים ומורכבים במיוחד:
“אישה מבוגרת עם שיער בלונדיני ארוך ופוני, נעליים ירוקות, סרט בשיער, שמלה מעוצבת בסגנון אלקטרוני, יושבת על ערימת מזומנים ומחזיקה יהלום ורוד. ברקע יער עולה בלהבות ונחל מזוהם, בשמיים חלליות מוזהבות וקשת בענן.”
הרעיון מאחורי פרומפט כזה היה לבדוק את רמת ההבנה של הכלים:
• עד כמה הפרטים הקטנים אכן יבואו לידי ביטוי בתמונה?
• האם המודלים יתעלמו מפרטים מסוימים או יוסיפו פרשנות חופשית?
• האם התוצאה תשקף את התיאור המורכב במלואו?
👈 קראו גם איזה מהמודלים שילב טקסטים בתמונות AI בצורה הטובה ביותר
אחד הכלים הפופולריים ביותר כיום, שמוכר בזכות היכולת שלו ליצור תמונות עשירות ובלוק אומנותי מאוד. מידג’רני ידוע בתוצאות המיוחדות והדמיון היצירתי שהוא מביא, אך לפעמים הוא עשוי להתמקד באסתטיקה על חשבון הדיוק.
איך הוא הצליח?
נראה שהוא השקיע בדיוק הפרטים, אך חלק מהאלמנטים לא היו כל כל ברורים כמו החלק העליון של השמלה האלקטרונית והנחל שלא בא לידי ביטוי:
כחלוץ בתחום יצירת תמונות ב-AI, דאלי כמעט ולא השתדרג ביכולותיו מאז שהושק ע”י Open AI.
איך הוא הצליח?
דאלי הביא תוצאה חמודה ודי קולעת לפרומפט, אולי פרט לשמלה הלא מספיק מאופיינת לנהר המזוהם שלא בא לידי ביטוי בתמונה הוא עשה עבודה טובה. חבל שהוא מוגב ביחס תמונה של 1:1 אבל זו כבר הגבלה אחרת.
מי הכי דייק בפרומפט:
מודלים כמו אידאוגרם, דאלי ופלוקס הוכיחו יכולת טובה להיצמד לפרומפט המורכב, בעוד פלוקס ומידג’רני נטו לפרשנות חופשית יותר.
מי עשה את האיזון הטוב ביותר בין דיוק לאמנותיות:
מידג’רני ופלוקס הפיקו תמונות מרהיבות מבחינה ויזואלית, גם אם לא תמיד מדויקות במלואן.
אין ספק שאידאוגרם עשה את העבודה הכי מדוייקת עם 0 טעויות.
במודל פלוקס (Flux) ניתן להשתמש בכמה כלים. קראו עוד בכתבה המלאה על מודלי Flux:
גוגל ממשיכה להרחיב את הגישה לכלי הבינה המלאכותית המתקדמים שלה. לאחר ההשקה של Gemini 2.5 – המודל החכם ביותר של
לאחרונה הושקה גרסה 7 של מידג’רני ונראה שהיא לא רק יוצרת תמונות יותר טוב – היא באה לשנות את כל
קצת יותר משבוע עבר מאז שהגרסה החדשה של Chat GPT 4o נכנסה לחיינו ורבים תהו האם עדיין יש צורך בכלי
השאירו פרטים לחזרה