
כל מה שצריך להכיר בגרסה החדשה של מחולל התמונות Ideogram 3.0
העדכון החדש של Ideogram 3.0 מביא עמו שורה של שיפורים מרשימים שמשנים את כללי המשחק ביצירת תמונות באמצעות בינה מלאכותית.
קצת יותר משבוע עבר מאז שהגרסה החדשה של Chat GPT 4o נכנסה לחיינו ורבים תהו האם עדיין יש צורך בכלי יצירת תמונות אחרים.
בתור יוצר שמתעסק יום-יום עם עיצוב ויזואלי מבוסס בינה מלאכותית, אחד הדברים שאני הכי אוהב זה לבדוק כל כלי חדש שיוצא לשוק ולגלות מה הוא יודע לעשות. אז כשהפיצ’ר החדש של צ’אט ג’יפיטי ליצירת תמונות נפתח לשימוש – ברור שקפצתי עליו.
השאלה הראשונה שעלתה לי (ואני יודע שלא רק לי): האם זה הסוף של מידג’רני? האם הגיע הזמן לבטל את המנוי?
אז אחרי שעות רבות של ניסויים – יש לי תשובות. והן לא חד משמעיות.
יצירת וריאציה לתמונה בסגנון לגו. GPT מנתח את כל הפרטים שבתמונה ומייצר וריאציה עם דיוק מדהים
אפשר לדבר איתו כמו אל חבר שהוא גם מעצב גרפי – הוא מבין דיבור פשוט. אפשר לשלוח לו כמה תמונות, להסביר מה לקחת מכל אחת – והוא פשוט מבין. לא צריך להנדס פרומפטים מתמטיים. הוא מפרש כוונות, לא רק מילים.
אפשר לתת לו 10 תמונות של אנשים שונים – והוא לא מתבלבל. הוא יודע לשלב את כולם בתמונה תוך הפרדה ושמירה על כל אחד מהם בלי לערבב. זאת כמובן בניגוד למידג’רני שמאפשרת 20 רפרנסים של תמונות, אבל שברגע שמכניסים יותר מתמונה אחת, היא מתחילה לעשות מיקס וללכת לאיבוד.
נתקעתם? לא יודעים להסביר? פשוט ציירו סקיצה הכי בסיסית – הוא יבין. לפעמים אפילו יותר טוב מפרומפט ארוך.
GPT מבין את הסקיצה ויוצר תמונה עם קומפוזיציה מדוייקת
בניגוד למידג’רני, צ’אט GPT מצליח להכניס טקסטים ארוכים מאוד לתוך התמונה. אמנם יש עוד כלים שעושים את זה אבל נראה שבמקרה הזה הוא לוקח את היכולת הזאת צעד אחד קדימה – הטקסטים בתמונות שלו לא נראים כמו גרפיקה שהודבקה בצורה מלאכותית, אלא נראים ממש כחלק אמיתי מהתמונה.
הוא מצליח לשלב מוצרים קיימים בתמונה בצורה מרשימה. אמנם לא באופן זהה אחד לאחד – יש לו פספוסים קטנים אבל גם 90% זה מספיק טוב כדי לשכנע.
בשונה מצ’אט ג’יפיטי, מידג’רני יודעת להתמודד עם שינויים קטנים בלי ליצור תמונה חדשה לגמרי. היא מאפשרת לשמור על התמונה המקורית ולשנות רק את האיזורים שנבקש ממנה לשנות.
צ’אט GPT לעומת זאת לא יודע לערוך תמונה קיימת כמו מידג’רני. בכל שינוי קטן שתבקשו ממנו הוא ייצור תמונה חדשה לחלוטין. והתמונה אחרי השינוי מרגישה כמו חיקוי של מוצר באליאקספרס. הדבר הזה הוא חיסרון ענקי במיוחד כשמדובר בפנים של אנשים – אם הם לא סלבס, אין סיכוי שהוא ישחזר את תווי הפנים כמו שצריך. גם אם תשתמשו בפונקציית העורך שלו ותסמנו רק אזור ספציפי הוא עדיין ישנה את כל חלקי התמונה.
מידג’רני היא עדיין האמנית הכי מבריקה בשכונה. היא מפתיעה, מעוררת השראה, ויוצרת תמונות שנראות כמו ציורים מתערוכה. כל פרומפט מרגיש כמו יצירה אמנותית בפני עצמה.
אותו פרומפט בדיוק. הבדל של שמיים וארץ (התמונה הרחבה נוצרה במידג'רני 7 ואילו התמונה השני נוצרה ב-Chat GPT 4o)
מידג’רני מייצרת תמונות בקצב מסחרר בלי הגבלה – עם אפשרות לקבל בכל בקשה 4 תוצאות שונות בלחיצת כפתור, וליצור כמה שתרצו בלי הגבלות. תהליך העבודה פשוט זורם, מה שמאפשר להישאב לתוך היצירה ולצאת עם אופציות רבות תוך זמן קצר.
למידג’רני יש יתרון משמעותי נוסף והוא האפשרות לשלוט בפרמטרים של יצירת התמונה.
מעבר לבחירה מדויקת של יחס מסך (משהו שצ’אט ג’יפיטי לא מאפשר בכלל), מידג’רני מציעה עשרות פרמטרים שאפשר לשלוט בהם בעזרת סליידרים של הגברה והנמכה – כמה להשקיע בפרטים, עד כמה לשמור על הסגנון, האם לתת לדמיון להשתולל או דווקא לדייק לפי המקור, ועוד.
זאת מערכת שעוצבה במיוחד ליוצרים שרוצים לשלוט בתוצאות עד רמת הפיקסל.
הפרמטרים המתקדמים בהגדרות של מידג'רני
ממש לא. צ’אט GPT אכן מרשים אבל השילוב בין שני הכלים הוא זה שמייצר את הקסם האמיתי.
בדיוק כמו שבסטודיו טוב יש גם גרפיקאי, גם מאייר וגם קופירייטר – כך אנחנו בתור יוצרים נצטרך ללמוד להוציא את המיטב של כל כלי לפי היתרונות של כל אחד.
ועד אז – תיהנו מהשילוב.
כי כששני הכלים הכי טובים עובדים יחד – התוצאה מקסימלית!
העדכון החדש של Ideogram 3.0 מביא עמו שורה של שיפורים מרשימים שמשנים את כללי המשחק ביצירת תמונות באמצעות בינה מלאכותית.
עולם הטכנולוגיה רועש וגועש בעקבות ההכרזה האחרונה של OpenAI: סאם אלטמן, מנכ”ל החברה, הכריז על תוספת משמעותית ליכולות הבינה המלאכותית
לאחרונה כבש את עולם ה-AI מודל חדש בשם Reve Image 1.0, ואני חייב להודות – יש היום מודלים מצויינים אבל
השאירו פרטים לחזרה