
עריכת תמונות AI חינם עם LM Arena: הכלי שמאפשר לך להשוות מודלים
בשבוע האחרון התעמקתי ב”ננו בננה”, מודל בינה מלאכותית שזמין ב-LM Arena, Gemini ובפלטפורמות נוספות.
זה לא עוד מודל שמייצר
בעולם שבו מודלים של AI ליצירת תמונות משתפרים כל הזמן, עולה שאלה מסקרנת במיוחד:
מי מבין הכלים המובילים מסוגל להבין פרומפט מפורט ומורכב בצורה הטובה ביותר?
לקחתי על עצמי את המשימה לבדוק את זה, והשוותי בין ששת המודלים הבולטים בתחום:
מידג’רני, פיירפליי, ריקראפט, אידאוגרם, דאלי ופלוקס.
במאמר הזה, נציג את הכלים, נסביר כיצד הם מתמודדים עם פרומפטים מורכבים, ונבחן את התוצאות.
כדי להעמיד את המודלים למבחן, יצרנו פרומפט מלא בפרטים ייחודיים ומורכבים במיוחד:
“אישה מבוגרת עם שיער בלונדיני ארוך ופוני, נעליים ירוקות, סרט בשיער, שמלה מעוצבת בסגנון אלקטרוני, יושבת על ערימת מזומנים ומחזיקה יהלום ורוד. ברקע יער עולה בלהבות ונחל מזוהם, בשמיים חלליות מוזהבות וקשת בענן.”
הרעיון מאחורי פרומפט כזה היה לבדוק את רמת ההבנה של הכלים:
• עד כמה הפרטים הקטנים אכן יבואו לידי ביטוי בתמונה?
• האם המודלים יתעלמו מפרטים מסוימים או יוסיפו פרשנות חופשית?
• האם התוצאה תשקף את התיאור המורכב במלואו?
👈 קראו גם איזה מהמודלים שילב טקסטים בתמונות AI בצורה הטובה ביותר
אחד הכלים הפופולריים ביותר כיום, שמוכר בזכות היכולת שלו ליצור תמונות עשירות ובלוק אומנותי מאוד. מידג’רני ידוע בתוצאות המיוחדות והדמיון היצירתי שהוא מביא, אך לפעמים הוא עשוי להתמקד באסתטיקה על חשבון הדיוק.
איך הוא הצליח?
נראה שהוא השקיע בדיוק הפרטים, אך חלק מהאלמנטים לא היו כל כל ברורים כמו החלק העליון של השמלה האלקטרונית והנחל שלא בא לידי ביטוי:
ריקראפט הוא כלי חדש יחסית, שמצטיין במהירות יצירת התמונה ובממשק קנבס מיוחד.
איך הוא הצליח?
ריקראפט הפיק תוצאה מעניינת אך התעלם מפרטים מסוימים בפרומפט – ערימת המזומנים אמנם שם אבל לא במקום. ביד אין יהלום (כנראה שזה מיקס של מזומנים ורודים, משקפי שמש על הראש במקום סרט והתעלמויות נוספות. יותר מוצלח מדאלי אבל לא מאוד טוב בדיוק.
כחלוץ בתחום יצירת תמונות ב-AI, דאלי כמעט ולא השתדרג ביכולותיו מאז שהושק ע”י Open AI.
איך הוא הצליח?
דאלי הביא תוצאה חמודה ודי קולעת לפרומפט, אולי פרט לשמלה הלא מספיק מאופיינת לנהר המזוהם שלא בא לידי ביטוי בתמונה הוא עשה עבודה טובה. חבל שהוא מוגב ביחס תמונה של 1:1 אבל זו כבר הגבלה אחרת.
מי הכי דייק בפרומפט:
מודלים כמו אידאוגרם, דאלי ופלוקס הוכיחו יכולת טובה להיצמד לפרומפט המורכב, בעוד פלוקס ומידג’רני נטו לפרשנות חופשית יותר.
מי עשה את האיזון הטוב ביותר בין דיוק לאמנותיות:
מידג’רני ופלוקס הפיקו תמונות מרהיבות מבחינה ויזואלית, גם אם לא תמיד מדויקות במלואן.
אין ספק שאידאוגרם עשה את העבודה הכי מדוייקת עם 0 טעויות.
במודל פלוקס (Flux) ניתן להשתמש בכמה כלים. קראו עוד בכתבה המלאה על מודלי Flux:

בשבוע האחרון התעמקתי ב”ננו בננה”, מודל בינה מלאכותית שזמין ב-LM Arena, Gemini ובפלטפורמות נוספות.
זה לא עוד מודל שמייצר

בשבוע האחרון התעמקתי ב”ננו בננה”, מודל בינה מלאכותית שזמין ב-LM Arena, Gemini ובפלטפורמות נוספות.
זה לא עוד מודל שמייצר

Midjourney, הכלי המוכר שמאפשר ליצור תמונות מדהימות מתיאורי טקסט, השיק לאחרונה תכונה חדשה שמוסיפה מימד חדש ליצירתיות: היכולת ליצור סרטונים
השאירו פרטים לחזרה