לוגו אמיר משה בינה מלאכותית

אזור אישי

OpenAI משיקה מודל יצירת תמונות משופר: GPT Image 1.5 מביא דיוק חסר תקדים ומהירות פי 4

חברת OpenAI הכריזה היום על גרסה משופרת של מערכת יצירת התמונות ChatGPT Images, המבוססת על מודל דור חדש בשם GPT Image 1.5. המודל החדש מציע שיפורים משמעותיים ביכולת לבצע עריכות מדויקות תוך שמירה על פרטים חיוניים בתמונה, ומייצר תמונות עד פי ארבעה מהר יותר מקודמו. לצד השקת המודל, החברה מציגה גם חוויית משתמש חדשה ייעודית לעבודה עם תמונות, שנועדה להפוך את תהליך היצירה הויזואלית לנגיש ומהיר יותר.

המודל החדש החל להתפרס היום ב-ChatGPT עבור כלל המשתמשים, והוא זמין גם ב-API תחת השם GPT Image 1.5. חוויית המשתמש החדשה מתפרסת גם היא החל מהיום עבור רוב המשתמשים, כאשר גישה ללקוחות עסקיים וארגוניים תגיע בשלב מאוחר יותר.

המחשת יכולות מודל GPT Image 1.5

עריכת תמונות מדויקת שמשמרת את המהות

אחד השיפורים המרכזיים במודל החדש הוא יכולתו לבצע עריכות מדויקות בתמונות קיימות תוך שמירה על הפרטים החשובים. כאשר משתמש מעלה תמונה ומבקש לערוך אותה, המודל מצליח כעת לעקוב אחר הכוונה המדויקת של המשתמש ולשנות רק את מה שהתבקש, תוך שמירה על עקביות של אלמנטים כמו תאורה, קומפוזיציה ומראה של אנשים לאורך כל התהליך. יכולת זו מאפשרת תוצאות שמתאימות באמת לכוונת המשתמש, החל מעריכות תמונות שימושיות ומעשיות, דרך התנסויות וירטואליות עם בגדים ותסרוקות שונות, ועד טרנספורמציות סגנוניות וקונספטואליות ששומרות על המהות של התמונה המקורית.

השיפורים האלה הופכים את ChatGPT לסוג של אולפן יצירתי נייד, המסוגל לבצע גם עריכות פרקטיות וגם פרשנויות אמנותיות ביטוייות של תמונות. המודל מצטיין בסוגים שונים של עריכה, כולל הוספה, הפחתה, שילוב, מיזוג והעברה של אלמנטים, כך שהמשתמש מקבל את השינויים שהוא רוצה מבלי לאבד את מה שהופך את התמונה למיוחדת.

המחשת יכולות מודל GPT Image 1.5
המחשת יכולות מודל GPT Image 1.5
המחשת יכולות מודל GPT Image 1.5
המחשת יכולות מודל GPT Image 1.5
המחשת יכולות מודל GPT Image 1.5
המחשת יכולות מודל GPT Image 1.5

יצירתיות מתקדמת ושליטה מלאה

היכולת היצירתית של המודל באה לידי ביטוי במיוחד בטרנספורמציות שמשנות ומוסיפות אלמנטים כמו טקסט ומבנה כדי להביא רעיונות לחיים, תוך שמירה על פרטים חשובים. טרנספורמציות אלה עובדות הן עבור קונספטים פשוטים והן עבור רעיונות מורכבים יותר, וקל לנסות אותן באמצעות סגנונות ורעיונות מוגדרים מראש בחוויית המשתמש החדשה של ChatGPT Images, ללא צורך בהקלדת הנחיות טקסטואליות. למשל, ניתן להפוך תמונה רגילה לפוסטר קולנועי בסגנון עידן הזהב של הוליווד, להוסיף טקסט מעוצב, לשנות לבוש של דמויות ולהתאים את הכל לסגנון מסוים.

המודל גם משתפר משמעותית בעקיבה אחר הוראות מורכבות ביחס לגרסה הראשונית. יכולת זו מאפשרת ביצוע עריכות מדויקות יותר וגם קומפוזיציות מקוריות מורכבות יותר, בהן היחסים בין אלמנטים נשמרים כפי שהתכוון המשתמש. לדוגמה, המודל מסוגל ליצור רשת של שישה על שישה פריטים שונים במיקומים מדויקים, תוך שמירה על הסדר והמבנה המבוקש. זהו שיפור ניכר ביכולת להבין ולבצע משימות שדורשות דיוק מרחבי ולוגי.

המחשת יכולות מודל GPT Image 1.5

רינדור טקסט משופר ופרטים עדינים

אחד האתגרים המרכזיים ביצירת תמונות באמצעות בינה מלאכותית הוא יכולת הרינדור של טקסט בתוך התמונות. GPT Image 1.5 עושה צעד משמעותי קדימה בתחום זה, כאשר הוא מסוגל להתמודד עם טקסט צפוף וקטן יותר. המודל יכול ליצור תמונות של עיתונים עם מאמרים מפורטים, אינפוגרפיקות עם מידע רב, או פרסומות עם טקסט ברור וקריא. יכולת זו פותחת אפשרויות רבות עבור יצירת חומרים שיווקיים, מצגות ומסמכים ויזואליים מקצועיים.

בנוסף לשיפורים אלה, המודל מציג התקדמות בממדים נוספים שמתורגמים לתפוקות שימושיות יותר באופן מיידי. לדוגמה, המודל משתפר ביכולת לעבד פנים קטנות רבות בתמונה אחת, וכן בכך שהתוצאות נראות טבעיות יותר. תמונות של סצנות עירוניות עם המון אנשים, או תמונות עם פרטים עדינים כמו השתקפויות ותאורה מורכבת, יוצאות עם רמת איכות גבוהה יותר ומראה ריאליסטי יותר.

המחשת יכולות מודל GPT Image 1.5
חוויית משתמש חדשה למרחב יצירה

מעבר לשיפורים במודל עצמו, OpenAI מציגה חוויית משתמש חדשה ייעודית ליצירת תמונות ב-ChatGPT. החוויה החדשה זמינה בסרגל הצד באפליקציה הניידת ובאתר chatgpt.com, והיא נועדה להפוך את תהליך החקירה והניסוי עם תמונות למהיר וקל יותר. הממשק כולל עשרות פילטרים מוגדרים מראש והנחיות טרנדיות שמתעדכנות באופן קבוע כדי לשקף מגמות מתפתחות בעולם היצירה הדיגיטלית.

אחת מהתכונות הבולטות בחוויה החדשה היא אפשרות להעלות תמונה של המשתמש פעם אחת, כך שניתן יהיה לעשות שימוש חוזר במראה שלו ביצירות עתידיות מבלי צורך לחפש בגלריית התמונות בכל פעם מחדש. יחד עם מהירות הייצור המשופרת של עד פי ארבעה, והיכולת להמשיך ולייצר תמונות חדשות בזמן שאחרות עדיין בתהליך עיבוד, החוויה הופכת להרבה יותר זורמת ומאפשרת לחקור רעיונות רבים יותר ללא המתנות מיותרות.

ממשק המשתמש החדש של יצירת התמונות בchatGPT

שיפורים ומגבלות

OpenAI הריצה מחדש רבות מהדוגמאות מההשקה הראשונית של מערכת יצירת התמונות כדי להעריך את הביצועים של המודל החדש. המודל מראה שיפורים ברורים במגוון מקרים, אם כי התוצאות עדיין אינן מושלמות. למשל, ביצירת פוסטר של יצורים במעמקי הים עם חתך אנכי של האוקיינוס, המודל החדש מפיק גרפיקה חיה הרבה יותר ונכונה בכשבעים אחוז, תוך הימנעות מחיתוך מוקדם של התמונה. עם זאת, עדיין יש אי-דיוקים מדעיים ומקרים שבהם המודל לא משיג את התוצאה האופטימלית.

החברה מדגישה שלמרות שההשקה הנוכחית מייצגת התקדמות משמעותית, עדיין יש מקום רב לשיפור באיטרציות עתידיות. מגבלות קיימות כוללות אתגרים בסגנונות מסוימים, בעיבוד של פנים מרובות במקרים מסוימים, ובתמיכה רב-לשונית. אולם, המגמה הכללית היא של שיפור עקבי והתקדמות במגוון היבטים.

המחשת יכולות מודל GPT Image 1.5

זמינות ב-API עבור מפתחים וארגונים

GPT Image 1.5 זמין גם ב-API של OpenAI, כאשר הוא מספק את כל אותם שיפורים שזמינים ב-ChatGPT. המודל חזק יותר בשימור תמונות ובעריכה בהשוואה ל-GPT Image 1, והוא מציג שימור עקבי יותר של לוגואים ממותגים ואלמנטים ויזואליים מרכזיים לאורך תהליכי עריכה. תכונות אלה הופכות אותו למתאים במיוחד לעבודה שיווקית ומיתוגית כמו יצירת גרפיקה ולוגואים, וגם עבור צוותי מסחר אלקטרוני שמייצרים קטלוגים שלמים של תמונות מוצרים מתמונת מקור אחת.

יתרון נוסף הוא שעלות התשומות והתפוקות של תמונות ב-GPT Image 1.5 זולה בעשרים אחוז בהשוואה ל-GPT Image 1, כך שניתן לייצר ולשפר יותר תמונות באותו תקציב. ארגונים וסטארטאפים בתעשיות שונות, כולל כלי עבודה יצירתיים, מסחר אלקטרוני, תוכנות שיווק ועוד, כבר משתמשים ב-GPT Image 1.5 למגוון צרכים עסקיים.

מפתחים יכולים לנסות את המודל החדש ב-OpenAI Playground, לעיין בגלריית הדוגמאות, או לקרוא את מדריך ההנחיות לקבלת השראה ורעיונות ליישומים. השילוב של שיפורים טכנולוגיים, ירידת מחירים וחוויית משתמש משופרת הופך את GPT Image 1.5 לכלי רב עוצמה עבור כל מי שמעוניין ליצור תוכן ויזואלי באיכות גבוהה, בין אם למטרות אישיות ובין אם למטרות מקצועיות.

לסיכום

 מודל התמונות החדש של ChatGPT מביא קפיצה משמעותית ביכולות יצירת ועריכת תמונות של עם שילוב של דיוק גבוה, מהירות עבודה משופרת וחוויית משתמש ייעודית שמקרבת את הכלי לשימוש יומיומי מקצועי. המודל מאפשר לערוך ולשנות תמונות בצורה נקודתית מבלי לפגוע במהות הוויזואלית שלהן, מצטיין ברינדור טקסט ובקומפוזיציות מורכבות, ומציע יתרון כלכלי בזכות עלות נמוכה יותר וזמינות מלאה גם ב-API. יחד, השיפורים הטכנולוגיים והעיצוביים מציבים את GPT Image 1.5 כאחד הכלים המתקדמים והפרקטיים ביותר כיום ליצירת תוכן ויזואלי איכותי, הן ליוצרים פרטיים והן לארגונים.

אולי יעניין אותך גם:

השאירו פרטים לחזרה