
Veo 2 של גוגל: מחולל הווידאו המתקדם בעולם – עכשיו בחינם
גוגל ממשיכה להרחיב את הגישה לכלי הבינה המלאכותית המתקדמים שלה. לאחר ההשקה של Gemini 2.5 – המודל החכם ביותר של
עולם הטכנולוגיה רועש וגועש בעקבות ההכרזה האחרונה של OpenAI: סאם אלטמן, מנכ”ל החברה, הכריז על תוספת משמעותית ליכולות הבינה המלאכותית של ChatGPT – אפשרות ליצירת תמונות ישירות בתוך הצ’אט, באמצעות מודל ה-GPT-4o החדש. ללא צורך בכלים חיצוניים, וללא מעבר לממשק אחר, ניתן כעת ליצור ולערוך תמונות בצורה אינטואיטיבית וחלקה.
סקירת הוידאו המלאה של GPT החדש
* רינדור טקסט מדויק – יכולת משמעותית המאפשרת לשלב טקסט ברור בתוך תמונות, תכונה שהייתה מאתגרת למודל הישן שלהם Dall-E
* דיוק גבוה בפרטים – המודל מסוגל לעבד בין 15 ל-20 אלמנטים שונים בתמונה אחת, תוך שמירה על קשרים נכונים ביניהם
* אפשרות העלאת תמונות לצ’אט ועריכה באמצעות בקשת טקסט פשוטה
* קנבס עריכת תמונות מתקדמת ע”י בחירת אזורים בתמונה (אפשרית רק לתמונות שנוצרו בתוך בצ’אט)
* שמירה על עקביות – היכולת לשמור על דמויות וסגנונות לאורך מספר תמונות, מה שמאפשר יצירה מתמשכת ללא שינויים אקראיים
* תמיכה בצבעים מדויקים – ניתן להשתמש בקודים כמו Hex ליצירת צבעים מדויקים יותר
* רקע שקוף – כלי משמעותי במיוחד למעצבים גרפיים ולמשתמשים הזקוקים לשקיפות ברקעים
פונקציית סימון איזורים ספציפית בממשק קנבס חדש ב-Chat GPT
אחת הדאגות המרכזיות בעולם הבינה המלאכותית היא זיהוי תוכן מזויף. כדי לתת מענה לכך, OpenAI שילבה במערכת סימון אוטומטי לכל תמונה שנוצרת עם מטא-דאטה של C2PA, המסייעת בזיהוי מקור התמונה. בנוסף, החברה פיתחה מערכת בינה מלאכותית ייחודית המסוגלת לזהות ולמנוע הפצה של תוכן מטעה או מזיק, תוך הקפדה על רגולציה מחמירה יותר בכל הנוגע לתמונות של אנשים אמיתיים.
1. מוודאים שמופעל מודל GPT-4o.
2. כותבים תיאור של התמונה שרוצים ליצור – או בוחרים את האפשרות “צור תמונה” בתפריט.
3. רוצים לערוך? העלו לצ’אט תמונה קיימת, בחרו איזור לעריכה והקלידו את השינויים הרצויים.
האפשרות החדשה זמינה באופן מיידי למשתמשי ChatGPT Plus, Pro ו-Team ללא הגבלה. משתמשים חינמיים יכולים ליהנות משלוש תמונות ביום, כאשר הרחבת האפשרויות למשתמשים נוספים (Enterprise ו-Edu) צפויה בקרוב. בנוסף, OpenAI כבר הודיעה כי בקרוב תאפשר גישה למפתחים דרך API ייעודי, כך שהטכנולוגיה תוכל להשתלב גם באפליקציות חיצוניות.
GPT-4o מסמן צעד נוסף במהפכה של יצירת תוכן חזותי, ומאפשר לכל אחד – ממעצבים ועד יוצרים חובבים – ליהנות מחוויית יצירה מתקדמת, מהירה ונגישה יותר מאי פעם.
גוגל ממשיכה להרחיב את הגישה לכלי הבינה המלאכותית המתקדמים שלה. לאחר ההשקה של Gemini 2.5 – המודל החכם ביותר של
לאחרונה הושקה גרסה 7 של מידג’רני ונראה שהיא לא רק יוצרת תמונות יותר טוב – היא באה לשנות את כל
OpenAI השיקה את שני המודלים החדשים והמתקדמים ביותר שלה לשימוש ציבורי, o3 ו-o4-mini, המציגים קפיצת מדרגה משמעותית ביכולות הבינה המלאכותית.
השאירו פרטים לחזרה