
יצירת וידאו ב-Sora 2: במה הוא טוב ומתי כדאי לבחור בכלי אחר?
כמעט חודש מאז שחברת Open AI השיקה את Sora 2, ונראה שהוא כבר את האינטרנט. הכלי הזה יוצר וידאו מתיאור
בשבוע האחרון התעמקתי ב”ננו בננה”, מודל בינה מלאכותית שזמין ב-LM Arena, Gemini ובפלטפורמות נוספות.
זה לא עוד מודל שמייצר תמונות מאפס, אלא מודל שמתמחה בעריכה מדויקת של תמונות קיימות לפי הוראות טקסט. עד לפני כמה ימים לא היה ברור מי עומד מאחורי המודל הזה, היו שמועות שהוא קשור לגוגל אבל לא היה שם רשמי מאחוריו. לאחרונה המודל נכנס לשימוש רישמי בכלים של גוגל ובדקתי אותו לעומק כדי לראות אם הוא באמת עומד בהבטחות. ספויילר: התוצאות היו מרשימות.
הבסיס לכל מודל כזה הוא שימוש ברשתות נוירונים, מעין מערכת מחשב שמזהה דפוסים בתמונות, קצת כמו שהמוח שלנו מבין מה הוא רואה. כשמעלים תמונה וכותבים מה לשנות, כמו להחליף צבע של חולצה, הוא מפרק את התמונה לפיקסלים, שהם הנקודות הקטנות שמרכיבות אותה, ומשנה רק את מה שצריך. הבעיה העיקרית עם כלים כאלה היום היא שלמרות שהתוצאה שהם נותנים טובה,הם עדיין עושים שינויים לא נחוצים בתמונה כמו עיוותים קלים בפרצופים, שינויים קומפוזיציה וכו’.
דוגמאות לעריכות שנוצרו במודל. החלפת תאורה או סגנון עיצובי
Nano Banana מאפשר לערוך תמונות בדרכים שפעם דרשו שעות של עבודה בתוכנות מקצועיות. אפשר להסיר חפצים לא רצויים, להוסיף אלמנטים שמשתלבים בסביבה, או לשנות את האווירה, כמו להפוך תמונה של צהריים ללילה עם תאורה רכה. וכל זה באמצעות הקלדת בקשה בטקסט פשוט.
דוגמאות לעריכות שנוצרו במודל. צביעת תמונות ויצירת שינויים
דוגמאות לעריכות שנוצרו במודל. שינוי מזג אויר או שעה ביום
ב-LM Arena, ננו בננה זמין בחינם להתנסות, מה שהופך אותו לנגיש לכולם. יש מגבלה על מספר הבקשות היומיות כדי לא להעמיס על השרתים, אבל זה מספיק כדי לבדוק אותו לעומק.
בנוסף הכלי זמין גם בתוך Gemini וגם בתוך Google AI Studio.
נכון לעכשיו, ננו בננה נחשב לאחד המודלים המתקדמים ביותר בעולם לעריכת תמונות באמצעות בינה מלאכותית. המערכת מאפשרת רמת שליטה גבוהה מאוד בפרטים הקטנים, כך שניתן לבצע שינויים מורכבים בקלות יחסית, מבלי לאבד את האותנטיות והמראה הטבעי של התמונה.
בבדיקות שביצעתי, ברוב הבקשות קיבלתי תוצאות מדויקות ומרשימות במיוחד תוך שניות ספורות, החל מהוספה או הסרה של אובייקטים, דרך שיפור איכות התמונה ורמת הפירוט, ועד ליצירת וריאציות חדשות לחלוטין שמרגישות מציאותיות.

כמעט חודש מאז שחברת Open AI השיקה את Sora 2, ונראה שהוא כבר את האינטרנט. הכלי הזה יוצר וידאו מתיאור

חברת OpenAI חשפה הערב (שלישי) את Sora 2, גרסה משודרגת של המודל שיוצר סרטונים מתיאורים כתובים, יחד עם אפליקציה חדשה

העולם הדיגיטלי צועד בקצב מסחרר. אם פעם טקסטים ותמונות הספיקו כדי לספר סיפור, היום הציפייה היא לווידאו. וידאו אינו עוד
השאירו פרטים לחזרה