
Kling O1 המודל המולטימודאלי המאוחד הראשון בעולם ליצירת וידאו עם בינה מלאכותית
מודל ה-Kling O1 מסמן נקודת מפנה משמעותית בעולם הבינה המלאכותית היוצרת, במיוחד בתחום יצירת ועריכת הווידאו. הוא מוצג כמודל הווידאו
בשבוע האחרון התעמקתי ב”ננו בננה”, מודל בינה מלאכותית שזמין ב-LM Arena, Gemini ובפלטפורמות נוספות.
זה לא עוד מודל שמייצר תמונות מאפס, אלא מודל שמתמחה בעריכה מדויקת של תמונות קיימות לפי הוראות טקסט. עד לפני כמה ימים לא היה ברור מי עומד מאחורי המודל הזה, היו שמועות שהוא קשור לגוגל אבל לא היה שם רשמי מאחוריו. לאחרונה המודל נכנס לשימוש רישמי בכלים של גוגל ובדקתי אותו לעומק כדי לראות אם הוא באמת עומד בהבטחות. ספויילר: התוצאות היו מרשימות.
הבסיס לכל מודל כזה הוא שימוש ברשתות נוירונים, מעין מערכת מחשב שמזהה דפוסים בתמונות, קצת כמו שהמוח שלנו מבין מה הוא רואה. כשמעלים תמונה וכותבים מה לשנות, כמו להחליף צבע של חולצה, הוא מפרק את התמונה לפיקסלים, שהם הנקודות הקטנות שמרכיבות אותה, ומשנה רק את מה שצריך. הבעיה העיקרית עם כלים כאלה היום היא שלמרות שהתוצאה שהם נותנים טובה,הם עדיין עושים שינויים לא נחוצים בתמונה כמו עיוותים קלים בפרצופים, שינויים קומפוזיציה וכו’.
דוגמאות לעריכות שנוצרו במודל. החלפת תאורה או סגנון עיצובי
Nano Banana מאפשר לערוך תמונות בדרכים שפעם דרשו שעות של עבודה בתוכנות מקצועיות. אפשר להסיר חפצים לא רצויים, להוסיף אלמנטים שמשתלבים בסביבה, או לשנות את האווירה, כמו להפוך תמונה של צהריים ללילה עם תאורה רכה. וכל זה באמצעות הקלדת בקשה בטקסט פשוט.
דוגמאות לעריכות שנוצרו במודל. צביעת תמונות ויצירת שינויים
דוגמאות לעריכות שנוצרו במודל. שינוי מזג אויר או שעה ביום
ב-LM Arena, ננו בננה זמין בחינם להתנסות, מה שהופך אותו לנגיש לכולם. יש מגבלה על מספר הבקשות היומיות כדי לא להעמיס על השרתים, אבל זה מספיק כדי לבדוק אותו לעומק.
בנוסף הכלי זמין גם בתוך Gemini וגם בתוך Google AI Studio.
נכון לעכשיו, ננו בננה נחשב לאחד המודלים המתקדמים ביותר בעולם לעריכת תמונות באמצעות בינה מלאכותית. המערכת מאפשרת רמת שליטה גבוהה מאוד בפרטים הקטנים, כך שניתן לבצע שינויים מורכבים בקלות יחסית, מבלי לאבד את האותנטיות והמראה הטבעי של התמונה.
בבדיקות שביצעתי, ברוב הבקשות קיבלתי תוצאות מדויקות ומרשימות במיוחד תוך שניות ספורות, החל מהוספה או הסרה של אובייקטים, דרך שיפור איכות התמונה ורמת הפירוט, ועד ליצירת וריאציות חדשות לחלוטין שמרגישות מציאותיות.

מודל ה-Kling O1 מסמן נקודת מפנה משמעותית בעולם הבינה המלאכותית היוצרת, במיוחד בתחום יצירת ועריכת הווידאו. הוא מוצג כמודל הווידאו

בשלהי שנת 2025, עולם הטכנולוגיה עד להתפתחות דרמטית שמעידה על שינוי מהותי במאזן הכוחות בתעשיית הבינה המלאכותית. גוגל, שלאורך שלוש

כמעט חודש מאז שחברת Open AI השיקה את Sora 2, ונראה שהוא כבר את האינטרנט. הכלי הזה יוצר וידאו מתיאור
השאירו פרטים לחזרה