איך למדתי להפסיק לדאוג והתחלתי לאהוב את ה-AI שרוצה לקחת לי את הג'וב

גם אני התלהבתי מהדביבונים החמודים שציירה Dalle-2, אבל בתור מי שרוב פרנסתה ב-15 השנים האחרונות מגיעה מעולם העיצוב והאיור היה לי קשה שלא לחשוש שהבוטית המוכשרת הזאת שמה עין על הקריירה שלי. אבל אז הבנתי איפה אנחנו עדיין מנצחים

בשבוע האחרון הרשת סערה בגלל דביבון בחליפת חלל. וזה לא קרה בגלל סרט חדש של מארוול או ניסוי חדשני של NASA, אלא בגלל שהתמונה צוירה ביד ה"אמן" הרובוטית של Dalle-2, תוכנת בינה מלאכותית מתקדמת שפיתחה חברת OpenAI. מה התוכנה עושה? המשתמש מזין תיאור של סצינה שהוא מעוניין לראות, ו-Dalle-2 יוצרת תמונה מתאימה יש מאין - ואפילו מספקת כמה גרסאות כדי שהוא יוכל לבחור מתוכן. 

אין ספק שמדובר בהישג טכני מרהיב, אבל אותי הוא עניין מסיבה אחרת. בתור מי שרוב פרנסתה ב-15 השנים האחרונות מגיעה מעולם העיצוב והאיור קשה לי שלא לקחת באופן אישי את נבואות הזעם הוויראליות על כך ש-Dalle-2 מבשרת על מות האמנות, והיא ודאי תשלח מעצבים ומאיירים אנושיים שכמותי אל בתי האבות או לשכת האבטלה.

אז לא יכולתי שלא לתהות - האם באמת מדובר בתחילת הסוף? האם בקרוב אצא לפנסיה מוקדמת בעוד שהבוטים יאיירו במקומי? יצאתי לבדוק עם מומחים בתחום מה באמת דאלי-2 וכלים דומים מסוגלים ליצור - והאם באמת בינה מלאכותית מסוגלת לאייר, במקומי, כבשים חשמליות.

“בראש ובראשונה, Dalle-2 עדיין לא זמין לשימוש נרחב. הוא עדיין בשלבי מחקר. מי שרוצה יכול להצטרף לרשימת המתנה, אבל כרגע המפתחים שלו אומרים שהם עוד מנסים להבין מה המגבלות הטכניות והאתיות שלו", אומרת שי סגל, מרצה בשנקר ומומחית לעיצוב XR (מציאות מורחבת). "כרגע המודל לא מתוכנן לתמוך ביצירה של תוכן אלים, מיני או פוליטי, וגם לא בתמונות פוטוריאליסטיות של אנשים אמיתיים. מהבחינה הזו - הוא מוגבל, ויש צנזורה".

מאיפה הגיעו המודלים האלה, ולמה הם עלו לכותרות בשנים האחרונות?

"לבינה המלאכותית יש היסטוריה ארוכה, אבל העשור האחרון היה מכריע", היא אומרת. "מה שמעניין זה שלפני עשור הדעה המקובלת היתה שהדבר האחרון ש-AI ישפיע עליו יהיה עבודות יצירתיות. עכשיו אנחנו מבינים שלא. חרב דמוקלס דווקא תלויה לכאורה מעל הראש של העובדים היצירתיים".

אחד המודלים המרשימים בלמידת מכונה של השנים האחרונות הוא GPT-3, שהציגה חברת OpenAI ב-2020. "בתיאור גס, את GPT-3 אפשר 'להאכיל' בכמה מילים או משפטים והוא כבר ממשיך בעצמו ומנבא את מאות המילים הבאות, ויוצר טקסטים 'אנושיים'", מסבירה סגל. 

DALL-E, הדור הקודם של הלהיט החדש, מתבסס על GPT-3, אבל המודל משלב בין מידע טקסטואלי לוויזואלי, כך שהוא יכול ליצור תמונות על בסיס תיאור קצר.

DALL-E 2, האיום-ריגוש הנוכחי שיצא בתחילת אפריל האחרון, שנה אחרי המקור, מרים שוב את הרף. "הרזולוציה של התמונות גבוהה פי 4 והדימויים באמת מרשימים. המודל מאפשר גם לערוך תמונה קיימת וליצור וריאציות סגנוניות. ואז לדוגמה הנחיה כמו 'מונה ליזה משחקת שש בש עם קורגי' היא לא מופרכת, ואפשר להוציא אותה בכמה גרסאות שונות. וכנראה שזה לא יראה רע."

חובבת הטכנולוגיה שבי מתלהבת מההישג מאוד, אבל המעצבת קצת מוטרדת. יש לנו ממה לדאוג?

"כש-DALL-E 2 יהפוך לזמין לשימוש מסחרי, יהיו מצד אחד הרבה הזדמנויות מעניינות, אבל כנראה שגם נזקים. למה שגוף תקשורת ישכור מאיירים מקצועיים כשיש מודל שיכול להגיע לתוצאות מרשימות בזמן קצר כל כך? למה צריך צלמים כשיש מערכת שמייצרת פוטוריאליזם? למה צריך מעצבים כשיש תוכנה שלא דורשת כמעט שום ידע מוקדם? השאלות האלה רלוונטיות, ולמרות ש-OpenAI כותבים בגלוי שהתקווה שלהם - וצריך להדגיש, התקווה - היא שדאלי יעצים את הביטוי היצירתי של אנשים. אין ספק שחלק מהאנשים שעוסקים בתחום עלולים להיפגע באופן אנוש. 

"אבל כדאי בכל זאת לצנן ולהרגיע, ולנסות להסתכל על זה כמו עוד שלב באבולוציה הארוכה של התחום. הגרסה הנוכחית של מודל כמו דאלי לא באמת מהווה איום על המקצוע כולו. מספיק להרים את הראש, להסתכל סביב, על האינטרנט, על הרחוב ועל כל סביבה פיזית או וירטואלית שאנחנו בתוכה. יצירת דימויים או אילוסטרציות היא חלק מתחום גדול והיסטורי, ואי אפשר לצמצם תרבות חזותית שלמה לנישה אחת.

"תחום העיצוב שרד מהפכות של ייצור, צריכה, אוטומציה וכו'. הטכנולוגיה היא כלי. עיצוב AI הוא כלי. כמו שקוד ותוכנות שונות הם כלים. כשדאלי ודומיו יהיו שמישים וללא מגבלות מהותיות, זה יוכל לשכלל הרבה מאוד מעצבים שלא חוששים מטכנולוגיה מצד אחד, ולא שוכחים היסטוריה שלמה וארוכה של עיצוב ואמנות מצד שני".

אני מניחה שאם נסתכל לרגע מעבר לחידוש והיכולות המדהימות של דאלי, יש לו גם לא מעט מגבלות ובעיות. מה למשל יכול להציב בעיה לדעתך?

"יש הרבה מגבלות; הקושי לכוון את הפלט לצרכים מאוד ספציפיים, הבנה שטחית של שפה ובעיקר לא מעט פגמים בתוצרים. את חלקם אפשר ממש לראות בעין בלתי מזוינת, ואת חלקם יראו אנשים עם גישה לעיצוב, שיוכלו להבחין בבעיות טכניות כמו צל או קומפוזיציה, אבל גם בפערים עמוקים ב'פרשנות' של הטקסט. מחשב יכול לייצר דימוי, אבל למחשב אין כרגע את היכולת שיש לאמנים לתת כמה רובדים של משמעות ביצירה. כמובן שדאלי נמצא בשיפור מתמיד, זאת המהות שלו, אבל זה לא יקרה ברגע. ככל שנכנסים יותר פנימה מבינים שזה רק קצה הבעיות. תנסי לדמיין רגע מה המשמעות של חוסר יכולת להבחין ב'תוצר איכותי', ואיך המרחבים שלנו עלולים להתכסות תוך כמה שנים בתכנים שלא עברו סינון מקצועי. 

"מעל הכל, אחת השאלות הקשות ביותר שצריכה להיות כל הזמן בראש היא מה יהיה על האמנות כשנייתר את האדם שעומד מאחוריה. הרי אחד הדברים שמעניקים הכי הרבה ערך לאמנות היא היוצרים עצמם. אז מעבר לשאלת הפרנסה והתוכן הפוגעני, מה יהיה העתיד של שהאמנות שאנחנו צורכים? זה חשבון נפש שצריך להיעשות על ידי כולם, כל מי שאכפת לו מהעתיד ומבני האדם, ולא רק על ידי מי שעוסקים בתחום. בסופו של דבר, צריכים להתייחס למודלים כאלה בחשדנות מסויימת - זו לא בשורה דיסטופית. למודלים עצמם אין כשרון יצירתי ואינטרקציה חופשית עם מחשב - ובינתיים, זה היכולות שלנו, כמעצבים, נותנות יתרון בלתי מבוטל על פני כל בינה מלאכותית".

אחרי ששי הרגיעה אותי וביטלתי את התוכניות שלי לפנסיה הקרבה, יצאתי לבדוק - מה מודלים של בינה מלאכותית, שזמינים לציבור, יכולים לעשות כרגע? ומה איכות הדימויים שהם מייצרים, לעומת יצירה אנושית?

לצורך הניסוי חברתי לדורון אדלר, מתכנת שעוסק בשנים האחרונות בלמידת מכונה ויצירה בעזרת קוד. הוא לא הגיע לתחום מרקע עיצובי - למעשה, הוא הגיע מהצד השני לחלוטין - הצד שלא יכול לדמיין תמונות בראש. "רוב האנשים יכולים לדמיין בראש איך נראים דברים - בין אם מדובר בקוביה או בפנים של ההורים שלהם. מגיל צעיר אני לא מסוגל לעשות את זה, ורק כשהתבגרתי גיליתי שיש לזה שם, 'אפנטזיה' - חוסר יכולת מוחלט לייצר דימויים בכוח המחשבה".

בתור מישהו שכל החיים שלו לא הצליח לצייר, לפסל, ובאופן כללי חסר חוש אסתטי - השימוש בקוד ובינה מלאכותית ליצירת תמונות ודימויים היה גילוי משמעותי מבחינתי". כיום, דורון עובד עם כמה מודלים ומצליח להוציא מהם יצירות מרהיבות שהוא מציג בדף הפייסבוק שלו - בין אם מדובר בחייזרים ויקטוריאניים או חבובות שלא היו קיימות מעולם. לצורך הניסוי של בדיקת המגבלות של המודלים האלה השתמשנו באחד המודלים המתקדמים ביותר שניתן להשתמש בהם באופן ישיר- Midjourney, והצבנו אותו מול איורים שאיירתי בעבר.

התחלנו עם ציור פשוט של גולגולת-ירח מעל המים, בהשראת השיר The Killing Moon של אקו והבאנימן. המודל הציג 4 אפשרויות. שלוש מהן לא היו דומות מספיק לגולגולות או קוהרנטיות דיין. הרביעית לעומת זאת היתה מרהיבה, עם עומק דרמטי ותאורה יוצאת מן הכלל. האמת, שקצת קינאתי ביכולת של המודל ליצור דימוי כל כך עשיר מול איור הקו הפשוט שלי.

אבל מה קורה כשנותנים לו "לחשוב" לבד איך לייצג דימוי? 

פה התחילה הבעיה. המודל, שלא מבין דיו את העניין של קונטקסט, כפי שהסבירה שי - "נבהל" מהמילה Killing בשיר וסירב לשתף פעולה. 

עברנו לניסיון הבא - איור בהשראת השיר Space Oddity של דיוויד בואי, של אסטרונאוט עזוב בחלל. התוצאות פה היו מעניינות, אך בניגוד לניסוי הקודם, נחשפנו לאחת הבעיות של המודלים האלה - היכולת להבין איפה מתחיל ונגמר ייצוג. מבט יסודי בתמונות שהוא יצר, שמציגות מבחר דיוויד-בואים בחלל ואסטרונאוטים אבודים, מגלה שהם פזורי איברים, ובאופן כללי לא נראים כאילו משהו עם מחשבה אנושית והגיונית מאחוריה.

בניסוי הבא ניסינו איור בעפרונות צבעוניים של פרחים בסגנון של אמנות עממית אוקראינית, מול יצירות של המודל עצמו. הייצוגים שהוא סיפק היו מרהיבים מבחינת צבעונית, ואכן הצליחו לחקות את הטקסטורה של העפרונות הצבעוניים - אבל שוב, בכל תמונה היה משהו אחד לפחות שלא היה במקום - בין אם מדובר בפרחים שנבלעים זה לתוך זה או עלי כותרת שלא מחוברים לשום דבר אחר. 

בניסוי האחרון שיסיתי ב-Midjourney המסכן דמות אנושית לחלוטין, בסביבה צבעונית ומלאה בפרטים. פה, המודל התחיל לזייף. כל תוצאה שהוא ייצא לנו הייתה מטרידה וחייזרית, וברוב המקרים גם לא מספיק דומה לבת אנוש. המודל, כאמור, מגיע עם מגבלות - והמגבלות האלה מורגשות במיוחד כאשר מדובר בבני אנוש.

לסיכום, אין ספק שמדובר בהתקדמות טכנולוגית מדהימה, וכלי שיכול לשמש בעתיד מאיירים ומעצבים, וגם לסייע בלימודים. אבל הדיון אם הוא "יכול" להחליף מאיירים, מעצבים ואמנים בכלל לא רלוונטי - אחרי הכל, העבודה שלנו היא לא בהכרח תהליך היצירה עצמה אלא מה שמאחוריה - בין אם מדובר בחשיבה על קונספט, אינטראקציה עם לקוחות, התאמה להקשר והרעיון הנכון. למודלים אין את היכולת הזו, וספק אם תהיה להם בעתיד הנראה לעין. כל עוד שבינה מלאכותית מסוגלת רק ליצור תמונות אבל לא לחשוב עליהן בעצמה בהקשר המתאים היא לא יותר מביצועיסט ממש טוב, והופכת לכלי ותו לא. האם המעצבים שבינינו צריכים להניח את העפרון, ולפרוש בשיא? כנראה שלא. אבל יכול להיות שבקרוב החיים שלכם יהיו הרבה יותר קלים.