ללמד את המחשב לראות כמו עין אנושית
התמונה משתנה? רשתות נוירונים מלאכותיות יתקשו לפענח אותה
בינה מלאכותית היא ענף במדעי המחשב שחוקר את היכולת לתכנת מחשבים כך שיפעלו כמו המוח האנושי. בבסיסה עומדת למידה עמוקה (Deep Learning) –אלגוריתמים שמאפשרים למערכות ממוחשבות ללמוד מתוך דוגמאות והתנסויות קודמות, וכך לבצע מגוון משימות חישוביות.
פרופ‘ יאיר וייס מבית הספר להנדסה ומדעי המחשב באוניברסיטה העברית חוקר בינה מלאכותית, למידה עמוקה וראייה ממוחשבת (ענף שחוקר את האופן שבו מחשבים מנתחים תמונות כדי לחלץ מהן מידע חזותי ולפרש אותו). אחד הנושאים העיקריים שהוא מתמקד בהם – שמשלב את שלושת התחומים הללו – הוא רשתות נוירונים (תאי עצב) מלאכותיות. מדובר במודל מתמטי חישובי (אלגוריתמים) שפותח בהשראת רשתות הנוירונים שקיימות במוח האנושי. רשתות הנוירונים המלאכותיות מורכבות מיחידות מידע (קלט ופלט) רבות המקושרות זו לזו באמצעות מספרים ומעבירות נתונים מאחת לשנייה, בהתבסס על למידה עמוקה. כל מספר מבטא את עוצמת הקשר ביניהן, ובסופו של דבר הקישוריות יוצרת אינטליגנציה. כך, רשתות אלו יכולות לשמש בכל יישומי המחשב כמעט. למשל, זיהוי עצמים בתמונות וסרטונים, פענוח הדמיות רפואיות, רובוטיקה ותחבורה אוטונומית.

בעשור האחרון נבנו רשתות נוירונים מלאכותיות שהביאו לפריצות דרך בתחומים רבים ובהם הראייה הממוחשבת. לדברי פרופ‘ וייס, “למידה עמוקה – שרשתות הנוירונים מבוססות עליה – וראייה ממוחשבת הולכות יד ביד. במחקרנו אנחנו מנסים ללמד מחשבים לראות בדומה לעין האנושית. אנחנו נותנים להם דוגמאות רבות (קלט) וכך, באמצעות רשתות הנוירונים, הם אמורים ללמוד לראות – למשל לזהות פרטים בתמונות ולהבדיל ביניהם. באמצעות הדוגמאות אנחנו למעשה משנים את המספרים שמקשרים בין הנוירונים, עד שאנחנו מקבלים את התוצאה הרצויה. כלומר את הפלט המדויק. למשל, אנחנו מעלים למחשב תמונות רבות של כלבים וחתולים, זה מפעיל נוירונים שמזהים אותם, והם אמורים להחליט מה זה כלב ומה זה חתול“.
“עם זאת“, מציין פרופ‘ וייס, “הרשתות הללו עדיין לא מספיק מפותחות כמו המוח האנושי. הן יכולות לעשות טעויות חישוב משמעותיות רק בשל שינויים קטנים בדוגמאות. כך למשל, אם נזיז תמונה של כלב בפיקסל אחד, המחשב עשוי לזהות אותו כחיה אחרת, מה שכמובן לא יקרה למערכת הראייה האנושית; בן אדם יפענח תמונה במדויק גם אם היא תשתנה מעט“.
מה השאלה?
כיצד התפתחו הקדנצות – סימני הפיסוק של היצירות המוזיקליות – במהלך המאה ה-18?
לכן, פרופ‘ וייס וצוותו מתמקדים בפיתוח רשתות הנוירונים, כך שיוכלו להכליל טוב יותר ולדייק בזיהוי. במחקרם האחרון – שזכה במענק מחקר מהקרן הלאומית למדע – ביקשו המדענים לבדוק מדוע הן נכשלות וכיצד יעבדו טוב יותר. הם הטמיעו אותן במחשבים והראו להם תמונות, למשל של בעלי חיים. תחילה הן זיהו את תוכן התמונות במדויק, אך כאשר החוקרים ערכו בהן שינויים קלים, למשל הזיזו אותן בפיקסל ימינה או הגדילו אותן מעט, רשתות הנוירונים ‘התבלבלו‘. כך למשל, הן זיהו חמוס כחתול או אריה ים.
לאחר מכן, ערכו החוקרים אנליזה מתמטית של הנתונים וגילו שהסיבה לכישלונות הרשתות היא משפט הדגימה; משפט מתמטי זה מסביר בין השאר את היחס בין תמונות לבין דגימת הפיקסלים שבהן; כמה מידע בפיקסלים שנדגמו נדרש לשחזור תמונה. החוקרים מצאו שהרשתות לא מקיימות את משפט הדגימה בתהליך דגימת הפיקסלים, ולכן עושות טעויות בזיהוי התמונה כאשר היא משתנה מעט. כיום הם מנסים לתקן זאת – ללמד את הרשתות לקיים את משפט הדגימה בתוך זמן חישוב קצר.
אנחנו מנסים ללמד מחשבים לראות בדומה לעין האנושית. אנחנו נותנים להם דוגמאות רבות (קלט) וכך, באמצעות רשתות הנוירונים, הם אמורים ללמוד לראות – למשל לזהות פרטים בתמונות ולהבדיל ביניהם

פרופ' יאיר וייס
אומר פרופ‘ וייס: “הבנו שרשתות הנוירונים המלאכותיות עדיין לא עמידות בפני שינויים קטנים. כאשר מוציאים אותן מאזור הנוחות, הן נכשלות. לכן בשלב זה לא בטוח שניתן לסמוך עליהן ביישומי מחשב שונים. לדוגמה, אם מצלמה ברכב אוטונומי שמתבסס על אחת הרשתות שחקרנו תבצע שינוי סביר – כמו הקטנת או הגדלת הזום – זה יגרום לרכב להתבלבל. כך למשל, הוא לא יזהה תמרורים או שיזהה אותם רק בנקודת זמן מסוימת. לכן המטרה שלנו כיום היא להבין כיצד ניתן לפתח ולקדם את הרשתות כך שיפענחו מידע חזותי במדויק, בדומה לעין אנושית“.
החיים עצמם:
יאיר וייס הוא פרופ‘ למדעי המחשב, גר בירושלים, נשוי ואב לארבעה ילדים (בני 10, 15, 17.5 ו-20). בנוסף להיותו חוקר, הוא יועץ לחברת הטכנולוגיה מובילאיי ובעלים של קבוצת כדורגל – הפועל (קטמון) ירושלים.