אוניברסיטת תל אביב|בית הספר למדעי המחשב ע”ש בלווטניק
“אני מניחה שלכל אחד יש את השריטה שלו”, אומרת פרופ’ מילוא, “והשריטה שלי היא ריצה. אני מכורה לריצה. אני רצה 10 ק”מ מדי בוקר”.
למי מאיתנו זה לא קרה? אנחנו מזמינים ארוחת ערב ממסעדה שזוכה לדירוג גבוה מאוד, ומתאכזבים לגלות שהאוכל מתובל מדי לטעמנו, שהמנות קטנות מדי עבורנו או ששילוב הטעמים נועז מדי לחכנו. האם ההמון שסמכנו עליו טעה? לאו דווקא. ייתכן שבשביל אנשים אחרים, ארוחת הערב הזאת מושלמת – אבל היא לא מה שחיפשנו כשחיפשנו המלצה. פרופ’ טובה מילוא מבית הספר למדעי המחשב ע”ש בלווטניק באוניברסיטת תל אביב, אשר מכהנת כדיקאנית הפקולטה למדעים מדויקים, חוקרת בסיסי נתונים – ובמסגרת זו, מנסה לכרות מידע מההמון.
“אני חוקרת את תחום בסיסי הנתונים, ובפרט את ה’ביג דאטה’ המפורסם, והחלק שלו שנחבא במוחו של ההמון”, אומרת פרופ’ מילוא. “המטרה העיקרית היא לאפשר איסוף נבון של מידע מההמון, בכל מיני תחומים ולכל מיני צרכים. אלא שאז נשאלת השאלה: מי זה ההמון? מי רלוונטי לחיפוש מסוים? דוגמה שאני אוהבת לתת: אדם מחפש מלון. אם הוא ‘נסיך מפונק’ הוא מעדיף מלון חמישה כוכבים, שיהיה נקי, שהחדר יבריק. אדם אחר יסתפק במלון שלושה כוכבים – כל עוד המלון יהיה במרכז העיר. ואדם שלישי נוסע לעסקים ומעוניין אך ורק במחיר החדר. שלושתם יתארחו באותו בית מלון וידרגו אותו אחרת לגמרי. חוכמת ההמונים? ההמון המוני מדי. השאלה היא איך אנחנו מגדירים את ההמון הרלוונטי – ובשלב השני איך מוצאים אותו בים הדאטה הזמין לנו”. כיום, הכלים הקיימים לחיפוש אחר חוכמת ההמונים הנכספת הם כלים מוגבלים במידה מסוימת, מכיוון שההמון הרלוונטי מוגדר בהם באופן קשיח.
“לאלגוריתמים שעליהם מבוססים הכלים האלה, יש הגדרות מסוימות מאוד לשאלות כמו ‘מה זה המון טוב’ או ‘מי דומה לי’”, מסבירה פרופ’ מילוא. “התובנה העקרונית של המחקר שלנו היא שלא כדאי להשתמש באפיון קבוע שהוגדר מראש, אלא לערוך חיפוש תלוי-משימה. למשל בדוגמת המלונות: אם על פי רוב אני מחפשת אנשים שדומים לי בכול, במקרה הספציפי הזה דרושים לי אנשים שדומים לי רק בזווית מאוד מסוימת – אנשים שנהנים מחופשות כפי שאני נהנית מחופשות ומחפשים את מה שאני מחפשת כשאני יוצאת לחופשה. הדעה שלהם רלוונטית יותר לחיפוש שלי מדעות של המוני משתמשים אחרים, גם אם הם דומים לי יותר בהיבטים אחרים כמו השכלה, שייכות חברתית או אזור מגורים”.
באמצעות מענק המחקר מהקרן הלאומית למדע, מפתחים פרופ’ מילוא ועמיתיה כלים שיעזרו למשתמשים להגדיר בקלות מיהו ההמון שרלוונטי למשימה שלהם.
“אידיאלית, אנחנו רוצים שהמערכת תיתן לנו כלים נוחים להגדיר מהו סוג ההמון שרלוונטי למשימה מסויימת ותגזור בעצמה את האלגוריתמים, כלומר הדרכים הנכונות והיעילות, למציאת אותו המון. השאיפה היא שהמערכת תדע לתרגם את ההגדרות שלנו לתוכנית פעולה אוטומטית לאיסוף המידע הדרוש, ושכל העבודה הקשה תהיה סמויה מעיני המשתמש. בעצם, הרעיון הוא לתכנת מערכת גנרית, שתאפשר לכל משתמש – פרטי וציבורי – לחפש את ההמון הרלוונטי עבורו לכל צורך: מהמלצה צרכנית, דרך הסיכוי להידבק במחלה וכלה במשרד פרסום שרוצה לדעת איפה כדאי להשקיע את המשאבים. הצרכים מגוונים לפחות כמו ה’המון’”.