מודל הבינה המלאכותית החדש של MIT מנבא התנהגות אנושית עם דיוק מוזר

חוקרים ב-MIT ובאוניברסיטת וושינגטון פיתחו שיטה חדשה למודל של התנהגויות קבלת החלטות של סוכנים, תוך התחשבות באילוצים חישוביים. מודל זה, שיכול לחזות פעולות עתידיות מהתנהגות העבר, שואף לשפר את שיתוף הפעולה של מערכות בינה מלאכותית עם בני אדם על ידי הבנה והתאמה לחוסר ההיגיון האנושי ולתהליכי קבלת החלטות. קרדיט: twoday.co.il.com

ניתן להשתמש בטכניקה חדשה כדי לחזות את הפעולות של סוכנים אנושיים או AI שמתנהגים בצורה לא אופטימלית בזמן שהם עובדים לעבר מטרות לא ידועות.

MIT וחוקרים אחרים פיתחו מסגרת שמדגמנת התנהגות לא רציונלית או לא אופטימלית של סוכן אנושי או AI, בהתבסס על אילוצי החישוב שלהם. הטכניקה שלהם יכולה לעזור לחזות פעולות עתידיות של סוכן, למשל, במשחקי שח.

כדי לבנות מערכות בינה מלאכותית שיכולות לשתף פעולה ביעילות עם בני אדם, זה עוזר לקבל מודל טוב של התנהגות אנושית מלכתחילה. אבל בני אדם נוטים להתנהג בצורה לא אופטימלית בעת קבלת החלטות.

חוסר ההיגיון הזה, שקשה במיוחד למודל, מסתכם לרוב באילוצים חישוביים. אדם לא יכול להשקיע עשרות שנים במחשבה על הפתרון האידיאלי לבעיה אחת.

פיתוח גישת דוגמנות חדשה

חוקרים ב-MIT וה- אוניברסיטת וושינגטון פיתח דרך למודל התנהגות של סוכן, בין אם אנושי או מכונה, המסביר את האילוצים החישוביים הלא ידועים שעלולים להפריע ליכולות פתרון הבעיות של הסוכן.

המודל שלהם יכול להסיק אוטומטית אילוצים חישוביים של סוכן על ידי ראיית רק כמה עקבות של פעולות קודמות שלו. התוצאה, מה שנקרא "תקציב מסקנות", יכול לשמש כדי לחזות את ההתנהגות העתידית של אותו סוכן.

יישומים מעשיים ואימות מודל

במאמר חדש, החוקרים מדגימים כיצד ניתן להשתמש בשיטה שלהם כדי להסיק את יעדי הניווט של מישהו ממסלולים קודמים וכדי לחזות את המהלכים הבאים של שחקנים במשחקי שח. הטכניקה שלהם תואמת או עולה על שיטה פופולרית אחרת ליצירת מודלים מסוג זה של קבלת החלטות.

בסופו של דבר, עבודה זו יכולה לעזור למדענים ללמד מערכות AI כיצד בני אדם מתנהגים, מה שיכול לאפשר למערכות אלו להגיב טוב יותר למשתפי הפעולה האנושיים שלהן. היכולת להבין התנהגות של אדם, ולאחר מכן להסיק את מטרותיו מהתנהגות זו, יכולה להפוך עוזר בינה מלאכותית להרבה יותר שימושי, אומר אתול פול ג'ייקוב, סטודנט לתואר שני בהנדסת חשמל ומדעי המחשב (EECS) ומחבר ראשי של מאמר בנושא הטכניקה הזו.

"אם אנו יודעים שאדם עומד לטעות, לאחר שראינו כיצד הם התנהגו בעבר, סוכן הבינה המלאכותית יוכל להתערב ולהציע דרך טובה יותר לעשות זאת. או שהסוכן יכול להסתגל לחולשות שיש למשתפי הפעולה האנושיים שלו. היכולת לדמות התנהגות אנושית היא צעד חשוב לקראת בניית סוכן בינה מלאכותית שבאמת יכול לעזור לאותו אדם", הוא אומר.

ג'ייקוב כתב את המאמר עם Abhishek Gupta, עוזר פרופסור באוניברסיטת וושינגטון, והסופר הבכיר ג'ייקוב אנדריאס, פרופסור חבר ב-EECS וחבר במעבדת מדעי המחשב והבינה המלאכותית (CSAIL). המחקר יוצג בכנס הבינלאומי על ייצוגי למידה.

התנהגות דוגמנות

חוקרים בונים מודלים חישוביים של התנהגות אנושית במשך עשרות שנים. גישות קודמות רבות מנסות להביא בחשבון קבלת החלטות לא אופטימלית על ידי הוספת רעש למודל. במקום שהסוכן יבחר תמיד באפשרות הנכונה, המודל עשוי לחייב אותו סוכן לבצע את הבחירה הנכונה ב-95 אחוז מהפעמים.

עם זאת, שיטות אלו לא יכולות לתפוס את העובדה שבני אדם לא תמיד מתנהגים בצורה לא אופטימלית באותו אופן.

אחרים ב-MIT למדו גם דרכים יעילות יותר לתכנן ולהסיק יעדים מול קבלת החלטות לא אופטימלית.

כדי לבנות את המודל שלהם, ג'ייקוב ומשתפי הפעולה שלו שאבו השראה ממחקרים קודמים של שחקני שחמט. הם שמו לב שלשחקנים לקח פחות זמן לחשוב לפני שהם פעלו כשהם מבצעים מהלכים פשוטים וששחקנים חזקים יותר נטו להשקיע יותר זמן בתכנון מאשר חלשים יותר במשחקים מאתגרים.

"בסופו של יום, ראינו שעומק התכנון, או כמה זמן מישהו חושב על הבעיה, הוא פרוקסי ממש טוב לאופן שבו בני אדם מתנהגים", אומר ג'ייקוב.

הם בנו מסגרת שיכולה להסיק את עומק התכנון של הסוכן מפעולות קודמות ולהשתמש במידע הזה כדי לדגמן את תהליך קבלת ההחלטות של הסוכן.

השלב הראשון בשיטה שלהם כולל הפעלת אלגוריתם למשך פרק זמן מוגדר כדי לפתור את הבעיה הנחקרת. לדוגמה, אם הם לומדים משחק שחמט, הם עשויים לתת לאלגוריתם משחק השח לרוץ למספר מסוים של צעדים. בסוף, החוקרים יכולים לראות את ההחלטות שהאלגוריתם קיבל בכל שלב.

המודל שלהם משווה את ההחלטות הללו להתנהגויות של סוכן הפותר את אותה בעיה. זה יתאים את החלטות הסוכן להחלטות האלגוריתם ויזהה את השלב שבו הסוכן הפסיק לתכנן.

מתוך כך, המודל יכול לקבוע את תקציב ההסקה של הסוכן, או כמה זמן אותו סוכן יתכנן לבעיה זו. הוא יכול להשתמש בתקציב המסקנות כדי לחזות כיצד אותו סוכן יגיב בעת פתרון בעיה דומה.

פתרון בר פירוש

שיטה זו יכולה להיות יעילה מאוד מכיוון שהחוקרים יכולים לגשת למכלול ההחלטות המתקבלות על ידי האלגוריתם לפתרון בעיות מבלי לעשות עבודה נוספת. מסגרת זו יכולה להיות מיושמת גם על כל בעיה שניתן לפתור עם מחלקה מסוימת של אלגוריתמים.

"בשבילי, הדבר הבולט ביותר היה העובדה שתקציב ההסקה הזה הוא מאוד בר פרשנות. זה אומר שבעיות קשות יותר דורשות יותר תכנון או להיות שחקן חזק פירושו תכנון ארוך יותר. כשיצאנו לעשות זאת לראשונה, לא חשבנו שהאלגוריתם שלנו יוכל לקלוט את ההתנהגויות האלה באופן טבעי", אומר ג'ייקוב.

החוקרים בדקו את הגישה שלהם בשלוש משימות דוגמנות שונות: הסקת יעדי ניווט ממסלולים קודמים, ניחוש הכוונה התקשורתית של מישהו על פי הרמזים המילוליים שלו, וחיזוי מהלכים הבאים במשחקי שחמט אנושיים.

השיטה שלהם התאימה או עלתה על חלופה פופולרית בכל ניסוי. יתרה מכך, החוקרים ראו כי מודל ההתנהגות האנושית שלהם תואם היטב עם מדדים של מיומנות השחקן (במשחקי שחמט) וקושי במשימה.

בהמשך הדרך, החוקרים רוצים להשתמש בגישה זו כדי להדגים את תהליך התכנון בתחומים אחרים, כגון למידת חיזוק (שיטת ניסוי וטעייה הנפוצה ברובוטיקה). בטווח הארוך, הם מתכוונים להמשיך לבנות על העבודה הזו לקראת המטרה הגדולה יותר של פיתוח משתפי AI יעילים יותר.

עבודה זו נתמכה, בין השאר, על ידי MIT Schwarzman College of Computing Artificial Intelligence for Augmentation and Productivity Program והקרן הלאומית למדע.

ניקולס

ניקולס, עיתונאי ותיק ומוערך ב-Twoday, מתמחה בזכויות אדם ומדיניות בינלאומית. בעל תואר שני מהאוניברסיטה העברית, הניסיון הרב שלו כולל דיווחים משטחים קרביים ואזורי משבר. ניקולס מאמין בכוחה של העיתונות להאיר זוויות חדשות על סיפורים מורכבים, ובחשיבותה ביצירת שינוי חברתי חיובי.

מאמרים אחרונים

הערכה מחדש של חינוך מוקדם: תובנות מדהימות ממחקר חדש לגיל הרך

ניקולס

מדוע סופיה ורגרה לא חשבה שזה יהיה "הוגן" ללדת ילד עם ג'ו מנגנילו

ניקולס

שמלת Met Gala 2024 של Zendaya "אפילו לא עשויה"

ניקולס