איך תורת המשחקים הופכת את הבינה המלאכותית לחכמה יותר

חוקרי MIT CSAIL פיתחו "משחק קונצנזוס" לשיפור ההבנה והיצירה של טקסט בינה מלאכותית על ידי התייחסות לתהליך כאל משחק שבו חלק אחד יוצר משפטים וחלק אחר מעריך אותם. שיטה זו, הנקראת דירוג שיווי משקל, משפרת משמעותית את ביצועי הבינה המלאכותית במשימות כמו הבנת הנקרא, פתרון בעיות במתמטיקה ודיאלוג. קרדיט: twoday.co.il.com

MIT חוקרי CSAIL פיתחו "משחק קונצנזוס" חדש שמעלה את הבנת הטקסט וכישורי היצירה של AI.

"משחק הקונצנזוס" של MIT משפר את יצירת טקסט בינה מלאכותית באמצעות תורת המשחקים. שיטה זו, דירוג שיווי משקל, משפרת את הביצועים והאמינות של AI אך מתמודדת עם אתגרים חישוביים. זה יכול לקדם משמעותית את פענוח מודל השפה.

משחק קונצנזוס בינה מלאכותית: גישה חדשה למודלים של שפה

תאר לעצמך שאתה משחק משחק עם חבר שבו המטרה שלך היא להעביר הודעות סודיות זה לזה באמצעות משפטים סתרים בלבד. תפקידו של חברך הוא לנחש את המסר הסודי מאחורי המשפטים שלך. לפעמים, אתה נותן רמזים ישירות, ובפעמים אחרות, חבר שלך צריך לנחש את ההודעה על ידי שאילת שאלות כן או לא לגבי הרמזים שנתת. האתגר הוא ששניכם רוצים לוודא שאתם מבינים זה את זה נכון ומסכימים על המסר הסודי.

חוקרי מעבדת מדעי המחשב והבינה המלאכותית של MIT (CSAIL) יצרו "משחק" דומה כדי לעזור לשפר את האופן שבו AI מבין ויוצר טקסט. זה ידוע בתור "משחק קונצנזוס" והוא כולל שני חלקים של מערכת בינה מלאכותית – חלק אחד מנסה ליצור משפטים (כמו מתן רמזים), והחלק השני מנסה להבין ולהעריך את המשפטים הללו (כמו ניחוש המסר הסודי).

"משחק הקונצנזוס" של חוקרי MIT הוא גישה תיאורטית-משחקית לפענוח מודלים של שפה. אלגוריתם דירוג שיווי המשקל מייצר הרמוניה של שאילתות יצירתיות ואפלליות כדי לשפר את דיוק הניבוי במשימות שונות, לעלות על מודלים גדולים יותר ולהדגים את הפוטנציאל של תורת המשחקים בשיפור עקביות ואמיתות מודל השפה. קרדיט: Alex Shipps/MIT CSAIL

גישה תיאורטית למשחק בינה מלאכותית

החוקרים גילו שעל ידי התייחסות לאינטראקציה הזו כאל משחק, שבו שני חלקי הבינה המלאכותית עובדים יחד תחת כללים ספציפיים כדי להסכים על המסר הנכון, הם יכולים לשפר משמעותית את יכולת הבינה המלאכותית לתת תשובות נכונות וקוהרנטיות לשאלות. הם בדקו את הגישה הדומה למשחק החדשה הזו במגוון משימות, כמו הבנת הנקרא, פתרון בעיות מתמטיקה וניהול שיחות, וגילו שהיא עזרה ל-AI לבצע ביצועים טובים יותר בכל רחבי הלוח.

באופן מסורתי, מודלים של שפות גדולות עונים באחת משתי דרכים: יצירת תשובות ישירות מהמודל (שאילתה גנרית) או שימוש במודל לציון קבוצה של תשובות מוגדרות מראש (שאילתה מפלה), מה שעלול להוביל לתוצאות שונות ולעיתים לא תואמות. עם הגישה הגנרטיבית, "מי הוא נשיא ארצות הברית?" עשויה להניב תשובה פשוטה כמו "ג'ו ביידן". עם זאת, שאילתה מפלה עלולה לערער על עובדה זו באופן שגוי בעת הערכת אותה תשובה, כגון "ברק אובמה".

איזון תגובות בינה מלאכותית עם דירוג שיווי משקל

אז איך נוכל ליישב נהלי ניקוד שאינם תואמים זה את זה כדי להשיג תחזיות קוהרנטיות ויעילות?

"דמיין לעצמך דרך חדשה לעזור למודלים של שפה להבין וליצור טקסט, כמו משחק. פיתחנו שיטה נטולת הכשרה, תיאורטית של משחקים, שמתייחסת לכל התהליך כמשחק מורכב של רמזים ואותות, שבו מחולל מנסה להעביר את המסר הנכון למבדיל באמצעות שפה טבעית. במקום כלי שחמט, הם משתמשים במילים ובמשפטים", אומר אתול ג'ייקוב, דוקטורנט ל-MIT בהנדסת חשמל ומדעי המחשב ושותפה ל-CSAIL. "הדרך שלנו לנווט במשחק הזה היא למצוא את 'שיווי המשקל המשוער', המוביל לאלגוריתם פענוח חדש שנקרא 'דירוג שיווי משקל'. זו הדגמה די מרגשת כיצד הכנסת אסטרטגיות תיאורטיות למשחק לתערובת יכולה להתמודד עם כמה אתגרים גדולים בהפיכת מודלים לשפות אמינים ועקביים יותר."

כאשר נבדק על פני משימות רבות, כמו הבנת הנקרא, הגיון בריא, פתרון בעיות במתמטיקה ודיאלוג, האלגוריתם של הצוות שיפר בעקביות את ביצועי המודלים הללו. השימוש באלגוריתם ER עם מודל LLaMA-7B אפילו העלה את התוצאות ממודלים גדולים בהרבה. "בהתחשב בכך שהם כבר תחרותיים, שאנשים עבדו על זה כבר זמן מה, אבל רמת השיפורים שראינו ביכולת להתעלות על דגם שגודלו פי 10 הייתה הפתעה נעימה", אומר ג'ייקוב.

המשחק מתחיל

"דיפלומטיה", משחק לוח אסטרטגי המתרחש באירופה לפני מלחמת העולם הראשונה, שבו שחקנים מנהלים משא ומתן על בריתות, בוגדים בחברים וכובשים שטחים ללא שימוש בקוביות – בהסתמך אך ורק על מיומנות, אסטרטגיה ומניפולציה בין-אישית – הגיע לאחרונה . בנובמבר 2022, מדעני מחשב, כולל ג'ייקוב, פיתחו את "Cicero", סוכן בינה מלאכותית שמשיג יכולות ברמת האדם במשחק של שבעה שחקנים עם מוטיבים מעורבים, הדורש את אותן כישורים שהוזכרו לעיל, אך עם שפה טבעית. המתמטיקה מאחורי זה שימשה חלקית השראה למשחק הקונצנזוס.

בעוד שההיסטוריה של סוכני בינה מלאכותית קודמת לזמן שבו התוכנה של OpenAI נכנסה לצ'אט בנובמבר 2022, מתועד היטב שהם עדיין יכולים לשחק קוספליי בתור חברך בעל כוונות טובות אך פתולוגיות.

מערכת משחקי הקונצנזוס מגיעה לשיווי משקל כהסכם, מבטיח דיוק ונאמנות לתובנות המקוריות של הדגם. כדי להשיג זאת, השיטה מתאימה באופן איטרטיבי את יחסי הגומלין בין המרכיבים המחוללים והאבחנה עד שהם מגיעים להסכמה על תשובה המשקפת במדויק את המציאות ומתיישרת עם האמונות הראשוניות שלהם. גישה זו מגשרת למעשה על הפער בין שתי שיטות השאילתה.

יישומים מעשיים ואתגרים

בפועל, יישום גישת משחק הקונצנזוס לשאילתת מודלים של שפה, במיוחד עבור משימות תשובות לשאלות, כרוך באתגרים חישוביים משמעותיים. לדוגמה, כאשר משתמשים במערכי נתונים כמו MMLU, שיש להם אלפי שאלות ותשובות מרובות, המודל חייב להחיל את המנגנון על כל שאילתה. לאחר מכן, עליו להגיע לקונצנזוס בין המרכיבים המחוללים והאבחנה לכל שאלה והתשובות האפשריות לה.

המערכת אכן נאבקה עם זכות מעבר לבית הספר היסודי: בעיות במילים במתמטיקה. זה לא יכול היה לייצר תשובות שגויות, וזה מרכיב קריטי בהבנת התהליך של הגעת התשובות הנכונות.

כיוונים עתידיים

"בשנים האחרונות ראינו התקדמות מרשימה הן בקבלת החלטות אסטרטגיות והן ביצירת שפה ממערכות AI, אבל אנחנו רק מתחילים להבין איך לחבר את השניים יחד. דירוג שיווי משקל הוא צעד ראשון בכיוון הזה, אבל אני חושב שיש הרבה שנוכל לעשות כדי להגדיל את זה לבעיות מורכבות יותר", אומר יעקב.

שדרת עבודה עתידית כוללת שיפור מודל הבסיס על ידי שילוב התפוקות של השיטה הנוכחית. זה מבטיח במיוחד מכיוון שהוא יכול להניב תשובות עובדתיות ועקביות יותר על פני משימות שונות, כולל עובדות ודור פתוח. הפוטנציאל של שיטה כזו לשפר משמעותית את ביצועי המודל הבסיסי הוא גבוה, מה שעלול לגרום לתפוקות אמינות ועובדתיות יותר מ-ChatGPT ומודלים שפות דומים שאנשים משתמשים בהם מדי יום.

תובנות מומחים על קידום בינה מלאכותית

"למרות שמודלים מודרניים של שפה, כמו ChatGPT ו-Gemini, הובילו לפתרון משימות שונות באמצעות ממשקי צ'אט, תהליך הפענוח הסטטיסטי שיוצר תגובה ממודלים כאלה נותר ללא שינוי במשך עשרות שנים", אומר מדען המחקר של גוגל אחמד ביראמי, שהיה לא מעורב בעבודה. "ההצעה של חוקרי MIT היא מסגרת תיאורטית משחקית חדשנית לפענוח ממודלים של שפה דרך פתרון שיווי המשקל של משחק קונצנזוס. ההישגים המשמעותיים בביצועים המדווחים במאמר המחקר מבטיחים, ופותחים את הדלת לשינוי פרדיגמה פוטנציאלי בפענוח מודלים של שפה, שעשוי לתדלק שפע של יישומים חדשים."

ג'ייקוב כתב את המאמר עם חוקר מעבדת ווטסון של MIT-IBM Yikang Shen ועם עוזרי הפרופסורים של המחלקה להנדסת חשמל ומדעי המחשב ב-MIT, גבריאל פארינה וג'ייקוב אנדראס, שהוא גם חבר ב-CSAIL. הם הציגו את עבודתם בוועידה הבינלאומית על ייצוגי למידה (ICLR) מוקדם יותר החודש, שם היא הודגשה כ"נייר זרקור". המחקר גם קיבל "פרס המאמר הטוב ביותר" בסדנת NeurIPS R0-FoMo בדצמבר 2023.

ניקולס

ניקולס, עיתונאי ותיק ומוערך ב-Twoday, מתמחה בזכויות אדם ומדיניות בינלאומית. בעל תואר שני מהאוניברסיטה העברית, הניסיון הרב שלו כולל דיווחים משטחים קרביים ואזורי משבר. ניקולס מאמין בכוחה של העיתונות להאיר זוויות חדשות על סיפורים מורכבים, ובחשיבותה ביצירת שינוי חברתי חיובי.

מאמרים אחרונים

אשליה אופטית לבדיקת ה-IQ שלך: האם תוכל לזהות 16 נמרים מוסתרים בתמונת היער תוך 21 שניות?

ניקולס

טכניקה שהתגלתה לאחרונה הופכת תאי שומן לבנים רגילים לשומן בז' שורף קלוריות

ניקולס

חידת מוח לבדיקת ה-IQ שלך: האם תוכל לזהות את הכלב המוזר בתמונה תוך 7 שניות?

ניקולס