חוקרים מאוניברסיטת מינסוטה הציגו חידוש חומרה בשם CRAM, שמפחית את השימוש באנרגיה של AI עד פי 2,500 על ידי עיבוד נתונים בתוך הזיכרון, מה שמבטיח התקדמות משמעותית ביעילות AI.
מכשיר זה יכול לחתוך את צריכת האנרגיה של הבינה המלאכותית פי 1,000 לפחות.
חוקרים בהנדסה מאוניברסיטת מינסוטה ערים תאומות פיתחו מכשיר חומרה מתקדם שיכול להפחית את השימוש באנרגיה בינה מלאכותית (AI) יישומי מחשוב לפי לפחות פקטור של 1,000.
המחקר מתפרסם ב npj מחשוב לא קונבנציונלי, כתב עת מדעי בעל ביקורת עמיתים בהוצאת Nature. לחוקרים יש מספר פטנטים על הטכנולוגיה המשמשת במכשיר.
עם הביקוש הגובר של יישומי בינה מלאכותית, חוקרים בחנו דרכים ליצור תהליך יעיל יותר באנרגיה, תוך שמירה על ביצועים גבוהים ועלויות נמוכות. בדרך כלל, תהליכים של מכונה או בינה מלאכותית מעבירים נתונים בין לוגיקה (שם המידע מעובד בתוך מערכת) לבין זיכרון (שם הנתונים מאוחסנים), תוך צורך בכמות גדולה של כוח ואנרגיה.
מבוא של טכנולוגיית CRAM
צוות חוקרים מהמכללה למדעים והנדסה של אוניברסיטת מינסוטה הדגים מודל חדש שבו הנתונים לעולם אינם עוזבים את הזיכרון, הנקרא זיכרון גישה אקראית חישובית (CRAM).
"עבודה זו היא ההדגמה הניסיונית הראשונה של CRAM, שבה ניתן לעבד את הנתונים במלואם בתוך מערך הזיכרון ללא צורך לעזוב את הרשת שבה המחשב מאחסן מידע", אמר Yang Lv, המחלקה להנדסת חשמל ומחשבים באוניברסיטת מינסוטה. חוקר פוסט-דוקטורט ומחבר ראשון של המאמר.

מכשיר חומרה שנבנה בהתאמה אישית מתכנן לעזור לבינה מלאכותית להיות יעילה יותר באנרגיה. קרדיט: אוניברסיטת מינסוטה ערים תאומות
סוכנות האנרגיה הבינלאומית (IEA) פרסמה א תחזית שימוש עולמית באנרגיה במרץ 2024, צופה שצריכת האנרגיה עבור AI צפויה להכפיל מ-460 טרה-וואט-שעה (TWh) ב-2022 ל-1,000 TWh ב-2026. זה שווה בערך לצריכת החשמל של כל מדינת יפן.
לדברי מחברי העיתון החדש, מבוסס CRAM למידת מכונה מאיץ ההסקות מוערך בהשגת שיפור בסדר גודל של 1,000. דוגמה נוספת הראתה חיסכון באנרגיה של פי 2,500 ו-1,700 בהשוואה לשיטות מסורתיות.
אבולוציה של המחקר
המחקר הזה כבר יותר משני עשורים בהתהוות,
"הרעיון הראשוני שלנו להשתמש בתאי זיכרון ישירות למחשוב לפני 20 שנה נחשב למטורף", אמר ג'יאן-פינג וואנג, הכותב הבכיר של המאמר ופרופסור מקנייט מכובד ויו"ר רוברט פ. הרטמן במחלקה להנדסת חשמל ומחשבים. באוניברסיטת מינסוטה.
"עם קבוצה מתפתחת של סטודנטים מאז 2003 וצוות סגל אינטרדיסציפלינרי אמיתי שנבנה באוניברסיטת מינסוטה – מפיזיקה, מדעי החומרים והנדסת החומרים, מדעי המחשב והנדסה, למידול והשוואת ביצועים ויצירת חומרה – הצלחנו להשיג תוצאות חיוביות תוצאות וכעת הוכיחו שסוג זה של טכנולוגיה בר ביצוע ומוכנה להשתלב בטכנולוגיה", אמר וואנג.
מחקר זה הוא חלק ממאמץ קוהרנטי וארוך שנים הנבנה על מחקר פורץ הדרך, המוגן בפטנט של וואנג ושל משתפי הפעולה שלו, על התקני מגנטי מנהרה (MTJs), שהם מכשירים בעלי ננו-מבנה המשמשים לשיפור כוננים קשיחים, חיישנים ומערכות מיקרו-אלקטרוניקה אחרות, כולל Magnetic Random Access Memory (MRAM), אשר שימש במערכות משובצות כגון מיקרו-בקרים ושעונים חכמים.
ארכיטקטורת ה-CRAM מאפשרת את החישוב האמיתי בזיכרון ועל ידיו ומפרקת את החומה בין החישוב לזיכרון כצוואר הבקבוק בארכיטקטורת פון נוימן המסורתית, עיצוב תיאורטי למחשב תוכנית מאוחסנת המשמש כבסיס כמעט לכל המחשבים המודרניים.
"בתור מצע מחשוב דיגיטלי מבוסס זיכרון חסכוני במיוחד באנרגיה, CRAM גמיש מאוד בכך שניתן לבצע חישוב בכל מקום במערך הזיכרון. בהתאם לכך, אנחנו יכולים להגדיר מחדש את ה-CRAM כך שיתאים בצורה הטובה ביותר לצורכי הביצועים של קבוצה מגוונת של אלגוריתמי בינה מלאכותית", אמרה Ulya Karpuzcu, מומחית לארכיטקטורת מחשוב, מחברת שותפה במאמר, ופרופסור חבר במחלקה להנדסת חשמל ומחשבים ב- אוניברסיטת מינסוטה. "זה חסכוני יותר באנרגיה מאבני בניין מסורתיות למערכות הבינה המלאכותית של היום."
CRAM מבצע חישובים ישירות בתוך תאי זיכרון, תוך ניצול יעיל של מבנה המערך, מה שמבטל את הצורך בהעברת נתונים איטיים ועתירי אנרגיה, הסביר Karpuzcu.
זיכרון הגישה האקראית לטווח קצר היעיל ביותר, או זיכרון RAM, משתמש בארבעה או חמישה טרנזיסטורים כדי לקודד אחד או אפס אבל MTJ אחד, מכשיר ספינטרוניק, יכול לבצע את אותה פונקציה בשבריר מהאנרגיה, במהירות גבוהה יותר. והוא עמיד בפני סביבות קשות. מכשירי Spintronic ממנפים את הספין של אלקטרונים ולא את המטען החשמלי לאחסון נתונים, ומספקים אלטרנטיבה יעילה יותר לשבבים מסורתיים מבוססי טרנזיסטור.
נכון לעכשיו, הצוות מתכנן לעבוד עם מובילי תעשיית המוליכים למחצה, כולל אלה במינסוטה, כדי לספק הדגמות בקנה מידה גדול ולייצר את החומרה לקידום פונקציונליות בינה מלאכותית.
בנוסף ל-Lv, Wang ו-Karpuzcu, הצוות כלל את חוקרי המחלקה להנדסת חשמל ומחשבים של אוניברסיטת מינסוטה רוברט בלום והוסרב סילאסון; פרופסור מקנייט הנכבד ויו"ר רוברט ומרג'ורי הנל, סאצ'ין ספטנקר; והחוקרים הפוסט-דוקטורנטים לשעבר ברנדון זינק, זמשד צ'ודהורי וסלוניק רש; יחד עם חוקרים מאוניברסיטת אריזונה: Pravin Khanal, Ali Habiboglu ופרופסור Weigang Wang
עבודה זו נתמכה על ידי מענקים מהסוכנות האמריקאית לפרויקטי מחקר מתקדמים של ההגנה (DARPA), המכון הלאומי לתקנים וטכנולוגיה (NIST), הקרן הלאומית למדע (NSF), ו-Cisco Inc. מחקר כולל דפוסי ננו-התקן נערך בשיתוף עם מרכז הננו של מינסוטה ועבודת סימולציה/חישוב נעשתה עם מכון המחשוב של מינסוטה באוניברסיטת מינסוטה.