SciTechDaily

ניקולס

מתיאוריה לטיפול: פריצת הדרך החישובית של MIT באופטימיזציה של חלבון

חוקרי MIT פיתחו גישה חישובית שמקלה על חיזוי מוטציות שיובילו לחלבונים מותאמים, בהתבסס על כמות קטנה יחסית של נתונים. קרדיט: חדשות MIT; iStock

MIT חוקרים מתכננים לחפש חלבונים שיוכלו לשמש למדידת פעילות חשמלית במוח.

כדי להנדס חלבונים עם פונקציות שימושיות, החוקרים מתחילים בדרך כלל עם חלבון טבעי שיש לו תפקיד רצוי, כמו פליטת אור ניאון, ומעבירים אותו לסבבים רבים של מוטציה אקראית שבסופו של דבר מייצרת גרסה אופטימלית של החלבון.

תהליך זה הניב גרסאות אופטימליות של חלבונים חשובים רבים, כולל חלבון פלואורסצנטי ירוק (GFP). עם זאת, עבור חלבונים אחרים, הוכח שקשה ליצור גרסה מותאמת. חוקרי MIT פיתחו כעת גישה חישובית שמקלה על חיזוי מוטציות שיובילו לחלבונים טובים יותר, בהתבסס על כמות קטנה יחסית של נתונים.

התקדמות בעיצוב חלבון חישובי

באמצעות מודל זה, החוקרים יצרו חלבונים עם מוטציות שנחזו להוביל לגרסאות משופרות של GFP וחלבון ממקור אדנו נגיף (AAV), המשמש למסירה DNA עבור ריפוי גנטי. הם מקווים שזה יכול לשמש גם לפיתוח כלים נוספים למחקר מדעי המוח ויישומים רפואיים.

"עיצוב חלבונים הוא בעיה קשה מכיוון שהמיפוי מרצף ה-DNA למבנה ותפקוד החלבון הוא מאוד מורכב. יכול להיות שיש חלבון גדול במרחק של 10 שינויים ברצף, אבל כל שינוי ביניים עשוי להתאים לחלבון לא מתפקד לחלוטין. זה כמו לנסות למצוא את הדרך אל אגן הנהר ברכס הרים, כשיש פסגות סלעיות לאורך הדרך שחוסמות את הנוף. העבודה הנוכחית מנסה להקל על מציאת אפיק הנהר", אומרת אילה פייטה, פרופסור למדעי המוח והקוגניציה ב-MIT, חברה במכון מקגוברן לחקר המוח של MIT, מנהלת המרכז למדעי המוח האינטגרטיבי K. Lisa Yang. אחד הכותבים הבכירים של המחקר.

רג'ינה ברזילי, פרופסור מצטיין של בית הספר להנדסה לבינה מלאכותית ובריאות ב-MIT, וטומי ג'אקולה, פרופסור תומס סיבל להנדסת חשמל ומדעי המחשב ב-MIT, הם גם כותבים בכירים של מאמר בגישה פתוחה על העבודה, שתהיה הוצג בכנס הבינלאומי על ייצוגי למידה במאי. סטודנטים לתארים מתקדמים ב-MIT, אנדרו קירג'נר וג'ייסון ים, הם הכותבים הראשיים של המחקר. מחברים נוספים כוללים את שחר ברכה, פוסט דוקטורט ב-MIT, ורמאן סמוסביץ', סטודנט לתואר שני באוניברסיטה הטכנית הצ'כית.

ייעול חלבונים

לחלבונים רבים המופיעים באופן טבעי יש פונקציות שיכולות להפוך אותם לשימושיים עבור מחקר או יישומים רפואיים, אבל הם זקוקים למעט הנדסה נוספת כדי לייעל אותם. במחקר זה, החוקרים התעניינו במקור בפיתוח חלבונים שיוכלו לשמש בתאים חיים כמחווני מתח. חלבונים אלה, המיוצרים על ידי כמה חיידקים ואצות, פולטים אור ניאון כאשר מתגלה פוטנציאל חשמלי. אם יונדסו לשימוש בתאי יונקים, חלבונים כאלה יכולים לאפשר לחוקרים למדוד פעילות נוירונים מבלי להשתמש באלקטרודות.

בעוד שעשרות שנים של מחקר הושקעו בהנדסת חלבונים אלה כדי לייצר אות פלואורסצנטי חזק יותר, בטווח זמן מהיר יותר, הם לא הפכו יעילים מספיק לשימוש נרחב. ברכה, שעובדת במעבדה של אדוארד בוידן במכון מקגוברן, הגיעה למעבדה של פייטה כדי לראות אם הם יכולים לעבוד יחד על גישה חישובית שעשויה לעזור להאיץ את תהליך האופטימיזציה של החלבונים.

"עבודה זו מדגימה את השלווה האנושית המאפיינת כל כך הרבה גילויים מדעיים", אומר פייטה. "זה צמח מתוך ה-Yang Tan Collective Retreat, מפגש מדעי של חוקרים ממספר מרכזים ב-MIT עם משימות נפרדות מאוחדות על ידי התמיכה המשותפת של ק' ליסה יאנג. למדנו שחלק מתחומי העניין והכלים שלנו במודלים של איך מוח לומדים ומבצעים אופטימיזציה יכולים להיות מיושמים בתחום שונה לחלוטין של עיצוב חלבון, כפי שנהוג במעבדת בוידן".

עבור כל חלבון נתון שחוקרים עשויים לרצות לייעל, יש מספר כמעט אינסופי של רצפים אפשריים שיכולים להיווצר על ידי החלפה חומצות אמינו בכל נקודה בתוך הרצף. עם כל כך הרבה גרסאות אפשריות, אי אפשר לבדוק את כולן בניסוי, ולכן חוקרים פנו למידול חישובי כדי לנסות לחזות אילו מהם יעבדו הכי טוב.

מידול חישובי וחיזוי

במחקר זה, החוקרים יצאו להתגבר על האתגרים הללו, תוך שימוש בנתונים מ-GFP כדי לפתח ולבדוק מודל חישובי שיכול לחזות גרסאות טובות יותר של החלבון.

הם התחילו באימון סוג של מודל המכונה רשת עצבית קונבולוציונית (CNN) על נתונים ניסיוניים המורכבים מרצפי GFP והבהירות שלהם – התכונה שהם רצו לייעל.

המודל הצליח ליצור "נוף כושר" – מפה תלת מימדית המתארת ​​את הכושר של חלבון נתון וכמה הוא שונה מהרצף המקורי – בהתבסס על כמות קטנה יחסית של נתונים ניסויים (מכ-1,000 גרסאות של GFP).

נופים אלה מכילים פסגות המייצגות חלבונים מתאימים יותר ועמקים המייצגים חלבונים פחות מתאימים. לחזות את הנתיב שבו חלבון צריך ללכת כדי להגיע לשיא הכושר יכול להיות קשה, מכיוון שלעתים קרובות חלבון יצטרך לעבור מוטציה שגורמת לו להיות פחות מתאים לפני שהוא מגיע לשיא קרוב של כושר גבוה יותר. כדי להתגבר על בעיה זו, החוקרים השתמשו בטכניקה חישובית קיימת כדי "להחליק" את נוף הכושר.

לאחר שהחלקו הבליטות הקטנות הללו בנוף, החוקרים אימנו מחדש את מודל ה-CNN וגילו שהוא מסוגל להגיע לשיאי כושר גדולים יותר בקלות רבה יותר. המודל הצליח לחזות רצפי GFP שעברו אופטימיזציה שהכילו עד שבע חומצות אמינו שונות מרצף החלבונים איתו הם התחילו, והטובים מבין החלבונים הללו הוערכו כבעלי כושר פי 2.5 מהמקורי.

"ברגע שיש לנו את הנוף הזה שמייצג את מה שהדגם חושב שנמצא בקרבת מקום, אנחנו מחליקים אותו ואז אנו מאמנים מחדש את הדגם על הגרסה החלקה יותר של הנוף", אומר קירג'נר. "עכשיו יש דרך חלקה מנקודת ההתחלה שלך לפסגה, שאליו המודל מסוגל כעת להגיע על ידי ביצוע שיפורים קטנים באופן איטרטיבי. לעתים קרובות הדבר בלתי אפשרי עבור נופים לא מוחלקים."

הוכחה של רעיון או תאוריה

החוקרים גם הראו כי גישה זו עבדה היטב בזיהוי רצפים חדשים לקפסיד הנגיפי של נגיף אדנו (AAV), וקטור ויראלי המשמש בדרך כלל להעברת DNA. במקרה זה, הם ייעלו את הקפסיד ליכולתו לארוז מטען DNA.

"השתמשנו ב-GFP וב-AAV כהוכחה לקונספט כדי להראות שזו שיטה שעובדת על מערכי נתונים שמאופיינים היטב, ובגלל זה היא צריכה להיות ישימה לבעיות הנדסת חלבון אחרות", אומר ברכה. .

החוקרים מתכננים כעת להשתמש בטכניקה חישובית זו על נתונים שברכה ייצרה על חלבוני מחוון מתח.

"עשרות מעבדות עבדו על זה במשך שני עשורים, ועדיין אין משהו טוב יותר", היא אומרת. "התקווה היא שעכשיו עם יצירת מערך נתונים קטן יותר, נוכל לאמן מודל בסיליקו ולעשות תחזיות שיכולות להיות טובות יותר משני העשורים האחרונים של בדיקות ידניות."

המחקר מומן, בחלקו, על ידי הקרן הלאומית למדע בארה"ב, קונסורציום Machine Learning for Pharmaceutical Discovery and Synthesis, מרפאת עבדול לטיף ג'מייל ללמידת מכונה בבריאות, תוכנית ה-DTRA Discovery of Medical countermeasures Against New and Emerging איומים. DARPA תוכנית גילוי מולקולרי מואץ, מענק Sanofi Computational Antibody Design, המשרד האמריקאי לחקר הצי, המכון הרפואי הווארד יוז, המכונים הלאומיים לבריאותמרכז K. Lisa Yang ICoN, ומרכז K. Lisa Yang והוק E. Tan לטיפול מולקולרי ב-MIT.

ניקולס