SciTechDaily

ניקולס

פריצת דרך בביואינפורמטיקה: AI מנבא טרנספורמציות של סוגי תאים

תאים משנים צורה ותפקוד כאשר הם מתוכנתים מחדש בתגובה לשינוי אקסוגני של הביטוי של קומץ גנים מפתח שזוהו על ידי הגישה החישובית. קרדיט: אלי מג'יה/אוניברסיטת נורת'ווסטרן

AI מנתחת נתונים נגישים כדי לאתר שינויים גנטיים שמשנים את הפעילות התאית.

ההתקדמות בטכנולוגיית רצף הגנים וכוח המחשוב הגדילה משמעותית את הזמינות של נתונים ביואינפורמטיים ויכולות עיבוד. התכנסות זו מספקת הזדמנות אידיאלית לבינה מלאכותית (AI) לפתח שיטות לשלוט בהתנהגות הסלולרית.

במחקר חדש, חוקרים מאוניברסיטת נורת'ווסטרן קטפו פירות מהקשר הזה על ידי פיתוח גישת לימוד העברה מונעת בינה מלאכותית המשמשת מחדש נתונים זמינים לציבור כדי לחזות שילובים של הפרעות גנים שיכולות להפוך את סוג התא או להחזיר תאים חולים לבריאות.

המחקר פורסם לאחרונה ב- הליכים של האקדמיה הלאומית למדעים.

מאז השלמת פרויקט הגנום האנושי לפני 20 שנה, מדענים מכירים את האדם הזה DNA מכיל יותר מ-20,000 גנים. עם זאת, זה נותר בגדר תעלומה לגבי האופן שבו הגנים הללו פועלים יחד כדי לתזמר את מאות סוגי התאים השונים בגופנו.

באופן מפתיע, בעצם על ידי ניסוי וטעייה מודרך, חוקרים הוכיחו שאפשר "לתכנת מחדש" את סוג התא על ידי מניפולציה של קומץ גנים בלבד. פרויקט הגנום האנושי גם איפשר את ההתקדמות בטכנולוגיות ריצוף, מה שהפך את זה לזול יותר לא רק לקרוא את הקוד הגנטי, אלא גם למדוד את ביטוי הגנים, שמכמת את המבשרים של החלבונים המבצעים את תפקודי התא. עלייה זו במחיר הסבירות הובילה להצטברות של כמות עצומה של נתונים ביו-אינפורמטיים זמינים לציבור, והעלתה את האפשרות לסנתז נתונים אלה כדי לעצב באופן רציונלי מניפולציות גנים שיכולות לעורר התנהגויות תאים רצויות.

היכולת לשלוט בהתנהגות התאים, ובכך לעבור בין סוגי תאים, יכולה להיות מיושמת על צמיחה מחדש של רקמות פצועות או על הפיכת תאים סרטניים בחזרה לתאים נורמליים.

רקמות פצועות כתוצאה משבץ מוחי, דלקת פרקים וטרשת נפוצה משפיעות על 2.9 מיליון אנשים מדי שנה בארצות הברית, בעלות של עד 400 מיליון דולר בשנה. בינתיים, סרטן אחראי לכ-10 מיליון מקרי מוות מדי שנה ברחבי העולם עם עלויות כלכליות של טריליוני דולרים. מכיוון שסטנדרט הטיפול הנוכחי אינו מחדש רקמות ו/או בעל יעילות מוגבלת, קיים צורך קריטי בפיתוח טיפולים יעילים יותר שישימים באופן נרחב, אשר בתורו דורש זיהוי של התערבויות מולקולריות שניתן להסיק מנתונים בעלי תפוקה גבוהה.

במחקר החדש, החוקרים מאמנים את ה-AI שלהם כדי ללמוד כיצד ביטוי גנים מוביל להתנהגות תאים באמצעות נתוני ביטוי גנים זמינים לציבור. המודל החזוי שנוצר על ידי תהליך למידה זה מועבר ליישומי תכנות מחדש של תאים ספציפיים. בכל יישום, הגישה מוצאת את השילוב של מניפולציות גנים שסביר להניח שיגרום למעבר מסוג התא הרצוי.

חקירה חסרת תקדים של הדינמיקה של הגנום

"העבודה שלנו בולטת מגישות קודמות לתכנון רציונלי של אסטרטגיות לתמרן התנהגות תאים", אמר תומס ווייטוק, המחבר הראשי של המאמר וחבר המרכז לדינמיקת רשת ב- האוניברסיטה הצפון מערבית. "הגישות הללו מתחלקות ברובן לשתי קטגוריות: האחת שבה גנים מאורגנים ברשתות לפי האינטראקציות או המאפיינים המשותפים שלהם; ועוד אחד שבו הביטוי של גנים מתאי בריא וחולים מושווה כדי לייחד את הגנים שמראים את ההבדלים הגדולים ביותר".

בקטגוריה הראשונה, קיים פשרה בין ריאליזם לקנה מידה. מודלים מסוימים של רשת כוללים גנים רבים אך רק אומרים אם מערכת יחסים קיימת או נעדרת. מודלים אחרים הם כמותיים ומאומתים ניסיוני אך כוללים בהכרח מספר קטן של גנים וקשרים. העבודה החדשה של נורת'ווסטרן שומרת על החוזקות של שני סוגי המודלים: היא כוללת את כל הגנים בתא וכמותית בייצוג הביטויים שלהם. זה מושג על ידי הפחתת הביטוי של כמעט 20,000 גנים בודדים ללא יותר מ-10 שילובים ליניאריים של גנים כאלה, שהם ממוצעים משוקללים המכונים גנים עצמיים.

"Eigengenes בעצם מראה כיצד גנים פועלים בשיתוף פעולה, ומאפשרים לפשט את הדינמיקה של רשת דינמית גדולה לכמה חלקים נעים בלבד", אמר אדילסון מוטר, פרופסור לפיזיקה צ'ארלס אי ואמה ה. מוריסון במכללת ויינברג. לאמנויות ומדעים, מנהל המרכז לדינמיקת רשתות באוניברסיטת נורת'ווסטרן והמחבר הבכיר של המחקר. "ניתן לחשוב על כל גן עצמי כעל מסלול כללי שאינו תלוי באחרים. אז, גנים עצמיים קולטים את המתאמים והאי-תלות הרלוונטיים ברשת הוויסות של הגנים."

גישות בקטגוריה השנייה יכולות למצוא גנים בודדים הקשורים לשינוי בהתנהגות התא, אך אינן מצליחות לציין כיצד גנים פועלים יחד כדי לאפשר שינוי זה. הגישה החדשה מתגברת על אתגר זה על ידי הכרה בכך שגנים משנים את הביטויים שלהם במקביל. החשבון הכמותי של תכונה זו במונחים של גנים עצמיים מאפשר לשלב באופן תוסף את התגובות שלהם להפרעות גנים שונות על ידי שינוי קנה מידה מתאים. לאחר מכן ניתן להזין את התגובות המשולבות במודל AI כדי לקבוע אילו הפרעות מעוררות את התנהגות התא הרצויה.

מניעת פיצוץ קומבינטורי

מצוידים במודל AI זה, החוקרים אספו נתונים זמינים לציבור כדי לזהות כיצד ביטוי גנים משתנה כאשר גן בודד מופרע על ידי העלאה או הורדה אקסוגנית של הביטוי שלו. לאחר מכן הם פיתחו אלגוריתם לפתרון הבעיה ההפוכה, שהיא לחזות שילובי גנים שסביר להניח שיגרמו למעבר תכנות מחדש רצוי, כגון לגרום לתאים חולים להתנהג כתאים בריאים. הגישה הנובעת משילוב הנתונים והאלגוריתם עוקפת פיצוץ קומבינטורי שייגרם מבדיקת כל השילובים על מנת לזהות את היעילים שבהם. זה משמעותי מכיוון שניסויים יכולים לבדוק רק מספר מוגבל של מקרים, והאלגוריתם מספק דרך לזהות את המקרים המבטיחים ביותר להיבדק.

"הגישה זורחת ביכולתה לבחון אינספור שילובים מבחינה חישובית", אמר Wytock. "לדוגמה, השילובים הזוגיים של 200 הפרעות מניבים 20,000 מקרים, משולשים מניבים למעלה מ-1.3 מיליון מקרים, ומספר זה ממשיך לגדול באופן אקספוננציאלי. מכיוון שהאלגוריתם משתמש באופטימיזציה, הגישה יכולה להשוות תחזיות על פני מספר פוטנציאלי אינסופי של שילובים באמצעות קסם החשבון."

אתגר נוסף שעוקף הגישה הוא שהפרעות הגנים יכולות לשלב באופן לא תוסף. לדוגמה, קחו בחשבון את ההשפעה של הפרעות גנים על קצב הגדילה הסלולרית ודמיינו שהפרעות מפחיתות בחצי את קצב הגדילה כשהן מיושמות בבידוד. ההשפעה של שתי הפרעות כאלה משתלבות באופן לא תוסף אם הן מפחיתות את הצמיחה ליותר משמעותית או פחות מחצי חצי (או רבע). למרות שקיים גוף גדול של מחקרים המאפיינים אינטראקציות לא-תוספניות בין גנים, הגישה החדשה יעילה גם ללא צורך לתת את הדעת על סטיות כאלה מהתוסף.

"זהו מקרה שבו השלם מוערך היטב על ידי סכום החלקים", אמר מוטר.

"התכונה הזו של ההתערבויות הנדרשות כדי לגרום למעברים בין סוגי תאים היא מנוגדת לאינטואיציה מכיוון שסוגי התאים עצמם נובעים מאינטראקציות קולקטיביות בין גנים."

מכיוון שהגישה נותנת מענה לאתגרים העיקריים לשליטה בהתנהגות התא, ניתן ליישם אותה על מצבים ביו-רפואיים רבים ושונים, כולל אלו שייהנו מנתונים עתידיים.

מודל גמיש לנתונים עתידיים

העובדה שתגובות להפרעות גנים משתלבות באופן תוסף מקלה על הכללה בין סוגי תאים. לדוגמה, אם גן מופרע בתא עור, ההשפעה שתתקבל על הביטוי תהיה זהה במידה רבה בתא כבד.

לפיכך, ניתן לחשוב על גישת ה-AI כעל פלטפורמה שבה ניתן להכניס נתונים הנוגעים למחלה ספציפית בחולה ספציפי. הגישה עשויה להיות מיושמת בכל פעם שניתן להתייחס לריפוי המחלה כבעיית תכנות מחדש, כמו במקרה של סרטן, סוכרת ומחלות אוטואימוניות, שכולן נובעות מתפקוד לקוי של התא.

הרבגוניות של הגישה מאפשרת להקשר במהירות את ביטוי הגנים במחקר יחיד על פני כל הנתונים הזמינים בארכיון הקריאה ברצף של המרכז הלאומי למידע ביוטכנולוגיה, שהוא המאגר הגדול ביותר הזמין לציבור לנתוני ביטוי גנים. ארכיון זה גדל פי 100 מ-10 טרה-בייט ל-1,000 טרה-בייט בין 2012 ל-2022 וממשיך לגדול באופן אקספוננציאלי ככל שעלויות הרצף יורדות. עבודה זו מספקת כלי קריטי לתרגום שפע הנתונים הזה לתחזיות ספציפיות של האופן שבו גנים פועלים יחד כדי לשלוט בהתנהגות של תאים נורמליים וחולים.

המחקר נתמך על ידי משרד המחקר של הצבא, המכונים הלאומיים לבריאותהקרן הלאומית למדע והמכון לגידול מוחי מלנאטי באוניברסיטת נורת'ווסטרן.

ניקולס