שכבות גיל ומטריצות אינטרקציות

שכבות גיל ומטריצות אינטרקציות

זהו פוסט נוסף בבלוג בו אתאר מודלים מתמטיים להתפשטות מגפות, ואבחן אותם מול נתונים מהארץ ומהעולם. הפוסטים מסתמכים אחד על השני, לכן אם לא קראתם את הקודמים, מומלץ להתחיל מההתחלה. כאן המקום לסייג – איני אפדימיולוג ואני לא עוסק כמומחה במתמטיקה אפדימיולוגית. כל פרשנות לנתונים או ציטוט שלהם על אחריות הקוראים בלבד.

הקדמה – חלוקה לקבוצות

מודל ה-SIR הבסיסי מסתכל על כל האוכלוסייה כמקשה אחת.  זו ללא ספק הפשטה של המציאות, אבל זו הפשטה מוצלחת במובן שהיא מובילה למודל פשוט שעדיין מתאר תופעות מרכזיות כמו גידול אקספוננציאלי, חסינות העדר ואת תפקיד מקדם ההדבקה.  עם זאת, כדי לענות על שאלות יותר כמו ׳מה ההשפעה של סגירת בתי ספר?׳ או ׳מה ההשפעה של בידוד קבוצות אנשים בסיכון גבוה?׳ יש צורך  להסתכל על קבוצות שונות באוכלוסייה.  החלוקה המינימלית היא לשתי קבוצות – לדוגמא, עבור שתי השאלות הנ״ל, ניתן להתייחס לקב׳ הילדים ויתר האוכלוסייה או לקב׳ האנשים בסיכון נמוך וגבוה.  אחד הפוסטים הקודמים עסק בחלוקה כזו לשתי קבוצות והדגים איך ניתן לענות על שאלות כמו ׳מה ההשפעה של אי-ציות להנחיות?׳ בעזרת חלוקה כזו.

רעיון החלוקה לשתי קבוצות ניתן, כמובן, להרחבה למספר גדול יותר של קבוצות.  חלוקה כזו יכולה להתבצע על בסיס גיל, גיאוגרפיה, חברה (יהודים חילונים/דרוזים/..), מצב בריאותי (מחלות רקע), התנהגות (ציות, רציונליות) ועוד.  קבוצות הגיל משחקות תפקיד מרכזי בהתפשטות מגפות.  לדוגמא, הסיכוי של אדם מעל 65 להתאשפז בשל סיבוכי שפעת עונתית גדול פי 100 ויותר מסיכויי האשפוז של אדם עד גיל 50.  מצד שני, לילדים, דרך מערכת החינוך, יש תפקיד מרכזי בהתפשטות השפעת העונתית.  בקורונה, באופן דומה הסיכוי לסיבוכים – אשפוז, הנשמה, מוות – גדל בצורה חדה מעל גיל 70.  בשונה משפעת עונתית, יש אינדיקציות שילדים נדבקים ומדביקים פחות ונראה שהתרומה של פעילות מערכת החינוך היסודית להתפשטות המגפה היא לא גבוהה. בהתאם, מודלים אפידמיולוגיים שרוצים להתייחס לשאלות כמו עומס על מערכת הבריאות, השפעה של השבתת מערכת החינוך, התייחסות לגיל השלישי ועוד, כוללים חלוקה לקבוצות גיל.

חלוקה לקבוצות גיל

פוסט זה יתמקד בהרחבה לקבוצות גיל והצגת מטריצות האינטראקציות שצצות בהרחבה כזו.  מודלים רבים מתייחסים ל 16 קבוצות גיל – קבוצת גילאים 0-4, 5-9,  10-14, וכן הלאה עד קבוצת גילאים 70- 74 וקבוצה אחרונה 75+.  באופן כללי אפשר לדבר על \(n\) קבוצות.  אם במודל SIR בסיסי, המשתנים \(S,I,R\) תיארו את כלל המועדים, הנדבקים והמחלימים באוכלוסייה, בהתאמה, עכשיו לכל קבוצה בנפרד יהיו משתנים \(S_{i},I_{i},R_{i}\) שמתארים את מספר המועדים, הנדבקים והמחלימים בקבוצה \(i\).

נסתכל עכשיו על קצב ההדבקה.  ניזכר שבמודל SIR הבסיסי השינוי במספר המועדים שווה למינוס קצב ההדבקה וניתן ע״י הביטוי

$$S'(t)=-\beta S(t)I(t) $$

כאשר \(\beta\) הוא מספר האנשים הממוצע שנדבק מדביק ביום כאשר הוא מוקף רק במועדים.  הפרמטר \(\beta\) עצמו תלוי באנשים בממוצע נמצאים במגע עם הנדבק ומה הסיכוי שמגע יוביל להדבקה.  ניתן לרשום אותו בצורה

$$\beta=\beta_s c$$

כאשר \(c\) הוא מספר המגעים הממוצע ו \(\beta_s\) הוא הסיכוי להדבקה במגע בודד.

במקרה של קבוצות, הביטוי נהיה מורכב יותר. נסתכל על קצב ההדבקה של מועדים בקבוצה ה \(i\). כל אדם בקבוצה זו יכול להידבק מנדבקים מכל אחת מקבוצות האחרות, לכן ביטוי מקבל צורה

$$S_i'(t)=-\beta_s(c_{i1} I_1+c_{i2}I_2+…c_{in} I_n)S_i $$

כאשר \(c_{ij}\) הוא מספר המגעים הממוצע בין אדם בקבוצה \(i\) לאדם בקבוצה \(j\), ותחת ההנחה שהסיכוי להדבקה במגע בין אנשים אחיד לכל הגילאים.
באופן דומה, נקבל ביטוי לקצב ההדבקה לכל הקבוצות \(i=1,2,\cdots,n\)

$$\begin{eqnarray}S_1'(t)&=-\beta_s(c_{11} I_1+c_{12}I_2+…c_{1n} I_n)S_1\\
S_2'(t)&=-\beta_s(c_{21} I_1+c_{22}I_2+…c_{2n} I_n)S_2\\
&\vdots\\
S_n'(t)&=-\beta_s(c_{n1} I_1+c_{n2}I_2+…c_{nn} I_n)S_n
\end{eqnarray} $$

קיבלנו אם כן \(n^2\) איברים מהצורה \(c_{ij}\) שמתארים את מספר המגעים הממוצע בין אדם מקבוצה \(i\) לאדם בקבוצה \(j\), שניתן לסדר בטבלה או מטריצה. זוהי מטריצת האינטרקציות.

הערת ביניים: מחקרים חדשים תומכים בכך שהסיכוי של ילד להידבק נמוך מהסיכוי של מבוגר להידבק, כלומר הסיכוי להידבק תלוי גיל \(\beta_s=\beta_s(i)\). באופן דומה, גם הסיכוי של ילד להדביק נמוך מהסיכוי של מבוגר להדביק, כלומר יש לתקן את הביטוי כך ש \(\beta_s=\beta_s(i,j)\) ותתקבל מטריצה נוספת.  הרחבה זו יכולה להיות משמעותית בתיאור תרומת מערכת החינוך להתפשטות המגפה. עם זאת, לטובת פשטות ההצגה, לא אעסוק בה.  לפרטים נוספים לגבי מחקר הדבקת והידבקות ילדים, ראו שקפי הרצאה של פרופ׳ יאיר גולדברג, טכניון, שעסק במחקר הזה.

איך מאכלסים את מטריצות האינטרקציות?

עד כאן הצגתי הרחבה של מודל ה SIR בה מסתכלים על כל האוכלוסייה כמקשה אחת למודל בו מסתכלים על קבוצות הגיל השונות באוכלוסייה.  בדרך נוספו עוד פרמטרים שמתארים את האינטרקציה בין קבוצות הגיל השונות.  בתיאור מקובל של 16 קבוצות גיל, נוספו 256 פרמטרים \(c_{ij}\) שמסודרים בצורת טבלה או מטריצה.  כמו בהרבה מקרים, קל לרשום את המשוואות, קשה יותר לאכלס את טבלאות הנתונים.  צריך עכשיו לעסוק בשאלות כמו מה מספר האינטרקציות הממוצע בין נער בן 15 לאדם בן 38.  איך עושים את זה?

ב-2004 , כנראה בהשפעת התפרצות ה SARS, האיחוד האירופאי החל במימון פרוייקט מחקר בשם POLYMOD שמטרתו (בתרגום חופשי) ׳שיפור מדיניות בריאות הציבור באירופה באמצעות מידול והערכה כלכלית של התערבויות לבקרת מחלות זיהומיות׳. נשמע כמו משהו שעשוי להיות שימושי כעת, לא?  הפרוייקט החל לבחון מודלים של SIR עם קבוצות גיל ונתקל באותו קושי של אכלוס מטריצת האינטרקציות.  הפרוייקט שם לו ליעד לאסוף נתונים ולאכלס את הטבלאות האלו, ואכן בעזרת סדר גודל של 40,000 שאלונים שמולאו בשמונה ארצות אירופאיות נותחו המגעים הבין-אישיים ונבנו מטריצות אינטרקציות.  המידע שנאסף במחקר הזה הוא הבסיס, במקרים רבים, למטריצות אינטרקציות שמשתמשים בהם במודלים ברחבי העולם.

רגע, מודלים ברחבי העולם מתבססים על מידע מאותן שמונה ארצות אירופאיות? לא – מחקרים מאוחרים יותר עסקו בהתאמת מטריצות האינטרקציה לעשרות רבות של מדינות, כולל ישראל, תוך שימוש בנתונים דמוגרפיים של כל מדינה וכן גודל משק בית, השתתפות בכוח עבודה, יחס תלמידים-מורה בכיתה ועוד, ראו תמונה מצורפת.

Projection of contact matrix
תהליך הטלה של נתונים מ POLYMOD למטריצת אינטרקציה ספיציפית למדינה.  תמונה הותאמה מ https://doi.org/ 10.1371/journal.pcbi.1005697.

איך נראית מטריצת אינטרקציות?

נתוני המגעים שנאספו בפרוייקט ה POLYMOD סווגו למקורות שונים – בית, עבודה, לימודים ואחר.  התוצאה היא ארבע מטריצות אינטרקציה שסכומם שווה למטריצת האינטרקציות הכוללת.

ניתן לראות בגרפים המצורפים דוגמאות טיפוסיות של מטריצות אינטרקציה, כאשר צבע כהה מסמל מספר מגעים גדול וצבע לבן אפס מגעים.  המטריצה (a) מתארת מגעים שמקורם בבית.  ניתן לראות אלכסון ראשי דומיננטי שמשמעו נטייה של אנשים לגור או לארח אנשים בגיל דומה להם.  שני האלכסונים המשניים בפער של כ 25-30 שנה נובעים מאינטרקציה בבית עם הילדים או עם הסבים והסבתות.  המטריצה (d) מתארת מגעים שמקורם בעבודה.  ניתן לראות שכעת האינטרקציות מוגבלות רק לגילאי העבודה 20-65.  האינטרקציות די שטוחות בטווח הגילאים הזה, עם דומיננטיות חלשה של האלכסון בשל נטייה של אנשים בגיל דומה להתחבר, לדוגמא, בזמן הפסקות.  מטריצת המגעים (g) שמקורם בבי״ס שונה מאוד – כאן יש אלכסון בגילאי בי״ס עם מעט אינטרקצייה מחוץ לשכבת הגיל שנובעות בעיקר ממגע עם מורים. לבסוף, המטריצה (j) מתארת מגעים שמקורם אינו בבית, בעבודה ובבי״ס.  לדוגמא, בפעילויות ספורט, בתי כנסת, מסעדות וכו׳. המטריצה הזו שטוחה יחסית שמשמעה פיזור של המגעים בין כל שכבות הגיל.

Interaction matrices
דוגמאות למטריצות אינטרקציה למגעים ממקורות שונים.   תמונה הותאמה מ https://doi.org/ 10.1371/journal.pcbi.1005697.

בחינת צעדי מדיניות תוך שימוש במטריצות האינטרקציות 

השימוש במטריצות אינטרקציות מאפשר לבחון יישום צעדי מדיניות שונים במודל. לדוגמא, סגירת בתי ספר מיושמת על ידי הפחתת המגעים שמקורם בבית-ספר ממטריצת האינטרקציות הכוללת.  ירידה ספונטנית של פעילות הציבור בשל מודעות למגפה תתבטא קודם כל בהפחתת מגעים שמקורם אינו בלימודים, בי״ס ובית שנובע מכך שבשלבי התפשטות ראשונים ועוד לפני שסוגרים את מערכת החינוך או מטילים מגבלות על המשק, אנשים נוטים להסתגר והולכים פחות לקניונים או מסעדות. הירידה הזו יכולה להיות משמעותית – אין לטעות בצבעים החיוורים של מטריצת המגעים ה׳אחרים׳ – סה״כ המגעים בכל שורה ועמודה הוא גדול.

לבסוף, באמצעות מטריצות האינטרקציות ניתן להעריך את תרומת צעדי ההתערבות לריסון המגפה.  ניתן, לדוגמא, לחשב את מקדם ההדבקה במערכת עם מטריצת אינטרקציות שהופחתו ממנה מגעים שמקורם בבתי ספר ובכך להעריך את תרומת מערכת החינוך להתפשטות המגפה.  בבדיקה ראשונית כזו, חישוב שלי כזה הראה שסגירת מערכת החינוך מפחיתה בכ 8% את מקדם ההדבקה.  עם שקלול מחקר גרטנר לגבי הדבקת והידבקות ילדים, התרומה צנחה ל 4%-3% בדומה לנתונים אמפיריים שנאספו ב 11 ארצות באירופה.

אילו עוד רכיבים נכנסים למודל ומה עוד חסר?

החלוקה לשכבות גיל היא הבסיס למודל, אך במודלים רבים נכנסים עוד רכיבים. לדוגמא, המודל שמשמש את הסימולטור מכיל רכיב שמתייחס למהלך המגפה – מתי נדבק הוא גם מדבק ובאיזה היקף, מתי ובאיזו הסתברות מופיעים סימפטומים ובאופן דומה מתי ובאיזו הסתברות ממשיכים לאשפוז, הנשמה, וכו׳.  הסתברויות אלה מושפעות ממחלות רקע ובהתאם בכל קבוצת גיל יש תת-קבוצות שמתייחסות לרמות סיכון.  באופן דומה, בכל קבוצת גיל יש תת-קבוצות שמתייחסות גם לרמות ציות, על מנת לקחת בחשבון אי-ציות במודל.  במודל משתלב רכיב נוסף שמתייחס לאיתור ובידוד – כלומר לתהליך שבו מאתרים את מי שהיו במגע עם נדבק מאומת ומכניסים אותם לבידוד.

כל מודל הוא קירוב של המציאות, בשאיפה כזה שמשקף טוב ככל הניתן את הידע לאותה נק׳ זמן, ותמיד ניתן לשלב במודלים רכיבים נוספים.  עם זאת, צריך לזכור שכל רכיב שמשתלב במודל כולל איתו פרמטרים נוספים (ראו ערך מטריצת האינטרקציות) שאם אין דרך טובה להעריך אותם יכול לגרום ליותר נזק מתועלת.  תהליך מידול הוא תהליך של איזון בין תיאור נאמן לעודף פרטים כאשר תהליך האיזון מושפע מהשאלה שרוצים לענות עליהם.  ברוב המקרים, המודל המוצלח הוא דווקא המודל המינימליסטי שמספק את התשובה לשאלה על הפרק.  אחרי ההקדמה, רשימה חלקית של רכיבים נוספים כוללת טיפול בתופעת מדביקי העל (לדוגמא, מצב בו 10% מהנדבקים אחראים ל 90% מההדבקות), רכיבים שמטפלים בתגובה דינמית של הציבור שמגיב לדוגמא לעלייה בתחלואה ע״י הקפדה על ריחוק חברתי (ולהיפך), רכיבים גאוגרפיים, ועוד.