מבט נוסף על מקדם ההדבקה ואיך מחשבים אותו
פרופ׳ ניר גביש, הפקולטה למתמטיקה, טכניון
זהו פוסט נוסף שלי בבלוג העוסק במודלים מתמטיים להתפשטות מגפות. פוסטים קודמים זמינים כאן. כאן המקום לסייג – איני אפדימיולוג ואיני מומחה במתמטיקה אפדימיולוגית. כל פרשנות לנתונים או ציטוט שלהם על אחריות הקוראים בלבד.
אני מודה לפרופ׳ רון מילוא ולינון בר-און אשר עוסקים, בין השאר, בשערוך מקדם ההדבקה על עזרה בכתיבת הפוסט.
בסמסטר אביב יינתן קורס ״מודלים מתמטיים בחקר מגיפות״ (198008).
אנחנו מחפשים סטודנטים.ות מצטיינים.ות להרחבת פרוייקט מידול המגפה ומבצע החיסונים. פרטים בסוף הפוסט.
מקדם ההדבקה הוא פרמטר מפתח בתיאור התפשטות המגפה. בהגדרתו – מקדם ההדבקה הוא מספר האנשים הממוצע שאדם מדביק במשך כל תקופת מחלתו. בפועל, מקדם ההדבקה משמש מדד מרכזי לקצב התפשטות והתכווצות התחלואה. גרפים של מקדם ההדבקה הם חלק מכל הערכת מצב ובניית תרחיש. הנה, לדוגמא, גרף של מקדם ההדבקה מתוך תמונת המצב היומית שמפורסמת ע״י משרד הבריאות.

פוסט זה יעסוק במקדם ההדבקה: איך הוא מוגדר, מה הוא אומר ואיך מחשבים אותו?
מקדם ההדבקה הבסיסי ומקדם ההדבקה האפקטיבי
מקדם ההדבקה הבסיסי הוא מקדם ההדבקה בתחילת המגפה. מספר זה תלוי קודם כל בביולוגיה. לדוגמא, מקדם ההדבקה של שפעת עונתית בשנה הוא סביב 1.3, עבור חצבת הוא קרוב ל 18, פוליו כ 6 וכן הלאה. מקדם ההדבקה הבסיסי מושפע גם מרמת האינטראקציות בין אנשים, לדוגמא נצפה להבדלים בהתפשטות מגפה בסביבה כפרית לעומת סביבה עירונית צפופה, או בעת שגרת לימודים למול זמני חופשות במערכת החינוך. באופן דומה, מקדם ההדבקה הבסיסי עשוי להיות מושפע מעונתיות. נהוג לסמן את מקדם ההדבקה הבסיסי ב \(R_0\).
עם התפתחות המגפה, הסביבה של חולה ממוצע מורכבת מיותר ויותר נדבקים או מחלימים, ולכן האפשרות שלו להדביק אחרים קטנה. בהתאם, מקדם ההדבקה קטן עם התפתחות המגפה ועם הצטברות מחלימים. מקדם ההדבקה העדכני שלוקח בחשבון את הצטברות המחלימים והמחוסנים נקרא מקדם ההדבקה האפקטיבי. נהוג לסמן את מקדם ההדבקה האפקטיבי ב \(R, R_t\) או \(R_{\rm eff}\). במודל של קבוצת אוכלוסייה אחת מקדם ההדבקה האקטיבי נתון ע״י הנוסחא
\(R_{\rm eff}=R_0S(t)\)
כאשר \(S(t)\) הוא מספר המועדים היחסי בזמן t (ראו פוסט לפרטים). בזמן אפס, כמעט כל האוכלוסייה מועדת ולכן \(Sֿ(0)\simeq 1\) ו \(R_{\rm eff}\simeq R_0\).
הגרף המצורף בתחילת הפוסט מתייחס למקדם ההדבקה האפקטיבי. באופן דומה, בתקשורת ובפרסומים שונים, ברוב המקרים מתייחסים ל״מקדם הדבקה״ במובן של ״מקדם ההדבקה האפקטיבי״.
חישוב מקדם ההדבקה האפקטיבי
נקודה התחלה טבעית לבירור אופן חישוב מקדם ההדבקה היא לבחון את המשוואות המתארות התפשטות מגפה. אעשה זאת מבלי לצלול לפרטים המתמטיים ומבלי להסביר את פיתוח המשוואה, אני ממליץ לכל המעוניינים לפנות לפוסטים (א׳ וב׳) להשלמת הפרטים הללו.
המשוואה הבאה מתארת את השינוי במספר הנדבקים הכולל
\(\underbrace{I^\prime(t)}_{\large\rm שינוי\, במספר\, הנדבקים\, הכולל}=\underbrace{\frac1d R_{\rm eff}(t) I(t)}_{\large\rm מספר \,נדבקים\, חדשים\, ביום}-\underbrace{\frac1dI(t)}_{\large\rm מספר\, מחלימים\, חדשים \,ביום}\) (*)
כאשר \(I(t)\) הוא מספר הנדבקים (החולים) הפעילים, \(S(t)\) הוא מספר המועדים, \(R_{\rm eff}(t)\) הוא מקדם ההדבקה האפקטיבי ו \(d\) הוא מספר הימים עד להחלמה.
מהביטוי עבור מספר הנדבקים החדשים ביום ניתן לחלץ את מקדם ההדבקה האפקטיבי
\(R_{\rm eff}(t)=\frac{{\Large\{\rm מספר\, נדבקים\, חדשים\}}}{\frac1dI(t)}\)
המכנה מתאר את סך החולים הפעילים חלקי משך המחלה בימים \(d\).
מה המשמעות של הביטוי הזה? הנחת המודל היא שכל חולה במחלה מדבק באופן אחיד במשך \(d\) ימים, כלומר כל יום ממוצה \(1/d\) מפוטנציאל ההדבקה של חולה בודד. לכן, מספר הנדבקים החדשים ביום מסוים הוא יחסי לסך החולים הפעילים חלקי \(d\) באותו זמן. נקרא לביטוי הזה פוטנציאל ההדבקה של החולים הפעילים שתורמים לתחלואה ביום הרלוונטי או פוטנציאל ההדבקה היומי ונקבל כי
\((*)\qquad R_{\rm eff}(t)=\frac{{\Large\{\rm מספר\, נדבקים\, חדשים\}}}{{\Large\{\rm פוטנציאל\, ההדבקה\, של\, החולים\, הפעילים\}}}\)
לדוגמא, אם היום פוטנציאל ההדבקה להיום שקול ל 100 חולים פעילים ומהם נדבקו היום 120 אנשים, אז מקדם ההדבקה הוא 1.2. כל חולה פעיל הדביק בממוצע 1.2 איש.
החישוב בפועל
הנוסחא (*) משמשת לחישוב מקדם ההדבקה האפקטיבי, אך על מנת ליישמה בפועל יש להתחשב בשני גורמים עיקריים:
- פרופיל ההדבקה משתנה לאורך זמן, ולכן זה לא נכון לחשב את פוטנציאל ההדבקה ע״ס ההנחה שהסיכוי שחולה ידביק באופן שווה בכל אחד מימי מחלתו.
- קיימת אי-ודאות לגבי מספר הנדבקים. לא כל החולים מאותרים ויש השהייה מסוימת מרגע ההידבקות לזמן האימות.
נתחיל מטיפול מדויק יותר בפוטנציאל ההדבקה של החולים הפעילים. אדם יכול להידבק מחולה שנמצא בשלבים שונים של המחלה שלו, נסמן ב \(I_{t-1}\) את החולים שנדבקו לפני יום. באופן דומה, נסמן ב \(I_{t-2}\) את החולים שנדבקו לפני יומיים וב \(I_{t-s}\) את החולים שנדבקו לפני \(s\) ימים. פוטנציאל ההדבקה הוא
אחוז ההדבקות שמתרחשות ע״י חולים יום אחרי ההידבקות שלהם מסומן ב \(w_1\). באותו אופן \(w_2\) הוא אחוז ההדבקות שמתרחשות ע״י חולים יומיים אחרי ההידבקות שלהם ו \(w_s\) הוא אחוז ההדבקות שמתרחשות \(s\) ימים לאחר ההידבקות. נהוג לחשוב על הנדבקים החדשים כדור נדבקים חדש, ילדים ונכדים לדורות הנדבקים הקודמים. בהתאם, הפונקציה \(w_s\) המתקבלת נקראת התפלגות זמן הדור ( generation time distribution או gtd) ומגדירה את התפלגות הזמן בין המועד בו אדם נדבק לבין המועד בו הדביק אדם אחר. הצבת הביטוי לפונטציאל ההדבקה בנוסחא (*) נותן את הנוסחא הבאה למקדם ההדבקה (סימן ה \(ֿ\Sigma\) מתאר סכימה עם ערכי \(s\) עולים).

נעבור כעת לטפל באי-ודאות לגבי מספר הנדבקים. היות ומספר הנדבקים מופיע גם במונה וגם במכנה, נוכל להציב בנוסחא כל ביטוי שהוא יחסי לו. לדוגמא, אם בכל יום מאתרים מחצית ממספר הנדבקים, אז נוכל להציב בנוסחא עבור \(R\) את מספר המאומתים החדשים ביום \(D_t\)
\(R=\frac{I_t}{\sum_s I_{t-s}\times w_s}=\frac{D_t}{\sum_s D_{t-s}\times w_s}\)
בפועל, יש השהייה מסוימת בין זמן ההדבקה לזמן האיתור, לכן הנוסחא הנכונה היא
\(R=\frac{I_t}{\sum_s I_{t-s}\times w_s}=\frac{D_{t+\tau}}{\sum_s D_{t+\tau-s}\times w_s}\)
כאשר \(\tau\) הוא זמן ההשהייה, כשבעה ימים. באופן דומה ועם זמן השהייה מותאם, ניתן לחשב את מקדם ההדבקה בעזרת נתוני חולים או נתוני תמותה.
ההשהייה הזו היא הסיבה העיקרית מדוע לא ניתן לחשב את מקדם ההדבקה בזמן אמת. להשהייה של שבעה ימים מאיתור לבידוד, נוספת השהייה של שלושה ימים שנובעת מהחלקה של הנתונים ע״י מיצוע שבועי נע כדי להתגבר על תנודות ורעשים במידע וכן על אפקט סוף השבוע. סה״כ מגיעים ל 10 ימים מהדבקה לתוצאה כאשר מקדם ההדבקה מחושב על סמך מאומתים חדשים.
המסמך הנ״ל של מרכז המידע והידע הלאומי למערכה בקורונה עוסק בחישוב מקדם ההדבקה ומכיל פרטים נוספים על אופן החישוב וההתמודדות עם רעשים והטיות שונות.
מקדם ההדבקה הנמדד מול מקדם ההדבקה בפועל
בסימולציה, מספרי הנדבקים זמינים וניתן לחשב את מקדם ההדבקה האפקטיבי ע״פ הגדרתו המתמטית בכל נקודת זמן. במודל שמכיל קבוצות גיל ופרופיל הדבקה משתנה, מתקבלת נוסחא יותר מורכבת מזו שתוארה בפוסט. העקום הכחול מתאר מקדם הדבקה אפקטיבי שחושב באופן כזה. מקדם ההדבקה בסימולציה הזו מושפע מצעדי סגר או שחרור (אלו מתבטאים בקפיצות או אי-רציפות בגרף) וכן מהחיסונים, תחלואה, וחדירת הואריאנט הבריטי. העקום השחור מתקבל ע״י שחזור תהליך המדידה – מספרי המאומתים הצפויים מחושבים ממספרי הנדבקים לפי פונקציות התפלגות ששוערכו במכון גרטנר מנתונים שונים, הצבת מספרי המאומתים בנוסחא עבור \(R\) והפעלת המיצועים וההזזות השונות בזמן כפי שמתבצע עבור הנתונים בפועל.
חיזוי לעכשיו וחיזוי לאחור
ההשהייה המובנית בין הנדבקים החדשים לזמן האימות שלהם מביאה לכך שמקדם ההדבקה ופרמטרים אחרים של המגפה נמדדים בהשהייה של 10-7 ימים לאחור. ערפל הקרב הזה מהווה אתגר בניהול המגפה. לדוגמא, ניתן להעריך את היעילות של צעדי התערבות רק כעבור 14-10 יום.
יש שתי קבוצות של שיטות שמיועדות להתגבר על הקשיים שנובעים מההשהייה המובנית בבעיה. שיטות של ׳חיזוי לעכשיו׳ nowcasting עוסקות בניבוי המצב הנוכחי, בשונה מהשיטות הקלאסיות שמעריכות מה היה המצב לפני 10 ימים, בדומה לשיטה המתוארת בפוסט הזה. שיטות של ׳חיזוי לאחור׳ backprojecting נועדו לשחזר נתונים כמו מספרי הנדבקים בשבועיים האחרונים על סמך מספרי המאומתים בימים האחרונים. שיטות אלו והדרך בה מודל החיזוי עושה בהן שימוש ראויות לפוסט נפרד.
הפניות ומידע נוסף
מסמכי מרכז מידע והידע הלאומי למערכה בקורונה:
הקוד למודל החיזוי פתוח וזמין כאן.
בסמסטר אביב יינתן קורס ״מודלים מתמטיים בחקר מגיפות״ (198008).
פיתוח מודל התחלואה והחיסונים הוא פרוייקט משותף עם מכון גרטנר והמרכז הישראלי לבקרת מחלות בתמיכה של קרן המדע הישראלית. אנחנו מחפשים כעת סטודנטים.ות מצטיינים.ות שמעוניינים.ות להשתלב בפרוייקט. ניתן לפנות אליי במייל.