融媒體管理平台 | 點擊收藏 | 設為主頁
首 頁 > 媒體師大 > 正文

《中國科學報》| 唐三一:被誤解的流行病學模型

  編輯:      發佈時間:2021-02-28 12:14:28     部門:數學與信息科學學院    

2月25日,《中國科學報》於第五版刊發了題為《被誤解的流行病學模型》的文章,通過專訪我校數學與信息科學學院唐三一教授,闡釋了在新冠肺炎疫情防控過程中,數學模型預測出現偏差的原因以及公眾對於數學模型預測存在的認知誤區等問題。

測試圖片

在新冠疫情防控過程中,數學模型在病毒傳播機制的刻畫、風險分析、預測預警以及干預措施的制定等諸多公共衞生和傳染病防控的關鍵問題中發揮了重要作用。面對新冠疫情,公眾迫切希望數學模型能夠給出最精確的答案:這場大流行病到底會有多嚴重,發展的會有多快,以及他們應該做些什麼來抵禦災難……當它跟人們預測未來並希望得到一個精確而肯定的答案這一強烈願望牢牢綁定在一起時,誤解、失望隨之而來。伊利諾伊大學厄本納-香檳分校的兩位物理學家Nigel Goldenfeld和Sergei Maslov建立了數學模型指導校園疫情防控工作。可是,2020年秋季學期開學僅一個星期,該校就有將近800名學生被檢測出新冠病毒陽性。Goldenfeld和Maslov立即遭受到了輿論的嚴厲抨擊。

唐三一教授在專訪中分析了數學模型預測出現偏差的原因以及公眾對於數學模型預測存在的認知誤區,並指出數學模型的微妙之處在於:預測結果會影響人羣和決策者的行為,反過來就會影響疫情的發展,最終使得預測結果出現“偏差”。這種“偏差”反而證明了數學模型在早期新冠疫情的預警和風險分析中具有非常重要的作用。

報道鏈接://news.sciencenet.cn/sbhtmlnews/2021/2/360918.shtm

全文如下:

被誤解的流行病學模型

本報記者 胡珉琦

在逐漸升温的初春,國內新冠肺炎疫情形勢再次恢復平穩。但對流行病學建模研究專家而言,他們的工作遠沒有結束。

不久前,陝西師範大學數學與信息科學學院院長唐三一和西安交通大學數學與統計學院副院長肖燕妮正在對去年下半年來疫情反覆波動的動力學機制進行模型分析,融合干預措施和疫苗接種以及民眾行為改變的動態過程,研究避免疫情再次暴發的關鍵因素。

如果不是因為這場疫情,很少有普通人會主動關心什麼是傳染病的基本再生數(R0),也很難想象,數學模型會在病毒傳播機制的刻畫、風險分析、預測預警以及干預措施的制定等諸多公共衞生和傳染病防控的關鍵問題中發揮重要作用。

可是,當它跟人們預測未來並希望得到一個精確而肯定的答案這一強烈願望牢牢綁定在一起時,誤解、失望隨之而來。

數學模型真的失效了?

伊利諾伊大學厄本納-香檳分校的兩位物理學家Nigel Goldenfeld和Sergei Maslov在去年3月份加入到了COVID-19的建模工作中,當時,公眾迫切希望數學模型給出精確的答案:這場大流行病到底會有多嚴重,發展的會有多快,以及他們應該做些什麼來抵禦災難……

在最初幾個月裏,他們的模型促使其所在大學在春天迅速關閉了校園並過渡到在線教育,這一工作也獲得了媒體的積極評價。後來,研究團隊又建立了一個新的模型來指導校園重新開放的過程。

Goldenfeld和Maslov在設計模型時儘可能考慮了各種因素。學生在不同地點的各種互動方式——學習、吃飯、放鬆、聚會等;估計了校園內檢測和隔離服務的效果能有多好;估算了學生人羣中無症狀但是能傳播病毒的人數百分比;他們甚至細緻到在模型裏額外考慮了氣溶膠傳播的這一物理過程。他們的模型能分析出當一個戴口罩的學生在教室裏説話或者在室內娛樂場所大喊大叫時,可能會釋放出多少帶病毒的氣溶膠粒子。

在這個模型的指引下,伊利諾伊大學還制定了一項計劃:每週對所有學生進行兩次新冠病毒檢測,要求學生戴口罩,並實施其他後勤方面的措施和控制,包括使用有效的接觸追蹤系統和“一旦自身與陽性患者有密切接觸就提醒通知”的手機應用程序。

模型計算結果顯示,採取了這套組合政策就能恢復面對面的線下學習,而不會讓病毒的傳播失控。

可到了9月3日,秋季學期開始僅一個星期,伊利諾伊大學就有將近800名學生被檢測出新冠病毒呈陽性,這一人數已經比模型預估的到感恩節時感染的人數還要多。於是,學校不得不立即宣佈在整個校園內暫停非必要的活動。

輿論很快開始嚴厲抨擊Goldenfeld和Maslov。面對媒體和公眾的質疑,他們既委屈,卻又無力反駁。

在Quanta Magazine讀到這兩位同行的故事時,唐三一有種惺惺相惜的感覺。

回想1月26日,唐三一所帶領的團隊聯合肖燕妮團隊、加拿大吳建宏團隊發表在Journal of Clinical Medicine上的研究結果顯示:COVID-19傳播早期的基本再生數(R0)為6.47,傳播力遠大於2003年的SARS(R0為3.6)。這是世界上較早建立新冠傳播動力學模型,發佈預測結果的幾項研究之一。可是,這個估值比當時包括WHO在內的組織或團隊公佈的2.2要高出許多。

“錯了怎麼辦?引起輿情怎麼辦?”新冠疫情期間,唐三一和合作者每投出一篇敏感的模型預測文章,都如履薄冰。

直到1月29日24點,模型預測報告病例數為7723例,實際全國報告病例數7711;2月7日,WHO通過分析中國約1.7萬例患者數據後指出,新冠傳染性遠高於SARS……唐三一開始確信,模型預測結果與實際情況比較一致。

但只有真正從事流行病學模型研究的科學家知道,例如預估R0值究竟是5還是6,要得到精準的計算是非常困難的。“重要的是,新冠病毒的傳染性真的很強,科學家已經把一個沉重的風險預警擺在面前了,我們該採取什麼樣的應對措施。”唐三一告訴《中國科學報》。

試圖得到一個精確的數據結論,模型是會令人失望的。期望和失望,在新冠疫情模型預測工作中,一直都在“打架”。在肖燕妮看來,原因並非模型真的失效,而是模型預測所能起到的作用經常被誤解。

難以抵擋的不確定性

“所有的模型都是錯誤的,但有一些是有用的。”著名統計學家喬治·博克斯對數學模型的闡釋,很容易讓人不知所措。

唐三一解釋,數學模型的本質是對一個系統問題抽象而又簡潔的刻畫。正因如此,它勢必會忽略一些因素。有時候,這些因素並不會導致模型計算結果與真實世界偏離太遠,可有時候,一個小小的參數變化,可能會引發“蝴蝶效應”。

數學模型在預測新冠肺炎早期疫情的傳播風險時,主要體現在確定傳播風險(基本再生數或有效再生數)、達峯時間、峯值等與疫情相關的技術指標,後期則是評估“封城”、密切跟蹤隔離、檢測和檢出、復工等重大防控策略的有效性、時效性和二次暴發的風險等。

“從理論上來説,模型確實能做到對疾病發展過程的解釋功能和對未來趨勢的預估功能,但結果的不確定性卻很大。”肖燕妮表示,不確定性主要受兩類因素的影響。

首先是流行病學的因素。“烈性傳染病暴發早期,我們對疾病機理嚴重缺乏瞭解,連最基本的病毒潛伏期是多少、潛伏期有沒有感染力都不知道。而且,由於檢出率、確診率低,早期數據信息也十分匱乏。因此,這些跟疾病特徵相關的基本參數都需要基於假設。”

肖燕妮説,隨着對疾病機制瞭解的深入,以及數據信息的不斷獲取,對傳播動力學的估計會趨向準確。此後疫情發展的走向很大程度就取決於控制措施,以及控制措施下人們行為的依從性和行為的改變力度。因為防疫部門的執行力以及社區與個體的依從性是圍堵與緩疫策略發揮有效作用的重要保障。

“然而,對人的行為進行量化和分析從而納入模型,是更為困難的一件事。”肖燕妮坦言,在模型假設框架下,目前對所有的傳染病而言都是一樣的。“因為人總是在理性和非理性之間搖擺,又受到政策、文化的影響,在時間和空間層面,表現出不斷變化的特點。”總而言之,人的行為本身具有難以預測性。

就如同Goldenfeld和Maslov,他們考慮了學生如何行事的諸多可能性,但偏偏沒有預料到有人會在測試結果為陽性並被告知自我隔離的情況,仍然不管不顧地參加聚會。少數學生視規則為無物的非理性行為足以讓一個精心設計的模型一敗塗地。

“但我們又不能寄希望於建模專家把所有可能的情況都納入模型,這會使得模型過分臃腫,不堪重負。”

肖燕妮想要強調的是,所有的模型預測都是在有限條件下做出的,給出“如果……就會……”的結果。條件一旦發生變化,結果也就隨之改變。

“當絕大部分公眾甚至決策者忽略模型框架、機制、參數、假設條件,一味看重那個輸出的數字是否準確,這大大超越了模型所應承受的期待。”

數學模型能做什麼

可以説,模型預測通常是附有假設條件的推演預判,而為之努力的科學家彷彿是一羣帶着鐐銬工作的人。即便如此,他們仍然可以發揮很大的作用。

2020年3月中旬,倫敦帝國理工學院的一個研究小組宣佈:他們基於個體的隨機模型預估新冠將導致英國的死亡人數達到50萬人,美國的死亡人數將達到220萬人。

可在早期,英國的病死率統計數據並不像帝國理工學院模型預估的那麼悲觀,二者的差異導致他們被指控發表聳人聽聞的結果,招致公眾在某種程度上的不信任。

“要了解COVID-19模型的價值,關鍵是要知道它們是如何建立的,以及它們是建立在哪些假設之上的。”英國流行病學家Neil Ferguson解釋。

事實上,這個估計結果的前提是全社會對之完全沒有反應不採取任何行動。因此,模型預估的是最壞的情形。而英國和美國也立即採取了相應的措施。

“模型的微妙之處在於,預測結果會影響人羣和決策者的行為,反過來就會影響疫情的發展,最終使得預測結果出現‘偏差’。”唐三一認為,這種“偏差”未必是負面的,反而證明了,數學模型在早期新冠疫情的預警和風險分析中具有非常重要的作用。

再比如,去年春節國內通過近20天各地市的嚴格防控,全國的新報告病例數呈現下降趨勢。於是,春節後的復工和復學提上了日程。傳染病預防控制與決策部門高度關注的核心問題是:武漢及周邊疫情嚴重的地區何時復工及復工的最佳時間是什麼?早復工對疫情特別是武漢及周邊主要城市疫情的影響是什麼?

為了回答這些問題,為決策部門提供何時復工等重要決策依據,唐三一和肖燕妮等團隊收集了湖北省衞健委和國家衞健委官網上報道的全國以及湖北各地市的疫情數據、百度遷徙網站人口流動數據,以及春運期間武漢人口遷入和遷出趨勢和流入到湖北其他地市的人口分佈情況。基於新冠疫情傳播與控制模型框架,發展以武漢為中心的複雜網絡模型,通過統計計算與參數估計確定網絡模型未知參數,分析武漢及周邊15個疫情嚴重地區復工的最佳時間,從而評估了早復工對這些地區疫情發展特別是二次暴發風險的影響。

當時的結論顯示,3月2日以後復工再加上較強的防控措施將不會引起疫情的二次暴發,但如果早於這個時間二次暴發的風險較大。最終,湖北省是從3月10日開始逐步解封的。

回溯去年疫情期間中外科學家就新冠模型研究的種種實踐,唐三一坦言,國內科學家預測成功的可能性更高。但這有個重要的前提。

“國內在進入嚴格的疫情管控期後,產生的數據質量非常高,例如病例輸入、症狀出現、首次就診、隔離和確診的精確時間,以及精確到個人的生活軌跡跟蹤等等,這為詳細、精準分析疫情和防控策略的有效性提供了可能。”唐三一尤其強調,精準詳實的數據對增強模型的預測評估能力至關重要。

然而,國外科學家就沒有那麼幸運了。“在檢測率和確診率都無法精確計算的情況下,這些基礎數據需要被人為放大,可關於‘放大多少倍’,就足夠纏住科學家一陣子了。”肖燕妮表示。

上一篇:《教師報》:孜孜“數學人”,追逐正無窮
下一篇:微言教育:為造血式扶貧作出更多貢獻!看陝西師範大學扶貧故事《守望滇情》

相關文章

讀取內容中,請等待...
師大首頁 | 學校辦公室 | 宣傳部 | 紅燭網 | 圖書館 | 為學網 | 後勤集團