編者按:
中共中央總書記、國家主席、中央軍委主席、中央全面深化改革委員會主任習近平2月14日下午主持召開中央全面深化改革委員會第十二次會議并發表重要講話指出,要鼓勵運用大數據、人工智能、云計算等數字技術,在疫情監測分析、病毒溯源、防控救治、資源調配等方面更好發揮支撐作用。
陳金雄主任針對新冠肺炎(NCP)診斷依據調整引起的確診病例數據的變化,結合大數據技術流派進行深入解讀,深刻揭示在此次疫情防控和防治中,大數據和AI到底如何發揮作用。
HIT專家網從1月24日除夕之日即啟動和持續開展“抗擊疫情”系列報道,在HIT業界產生強烈反響。此刻,衛生信息人雖然不是白衣戰士,但正與白衣戰士并肩作戰。他們既有醫院信息部門,也有HIT企業員工。我們從中感受到衛生信息人的堅韌與實干,感受到醫療信息化行業眾志成城的磅礴力量!

這段時間,我想大多數國人每天早上睜開眼睛,第一件事就是打開手機,第一時間了解疫情的情況。盡管大家心理上可能都有預感,但2月13日發布的數據還是令人震驚。 2月12日0時-24時,湖北省新增冠狀感染肺炎(NCP)病例14840例。這14840例新增病例中,有13332例是臨床診斷病例,占了絕大多數。那么,到底什么NCP的臨床診斷病例,這背后又蘊含著什么樣的原理,本文就從大數據角度進行分析。
目前NCP確診的兩種方式
一是核酸檢測病例。在此之前,核酸檢測是NCP確診的“金標準”,核酸檢測為陽性的就是確診病例。如果核酸檢測為陰性,即使其它各種特征包括影像學檢查非常明顯,也只能作為疑似病例,無法作為確診病例。
但核酸檢測存在一定的問題,主要是試劑短缺、存在假陰性、有檢測資質的機構較少以及實驗室條件要求高等,都在影響新冠肺炎病人的確診。潛在感染者的防控措施如果不能及時到位,就無法從根本上切斷傳染源。
二是臨床診斷病例。臨床診斷病例=疑似病例+影像學檢查,不再需要核酸檢測。
針對核酸檢測存在的那些問題,臨床一線專家呼吁,用影像學診斷取代核酸檢測,成為NCP確診的依據。據傳最早提出這一主張的是武漢中南醫院一線影像醫生張笑春。她通過自己的微信朋友圈呼吁:別再迷信核酸檢測了,強烈推薦CT影像作為2019-nCoV (新型冠狀病毒) 肺炎的主要依據。

1月30日,中國研究型醫院學會感染與炎癥放射學專委會和中國醫師協會放射學分會感染影像專委會等單位聯合發布了《新型冠狀病毒肺炎影像學診斷指南(2020 第一版)》,該指南由法定傳染病醫學影像學專家、高博醫療集團顧問專家李宏軍教授領銜的專家團隊負責制定。
針對湖北防疫的實際情況以及專家的意見,《新型冠狀病毒感染的肺炎診療方案(試行第五版)》在湖北省的病例診斷分類中增加了“臨床診斷”,以便患者能及早按照確診病例接受規范治療,進一步提高救治成功率。湖北以外的其他省市自治區依然采用核酸檢測作為NCP確診的唯一依據。2月12日,湖北省終于全面將臨床診斷作為NCP確診的依據之一。
人工智能的兩大技術流派
NCP這兩種診斷方式讓我想起了人工智能的兩大主要技術流派。
一是知識驅動方法。也稱演繹推理方法,專家制定規則,小數據大智能。這種方法是基于因果關系,由從“前提”的已知事實,“必然地”得出結論的推理。采用符號邏輯的辦法來表達知識,實現推理技術的工程化成為其主要技術內容。語義技術(Semantic Technology)與知識圖譜(Knowledge Graph)可以被看作廣義的演繹推理的工程化技術。
二是數據驅動方法。也稱歸納推理方法,機器學習規則,大數據小智能。這種方法是基于大數據的普遍化或歸納普遍化,是從關于樣本的前提到關于總體的結論的過程。機器學習(Machine Learning)可以被看作廣義的歸納推理的工程化技術,包括基于神經網絡模型的深度學習(Deep Learning)技術[1]。
邏輯推理能力是人類特有的本領,給出原因,我們能夠通過邏輯推理得到結果。在過去,我們一直非常強調因果關系,一方面是因為我們常常是先有原因,再有結果,另一方面是因為如果我們找不出原因,常常會覺得結果不是非常可信。而大數據時代,大數據思維要求我們從探求因果聯系到探索強相關關系[2]。
對照NCP的兩種確診方式與人工智能的兩種技術方法,顯然核酸檢測屬于演繹推理的知識驅動方法,臨床診斷屬于歸納推理的數據驅動方法。
在有確切的因果關系的情況下,肯定要優先考慮采用演繹推理的方法,由核酸檢測陽性這個“因”得出NCP病例這個“果”。但當因果關系在短期內還不完全成立的情況下,大數據方法無疑是可替代的一種方式。這也是為什么此次NCP確診方式接受臨床診斷方法的主要原因,但只限于疫情嚴重的湖北省,湖北以外的省市自治區依然把核酸檢測作為NCP確診的唯一依據。
當然大數據作為確診依據是有條件的,大數據通常要具備5V特征,即大量化(Volume)、多樣化(Variety)、快速化(Velocity)、價值度(Value)和準確性(Veracity)。吳軍在《智能時代》一書中進一步闡述大數據要具備數據量大、多維度、全面性等要素,數據的維度和全面性有時比數據量大還重要,只有具備足夠維度和更加全面的數據,大數據才能更好發揮作用。
疫情防控,大數據和AI如何發揮作用
那么,在此次疫情防控和防治中,大數據和AI到底如何發揮作用?我認為可以重點從以下幾個方面去考慮。
一是在臨床診斷方面。由于影像學診斷在NCP確診方面起主導作用,而影像AI又是醫學AI中發展最成熟的領域,因此影像AI無疑是最能發揮作用的。
在此次疫情防治過程中,不少企業和醫療機構適時推出影像AI解決方案,發揮了不小的作用。據報道,武漢同濟醫院、武漢協和醫院中南醫院等疫區一線醫院與企業進行合作,上線NCP影像輔助診斷產品,幫助醫生在沒有分子診斷的條件下進行決策,給出建議,并通過疫區的高度疑似新冠肺炎患者的典型數據來訓練和優化模型,不僅敏感性非常高,特異性可以達到80%-90%。
1月28日,上海市公共衛生臨床中心上線新型冠狀病毒性肺炎智能影像評價系統。該系統采用創新的人工智能全肺定量分析技術為臨床專家提供基于CT影像的智能化新型冠狀病毒性病灶定量分析及療效評價等服務,更為高效、準確地為臨床醫生提供決策依據,助力疫情防控。
如果有足夠高質量的影像數據訓練的話,AI可以更大程度配合影像專家,承擔大部分影像診斷工作,無疑可以極大提高效率和防治能力。
二是在臨床分型方面。NCP診療方案(試行第五版)根據是否有臨床癥狀、是否有肺炎、肺炎的嚴重程度、是否出現呼吸衰竭、休克、有無其他器官功能衰竭等分為輕型、普通型、重型和危重型,不同類型的病例處理方式是不一樣的。
據中國科學院院士、解放軍總醫院第五醫學中心感染病診療與研究中心主任、國家感染性疾病臨床醫學研究中心主任王福生教授介紹,新型冠狀病毒肺炎是一種急性自限性的疾病,也就是有的輕癥病人,肺部病變不嚴重,免疫力又比較好,通過自身抗病毒的能力,很快可以把病毒控制,不經過治療可以自己好。當然其他重癥病例通過治療才能恢復,也就是 “自愈”加上“治愈”。
如果能夠通過大數據把病例進行臨床分型,把找到輕型自限性的病例,這部分病例完全可以單獨隔離觀察和必要的簡單治療,可以極大提高醫療資源的利用率。
三是在基因檢測方面。大數據和AI算法可以有效提升基因檢測效率,浙江省疾控中心上線自動化的全基因組檢測分析平臺,利用阿里達摩院研發的AI算法,可將原來數小時的疑似病例基因分析縮短至半小時,大幅縮短確診時間,并能精準檢測出病毒的變異情況。百度大腦將病毒全基因系列組結構預測從55分縮短至27秒。
四是在病毒追溯方面。1月24日,北京大學工學院教授朱懷球團隊在bioRxiv預印版平臺發表《深度學習算法預測新型冠狀病毒的宿主和感染性》一文。在對2019新型冠狀病毒的宿主研究和預測中,通過構建VHP(病毒宿主預測)算法模型,將已經提取的新型冠狀病毒的基因組,與已有病毒基因數據庫做數據檢索和對比,實現新型冠狀病毒自然宿主的尋找和預測。通過對VHP模型計算的結果分析,篩選的病毒宿主包括犬、豬、貂、龜和貓。研究人員經過分析比較后認為水貂的病毒的傳染性模式更接近新型冠狀病毒。
五是在疫情防控方面。AI算法在精準防疫以及幫助縮短病例確診時間可以發揮重要作用。防控疫情,需要更精準全面地掌控疫情信息,疫情排查上報數據管理平臺,助力精準施策有效管控。
浙江省依托大數據優勢,利用“大數據+網格化”的方法研判疫情,利用大數據分析出人群聚集熱點分布、人群跨區域流動等信息,提前預測疫情發展趨勢,指導醫療資源的合理調度。同時,通過數據回溯分析,相關部門可以盡早發現疑似病患、密切接觸者,有助于及時隔離、切斷傳染源。
另據報道,在寧波,通過對公共視頻比對,找到了一位肺炎確診患者的患病過程:該患者在雙東坊菜場買菜時與另一位確診肺炎的路人在同一攤位有過短暫(約15秒)的近距離共同駐留,且兩人均未佩戴口罩。目前,已追蹤到患者5密切接觸者共19人,均已實施集中隔離醫學觀察。而這15秒就成了AI識別的最關鍵15秒。
上面介紹了大數據在疫情防治方面的一些微觀應用。宏觀上,大數據可以發揮更大的作用,比如在應急指揮調度和資源統一調配等。
為了做好疫情防治的大數據應用,建議各醫療機構、各企業通力合作,加強數據共享和科研協作。各級地方衛生行政管理加強領導和引導,做好醫療數據的組織和管理,在確保數據安全的前提下開放給相關企業進行研究和開發,以最快的速度支撐疫情的防治。
國家衛生健康委在2月4日發布《國家衛生健康委辦公廳關于加強信息化支撐新型冠狀病毒感染的肺炎疫情防控工作的通知》,提出要充分發揮信息化在輔助疫情研判、創新診療模式、提升服務效率等方面的支撐作用,希望這些政策能夠得到充分的執行。
參考文獻
[1]黃智生,“醫學知識圖譜”報告
[2]吳軍,《智能時代》
【作者簡介】
陳金雄,醫療信息化長期耕耘者、探索者與布道者,《邁向智能醫療》、《互聯網+醫療健康》與《互聯網+基因空間》主編,電子工業出版社《互聯網+醫療健康》叢書主編。
兼任中國醫藥信息學會電子病歷與電子健康專業委員會主任委員、中國研究型醫院學會醫療信息化分會副會長、中國醫學裝備協會數字醫療技術分會副會長、中國醫院協會信息管理專業委員會常委等職。
先后被《計算機世界》評為推動中國信息化突出貢獻獎,被中國信息化推進聯盟評為中國信息化年度優秀人物和《IT經理世界》評為中國優秀CIO ,被中國IT價值聯盟評為全國最有價值CIO。2009年被美國《信息周刊》評為全球50個優秀CIO。
責任編輯:張旖旎





