中國信通院發布《疫情防控中的數據與智能應用研究報告》
自疫情防控阻擊戰打響以來,大數據、人工智能等數字技術在疫情監測、物資管控、醫療救治、復工復產等方面提供了強大支撐。近日,中國信息通信研究院聯合百度、阿里云、京東云、聯通大數據、電信云公司、北京移動等多家企業共同編寫了《疫情防控中的數據與智能應用研究報告(1.0版)》(以下簡稱《報告》),系統性分析了疫情防控期間以大數據和數據驅動的智能應用為核心的企業優秀實踐經驗。
《報告》梳理了通過公開渠道發布與征集的100余家企業的200余個案例。可以看出,大數據及智能技術的廣泛應用極大提升了疫情防控的組織和執行效率,優化了資源配置和人員管控,有助于疫情科學研判與精準施策。隨著疫情發展,數據驅動的疫情防控在迅速展開,各企業的疫情防控應用場景不斷涌現,應用范圍持續拓展。
《報告》從疫情分析展現、疫情防范管制、醫療醫治增效、生活便民舉措、復工復產管理等5個應用維度對實際應用案例進行了分類和描述。
調查結果顯示,大數據對疫情防范管控的支持力度最大,有效支撐疫情管控的技術方案和場景應用案例占比達到 46.7%。其中,高危人群的監測和管控是重中之重,具有此類功能的案例占比達到 60.7%。通過位置數據和各類行為數據有效識別高危人員的行動軌跡和接觸人群,能夠從根本上降低疫情傳播的程度,也是各級政府部門當前非常重要的工作。
此外,疫情分析展現類應用占比39.6%,很多企業首先針對各地提供的數據進行了多主體、多渠道、多維度的展現,并將結果應用于公眾、政府和企業服務上。大數據和智能技術還被充分應用到病情診斷、醫學科研、醫療輔助等與醫護工作直接相關的場景中,醫療醫治類案例占比17%(案例有重疊)。
在助力疫情聯防聯控的同時,大數據及關聯技術在協助政府、企業、學校復工復產復學中也發揮了重要作用。《報告》統計的主要應用場景有:通過通信大數據行程卡提供地理位置查詢進行流動人員管控;上線“健康碼”開展疫情期間的社區管理及交通出行,以及對公共場所的人員進行分類分級管理;提供遠程辦公及信息上報平臺、音視頻會議、企業云盤、課程直播等多項服務完成政企學異地協同運轉;通過大數據精準保障企業增產擴能等。
良好和豐富的數據是開展疫情防控應用的基礎。《報告》從數據采集、數據互通和數據開放3個方面,對收集到的相關案例中體現出來的數據能力進行分析。案例中,數據分析的深度隨時間遞增。從早期來看,大部分應用多為信息收集和平臺建設類項目。隨著平臺的建設和數據的逐步積累,診斷類應用愈加成熟,預測類應用逐步增加。至2020年2月初,描述類和診斷類應用的占比達到75%。
開源項目成為此次疫情防控科技力量中的一大亮點。《報告》指出,采用眾包協作方式構建的多個疫情防護有關的信息化開源項目,可以在短時間內迅速組織各類專業人員,快速搭建各類信息平臺,實現快速響應和大規模社會協作,在病毒開始蔓延的初期對數據的采集、資源的統籌配置提供了有力保障。
雖然大數據和智能技術在疫情防控過程中可以發揮重大作用,但從此次疫情應對情況來看,仍有很大空間值得挖掘和提升。
首先,從各互聯網企業的案例中不難看出,大部分企業在疫情防控中的數據基本來源于政府公開數據,而目前政府公開的數據維度不夠豐富,難以滿足公眾需求。
其次,從疫情分析的數據來看,目前公開渠道獲取的數據不規范,數據口徑、數據統計時間等維度不統一,為分析帶來很大困難。數據源混雜重復、數據質量不高的情況十分普遍,數據可信性有待提升。
再者,隨著新冠肺炎疫情防控形勢不斷升級,各地紛紛采取多樣的宣傳預防方式,其中排查上報重點地區返鄉人員和確診患者信息,是一項十分重要的舉措。雖然有關部門第一時間制作了隱去個人隱私信息的確診患者相同行程查詢工具,但在原始數據上報過程中,數據還是遭到了不同程度的泄露。
最后,大數據的核心在于互聯互通,只有融會了多源數據,才能發揮大數據的價值。在疫情防控中我們也看到了數據分散割裂、聚而不通、通而不用的問題。這很大程度上是因為數據源與數據開發能力不匹配所導致的,即掌握數據的一方缺少足夠的數據開發利用能力,而擁有數據開發能力的一方卻沒有足夠的數據,致使數據無法流通并發揮最大作用。
基于上述現狀,《報告》建議:一要加強數據采集和積累,完善大數據的支撐機制;二要提升數據治理能力,提高數據質量;三要做好個人信息保護工作,確保數據合法合規;四要強化技術攻關,創新技術應用場景。(何 珺)