面向新冠疫情的数据可视化分析与模拟预测——陈宝权教授团队疫情分析研究纪实

2020年1月以来,新冠疫情的传播引发了广泛关注,全国人民通过捐献物资、在家隔离、支援前线等各种方式为战疫工作作出贡献。北京大学陈宝权教授团队通过可视化技术分析现有的疫情发展,并通过改进经典的传染病模型SEIR用于分析新冠疫情时存在的缺陷,提出C-SEIR模型,对疫情的发展趋势进行了预测,并对封城等控疫措施的有效性进行了分析。相关工作2月10日在公众号上推送,马上被众多平台转载,短短几天时间就收获了10万+的阅读量,产生了广泛的影响。随着近期新冠肺炎在世界范围内产生影响,该文章也受到了国际上的关注,被刊登在知名国际科学期刊Frontiers of ScienceInternational Journal of Educational Excellence上。

距离“面向新冠疫情的数据可视化分析与模拟预测”推送发出时间已有2个月,从最开始以为疫情防控贡献一份力量为出发点,到现在研究成果得到广泛关注与认可。陈宝权教授深有感慨:“我很高兴我们的努力对疫情防控产生了那么一点影响,但还有更多问题有待解决。科研工作者应当为更好的社会服务不懈努力。”

发挥优势 大胆创新

新冠疫情的发展变化牵动着全国人民的心,尽管通过封城、隔离等措施,疫情已得到初步控制,但依然有许多问题萦绕在大家心里:病毒到底是如何传播发展的?不同省市疫情的发展有怎样的差别?拐点何时才能出现?陈宝权教授团队在可视化方面有多年的研究经验和技术积累,为发挥优势,以人口流动与疫情发展关系的可视化研究为切入点,团队很快进入了科研状态。

图1. 可视化结果 (左) 春节前由武汉市流向各省市的输入人流量,(中) 1月31日各省市确诊感染总人数,(右) 2月9日各省市确诊感染总人数

基于可靠性原则,团队选取了可信度较高的国家卫健委发布的疫情感染人数和百度人口迁徙统计数据,在时间维度和空间维度对二者进行了全面的相关性分析。为了得到直观准确的可视化,团队经过多次尝试和讨论,对比了各种可视化方法与模型参数,从多个角度分析疫情的传播趋势与规律,并提出了二级传播模型。在此基础上,为了建立更加严谨的疫情模型,团队参考并分析了国内外科学家发表的多篇分析新冠疫情在中国传播发展模型的文章,并针对其中存在的缺陷进行改进。

经过反复讨论,陈宝权教授团队在经典的传染病模型SEIR基础上,结合实际情况,提出C-SEIR模型,将原有的人群四分类拓展到六分类,将本次疫情提到的疑似病人进行单独分类。该模型对各省份疫情人数发展趋势都能实现更好的拟合效果,说明了封城与隔离措施对疫情防控的重要意义,也验证了在可视化阶段发现的二级传播模型。

图2.通过C-SEIR模型预测对比:在不同时间点实施封城手段的疫情的影响,虚线为累计确诊,实线为当天新增确诊,可以看到,封城时间对累计感染确诊人数会有较大影响

细化分工 同心协作

疫情使得团队中的同学们只能在家办公,如何实现高效的沟通和合作?团队采取了金字塔管理模式,陈宝权教授负责总指挥和方向把握,团队成员分成两个小组,每个小组组长负责分配任务、成果汇总与进展汇报;利用网络平台的优势,协同完成代码与撰写报告;将任务细化,收集数据、建立模型、实现模拟,每项任务责任落实到人……由于疫情发展迅速,为了加快推进研究,团队每天都要召开会议,及时同步进展,更新数据并制定下一步研究方向。

图3.项目任务分工示意图

通过合理的规划,远程协作依然取得了很高的科研效率。在疫情形势的督促下,团队成员仅仅花了一周的时间就实现了从零到推出科研成果的过程。很多团队成员为了及时完成任务加班加点,“疫情不等人,成果早一些出来,可能就有更大的作用。”

推广工作 助力抗“疫”

为了对抗击疫情作出贡献,让更多人了解疫情传播的规律,陈宝权教授团队选择了首先通过微信平台的方式传播,短短几天时间就收获了上万的阅读量,被众多平台转载。之后,该成果被撰写成规范论文并上传到论文预印本网站上,其成果对国际上关于新冠肺炎的研究也产生了影响,被翻译成西班牙语刊登在知名国际期刊上。

图4.文章被翻译成西班牙语版本刊登在Frontiers of Science

回望这段时间对新冠疫情传播研究的科研攻关过程,陈宝权教授及团队成员深感大数据对于社会重大事件的分析与指导的重要性。在本次疫情发展过程中,各地感染人数的实时情况对于把控疫情的发展趋势,建立有效模型是至关重要的。政府正确的决策部署也为控制疫情蔓延起到了重要作用。在疫情之后,如何复工复产,在有效控疫与社会发展之间寻找一个平衡点,将是一个更大的课题。

图5.团队核心成员

团队核心成员包括:陈宝权教授、博士生葛彤、博士生蒋鸿达、硕士生史明镒、硕士生周强、本科生倪星宇、本科生阮良旺、本科生宋振华、本科生王梦迪、本科生姚贺源等。

转载本网文章请注明出处