当某地出现新冠疫情时,不少人会因与确诊病例发生时空交集而出现变黄码或红码的情况。有些人会问, 这个变码涉及人群太大了,能不能再精准一点?
“能,这是一个需要技术再进步来解决的问题。”在2月26日浙大城市学院2022年度星光大课上,中国工程院院士、计算机应用专家陈纯在讲述时序动态图实时计算及智能决策时,解答了大家的这个疑问。
陈纯说,新冠疫情流调就是计算机时序动态图实时计算的结果。当发现一个人核酸检测出现阳性时,计算机可以将这个人在两周以内的所有图关系找出来,并形成一个此人经过地点的动态图。在这张动态图上,若你同一时间与这名阳性者在800米乘800米的无线基站范围里面出现过,那么,大数据就会将你的健康码变成黄码甚至红码。 虽然这个过程很粗放,但是,却需要构建100亿个顶点再加上很多边来计算,计算量能达到1000亿个顶点,现有的软件都满足不了时间的需求,通常需要几十台计算机同时进行计算。为了提高效率,现在,采用了分布式内存引擎,并且重新自写了一套算法,从而来提高准确性,确保少漏网或无漏网。尽管如此,现在对一个人进行两周内的流调,计算机还是要花几小时甚至一天的时间。
有人会问,从流行病学专家来看,就算时间吻合了,会传染他人的距离顶多也就20米,为什么你们要做800米?这样做的话,计算量是不是会减轻、准确率是不是会提高?陈纯的答案是否定的。他说,空间范围划得越小,图上的顶点就越多,再加上时间的分割,计算量就更多了。为此,现在的技术要确保减少流行病上感染,只能快速地确定一个大范围内的人员,然后系统再计算排查人员情况时同步予以医学诊断。
不过,陈纯在课上提到,现在,计算机领域的专家已经在着手解决这个问题,力图通过新的技术造出一个高效且准确的动态图,在一两分钟内将与目标发生过相关联系的人都关联好,这样的话,以后再出现新冠疫情等传染性疾病时,大数据的判断就会更加精准,比如说直接通知市民,你在什么时候与感染源在近20米内接触过。
浙大城市学院人工智能专业负责人金苍宏告诉记者,关系挖掘是目前大数据应用的一个重要方向,例如在网络诈骗、虚拟币交易、社会关系分析等场景中都需要对节点之间的关系进行分析。但是,感知世界的关系不是静态的,而是随着时间在发生演变,数据价值也会逐渐降低。目前的大数据图计算框架只能处理某一个截面的关系,关注在堆处理能力上,在流处理能力上较弱。不过,他相信,我国科研人员不回避问题、不受限于大数据开源框架的能力,通过从底层存储到算法模型的扎实改进,不断开发有自主知识产权的国产大数据实时图序列挖掘系统,必定能解决行业内的痛点问题。
新闻链接
今年的浙大城市学院星光大课,以“城市·文明·向未来”为主题,邀请了不同领域的专家学者进行跨学科、跨领域的深度交流,畅谈以共同富裕为目标、以城市数字化为手段、以文化传承为着力点,坚持高质量发展,共建幸福美好城市。
大课之“大”,是领域广、格局大,站在历史和现代的角度眺望,寻求不断完善城市治理的良策;大课之“课”,是传播知识,分享经验,不是枯燥的学术汇报,是生动形象、直指人心的饕餮盛宴。浙大城市学院校长罗卫东表示,今天的年度星光大课,既是一次关于城市治理、文明发展、美好未来的学术公开课,也是一场汇聚多领域、多学科的前沿思想盛宴。