截止至 2020 年 5月 6 日,新冠状病毒全球感染数字已经突破了 360 万例,累计死亡病例超过 22 万例。要知道,该类型传染病的传染数字和死亡数字仍然处于上升阶段,等到疫情完全控制,其造成的迫害极有可能超过艾滋病和肺结核。
从民生层面来说,佩戴质量合格的口罩的确可以有效预防。然而从国家的宏观层面来说,处理疫情各项信息最终达到精准预测其走向趋势,才是信息时代处理新型突发疾病的根基,这源自于现代科学家们倡导的人工智能思想。
为了能够促进数字化抗疫的理念,由清华大学计算机科学与技术系教授唐杰授课,清华大学计算机系本科课程“以智能服务为中心的软件开发设计与实现”公开展示了同学们数周的作业成果。在 2020 年春季的课程中,同学们分别以“COVID-19疫情可视化”和“学术信息挖掘”为主题,编写了一系列高可用的智能服务。
在课件中提到,任务的主旨是挖掘有趣的信息并生动地呈现给用户,不要求复杂的算法或是大规模数据的处理,对用户有用、用户愿意去使用。这样的要求意味着学生们需要让所有可能被疫情辐射到的居民都能够自如地使用,而不是只针对于某一个或者某一类小众群体。
当然,对学生的要求并不是平白无故的,这种开发过程被称作是 iSOA。它是由业务驱动服务,再通过服务去推进技术。iSOA 强调业务的敏捷性,换句话说就是灵活开发。新冠状病毒毫无前兆,如果开发者没有足够的敏捷性,这将会拉长整个开发周期,从而减缓人们对抗疫情的进度。传染病虽然无情,却也是让学生们理解开发以及业务创新的最好案例。
清华的学生们更是卧虎藏龙,经过数周的努力,他们开发出了许多优秀的应用。
部分同学的系统展示:
抗疫者 AntiNCP
来自“码到退疫”小组
AntiNCP 是一个 2019 新冠疫情数据的智能可视化与检索系统。
像是 2019 新冠疫情数据的智能可视化与检索系统 AntiNCP。这是一个面向多⻆度向用户展示最新疫情数据的疫情地图版,既可以通过时间轴热度图观察外至世界各地内至国内各省市的疫情发展变化,疫情中心转移情况。也可以通过折线图,获取精确信息,聚焦某地长时间的疫情发展趋势。
疫情中的舆论分析
来自“200”小组
该项目是疫情中的舆论分析系统,以疫情部分的舆论方面为核心,提取舆论主题,结合时间线展示群众的关注点变化,对访问者提供舆论谣言判断服务。包括如下内容:
• 疫情展示主要包括疫情确诊地图、详细数字和相关新闻或政策的时间线。
• 舆情关注展示对舆情进行主题提取,结合时间线展示群众的关注点变化。
• 虚假新闻/谣言判断及搜索用户输入文本,对文本进行分析,为用户提供相关已证实谣言或者相关新闻,并给出用户输入文本为谣言的概率。
流行病学联系可视化
来自“DiscardSOAP”小组
该项目是一个疫情数据可视化平台,意在解决疫情数据发布渠道复杂,疫情发布方式不直观的问题。通过病例可视化的方式,展示每个病例的行踪轨迹,并展示病例间的传染关系,便于民众了解身边病例状况,也有利于科研人员进行流行病学联系相关的研究。
结合交通信息的疫情数据展示及动态预测
来自“一点点”小组
该项目通过数字、颜色、柱形图和散点图等多种可视化和时间轴流动的形式,为用户动态地展示了疫情的发展过程和中国四个月以来的防疫历程与成果。旨在通过交通信息的表现,直观地展示交通在疫情发展中的角色和中国防疫交通措施的力度与成效。最后,基于交通信息和 SIR 模型的疫情动态预测给予用户参与服务交互、亲身感受中国疫情防控工作的可能。
疫情信息平台
来自“FlagMaker”小组
通过对历史数据汇总,该项目能够动态展示从疫情发生以来至今的全球疫情形势变化,包括全球各地区感染者人数,治愈率,死亡率等关键信息。我们选取了普通用戶对疫情最为关注的几个信息维度 ( 地区排行、变化趋势、热点新闻、谣言 ) ,在界面上略去了枯燥的文字数据,通过紧凑的布局加上多图表对时间联动的方式帮助用戶更加直观和全面地了解疫情的动态发展与变化。
替代性创伤的检测与缓解
来自“ETC”小组
着互联网技术的发展,人们能够接触到海量碎片信息。因此新型冠状病毒爆发时,很多人在短时间内接收到大量负面情景。当负面信息的损害程度超过部分人群的心理和情绪耐受极限时,间接导致各种心理异常现象。人们产生这种异常是由于对创伤的同情和共情,而使自己出现严重的身心困扰,甚至精神崩溃。
该网站可以及时的发现人们心中的 VT,并帮助他们调节情绪。网站主要分为两个部分:
(1)替代性创伤的检测:通过设置问卷,从而对用户的心理状态进行检测;
(2)替代性创伤的缓解:肌肉放松和冥想 - 通过语音或文字,引导用户进行肌肉放松或者冥想类游戏,解压小游戏 - 用于情绪发泄、形式简单的小游戏
conferenceSniper
来自“SO(T)A”小组
ConferenceSniper项目旨在为科研工作者提供一个用户友好,功能新颖专业的学术服务平台。ConferenceSniper以会议为单位提供数据分析,方便研究者更好的掌握会议发展趋势、高引论文、最新研究热点等。
目前该项目提供了以下几个功能:
词云:通过对会议关键词的可视化分析,帮助研究者更好的了解会议研究热点。
代表性论文:列出会议的高引论文。历史接受情况。帮助研究者了解会议的发展趋势。
文章聚类:帮助研究者更好的了解某一领域/主题的文章。
中稿预测:预测研究者的论文是否能中稿(真正实现此功能必然是很复杂的,目前学术界也没有很好的解决方案,我们只是做了初步的实现)。
NodeFocus: 深度挖掘学术信息
来自“Storms”小组
NodeFocus是一个基于领域和影响力的大规模学者关系图谱及其可视化网站,目的是将其打造成类似LinkedIn(一个职场社交平台)的学术社交网站。基于可视化的图谱,用户不仅可以快速检索到相关领域的知名学者,查看学者的详细信息,还可以对与其关系密切的合作者一目了然。如果用户对某位学者感兴趣,可以选择“Follow”该学者,便可以跟踪其最新动态。
同时,系统还挖掘了每位学者所在的“学术圈”(主要包括与其合作紧密的学者、其受影响最大以及影响最大的学者、导师、学生等),帮助用户了解其所在学术群体的信息。NodeFocus还提供“学者影响力比较”功能,从多方面对学者进行影响力评估。基于以上功能,NodeFocus希望为寻找暑研、导师的学生群体以及有意进行学术社交的研究人员提供切实帮助。
404学术搜索
来自“404”小组
404 学术搜索平台是一个以作者检索为核心的学术信息整合系统。平台的设计目标是,通过多维度、准确地整合作者之间的关系,提供便利、可解释的作者推荐功能。
同时,平台具有一般学术搜索的普适功能,挂载了一定数量的学术数据及其预处理结果。在 Golang 支持的高并发能力下,可以实现基本的学术浏览行为。
交叉学科学术可视化
来自“qwq”小组
学术交叉可视化项目基于近二十年全学科论文数据,根据学术关键词进行再分类,提供学科大类相互交叉领域之间的体量对比,以及时间维度上的动态展示。项目针对交叉领域学术需求,帮助用户直观地了解已有交叉学科研究体量的历史发展趋势,并为用户提供新兴研究方向的灵感启发。
当然,可视化离不开对信息和数据的挖掘。一位学生通过整合 AI 领域相关的知识:论文,专家,概念。对每一个领域展示该领域 top 学者以及论文。通过用户交互增加知识获取和交流的趣味性,用户可以根据个人知识帮助完善知识图谱。构建领域概念层次树,以概念作为桥接点构成知识图谱,帮助访问者了解领域知识体系层次结构。最终完成了疫情知识地图——knowledgeatlas。
卡文迪许在《实验哲学观察》中如此写到,“人有五官,可感官之间没有联系。比如鼻子不知道眼睛看到了什么”。信息的最大作用就是联系,消除了人们由距离产生的交流屏障,进一步对信息的精炼,人们便发现了新的大陆。没人知道明天会有什么样的灾难等着我们,唯有培养出时代凝聚出的黄金精神,才可战胜天灾!
文章来源: