清华计算机系开展新冠疫情作业,看看信息时代的学生们怎样完成?
截止至 2020 年 5月 6 日,新冠状病毒全球感染数字已经突破了 360 万例,累计死亡病例超过 22 万例。要知道,该类型传染病的传染数字和死亡数字仍然处于上升阶段,等到疫情完全控制,其造成的迫害极有可能超过艾滋病和肺结核。
从民生层面来说,佩戴质量合格的口罩的确可以有效预防。然而从国家的宏观层面来说,处理疫情各项信息最终达到精准预测其走向趋势,才是信息时代处理新型突发疾病的根基,这源自于现代科学家们倡导的人工智能思想。
为了能够促进数字化抗疫的理念,由清华大学计算机科学与技术系教授唐杰授课,清华大学计算机系本科课程“以智能服务为中心的软件开发设计与实现”公开展示了同学们数周的作业成果。在 2020 年春季的课程中,同学们分别以“COVID-19疫情可视化”和“学术信息挖掘”为主题,编写了一系列高可用的智能服务。
在课件中提到,任务的主旨是挖掘有趣的信息并生动地呈现给用户,不要求复杂的算法或是大规模数据的处理,对用户有用、用户愿意去使用。这样的要求意味着学生们需要让所有可能被疫情辐射到的居民都能够自如地使用,而不是只针对于某一个或者某一类小众群体。
当然,对学生的要求并不是平白无故的,这种开发过程被称作是 iSOA。它是由业务驱动服务,再通过服务去推进技术。iSOA 强调业务的敏捷性,换句话说就是灵活开发。新冠状病毒毫无前兆,如果开发者没有足够的敏捷性,这将会拉长整个开发周期,从而减缓人们对抗疫情的进度。传染病虽然无情,却也是让学生们理解开发以及业务创新的最好案例。
部分同学的系统展示:
抗疫者 AntiNCP
来自“码到退疫”小组
像是 2019 新冠疫情数据的智能可视化与检索系统 AntiNCP。这是一个面向多⻆度向用户展示最新疫情数据的疫情地图版,既可以通过时间轴热度图观察外至世界各地内至国内各省市的疫情发展变化,疫情中心转移情况。也可以通过折线图,获取精确信息,聚焦某地长时间的疫情发展趋势。
来自“200”小组
来自“DiscardSOAP”小组
结合交通信息的疫情数据展示及动态预测
来自“一点点”小组
该项目通过数字、颜色、柱形图和散点图等多种可视化和时间轴流动的形式,为用户动态地展示了疫情的发展过程和中国四个月以来的防疫历程与成果。旨在通过交通信息的表现,直观地展示交通在疫情发展中的角色和中国防疫交通措施的力度与成效。最后,基于交通信息和 SIR 模型的疫情动态预测给予用户参与服务交互、亲身感受中国疫情防控工作的可能。
疫情信息平台
来自“FlagMaker”小组
(1)替代性创伤的检测:通过设置问卷,从而对用户的心理状态进行检测;
(2)替代性创伤的缓解:肌肉放松和冥想 - 通过语音或文字,引导用户进行肌肉放松或者冥想类游戏,解压小游戏 - 用于情绪发泄、形式简单的小游戏
conferenceSniper
词云:通过对会议关键词的可视化分析,帮助研究者更好的了解会议研究热点。
代表性论文:列出会议的高引论文。历史接受情况。帮助研究者了解会议的发展趋势。
文章聚类:帮助研究者更好的了解某一领域/主题的文章。
中稿预测:预测研究者的论文是否能中稿(真正实现此功能必然是很复杂的,目前学术界也没有很好的解决方案,我们只是做了初步的实现)。
来自“Storms”小组
来自“404”小组
同时,平台具有一般学术搜索的普适功能,挂载了一定数量的学术数据及其预处理结果。在 Golang 支持的高并发能力下,可以实现基本的学术浏览行为。
交叉学科学术可视化
来自“qwq”小组
当然,可视化离不开对信息和数据的挖掘。一位学生通过整合 AI 领域相关的知识:论文,专家,概念。对每一个领域展示该领域 top 学者以及论文。通过用户交互增加知识获取和交流的趣味性,用户可以根据个人知识帮助完善知识图谱。构建领域概念层次树,以概念作为桥接点构成知识图谱,帮助访问者了解领域知识体系层次结构。最终完成了疫情知识地图——knowledgeatlas。
近期精彩集锦(点击蓝色字体跳转阅读):