新冠疫情数据爬虫和可视化系统设计与实现开题报告

 2023-03-03 05:03

1. 研究目的与意义

1.1课题研究背景

新型冠状病毒肺炎(corona virus disease 2019,covid-19),简称“新冠肺炎”,世界卫生组织命名为“2019冠状病毒病”,是指2019新型冠状病毒感染导致的肺炎。2019年12月以来,湖北省武汉市部分医院陆续发现了多例有华南海鲜市场暴露史的不明原因肺炎病例,证实为2019新型冠状病毒感染引起的急性呼吸道传染病。2020年2月11日,世界卫生组织总干事谭德塞在瑞士日内瓦宣布,将新型冠状病毒感染的肺炎命名为“covid-19”。2月22日,国家卫生健康委发布通知,“新型冠状病毒肺炎”英文名称修订为“covid-19”。3月11日,世卫组织认为当前新冠肺炎疫情可被称为全球大流行。

2021年12月15日,联合国粮食及农业组织和联合国儿童基金会联合发布的一份报告显示,受新冠疫情影响,亚太地区粮食安全和营养状况日趋严峻,2020年超过3.75亿人面临饥饿,比2019年增加近5400万人。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容与预期目标

2.1研究内容:

本实验首先开始数据采集阶段,主要通过网络爬虫技术来对网络现成的资源统一定位符进行数据爬取,网络爬虫从一个或若干初始网页的 url 开始,获得初始目标网页上的 url,在抓取网页的过程中,不断从当前页面上抽取新的 url 放入队列,直到满足我所需要的系统的一定停止条件。由于深度优先搜索算法可能会使爬虫系统陷入一个网站内部,不利于搜索比较靠近网站首页的网页信息,因此我选择采用广度优先搜索算法采集网页,最后,取出一个url,对其对应的网页进行下载,然后再解析,如此反复进行,直到遍历了整个网络或者满足某种条件后停止下来。这些主要是数据采集部分,将所有数据项根据类型进行分析汇总。

得到所需数据之后再进行自顶向下的可视化系统设计阶段。首先利用前端组件连接后端接口,展示大屏数据可视化界面,将各个地区做到细分化,将国内地区按省市进行分别统计,同样利用折线图柱形图等展示新增病例趋势等,同时分析累计确诊,现有疑似,累计死亡,累计治愈,实时展示国内各地数据。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究方法与步骤

3.1研究方法

1.文献法。主要通过查阅相关的文献资料,例如《python数据分析与挖掘实战》等,

通过python进行对网络数据的爬取、分析、挖掘,最后利用软件工程知识对可视化系统进行自顶向下的开发设计。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]张良均,王路,谭立云,苏剑林.python数据分析与挖掘实战.机械工业出版社. 2016-1

[2] steele、iliinsky.可视化之美. o'reilly media出版社.2016-4

[3]范传辉.python爬虫开发与项目实战.机械工业出版社.2014-7

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

1. 2022 年 3 月:完成并通过开题报告。

2. 2022 年 4 月:在系统的需求分析完成的基础上,完成系统的方案设计,进行系统

的编程实现。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。