2022-07-20 10:16:37 索炜达电子 505
文件编号:C15
文件大小:46M
猿创承诺:该项目亲测正常运行,需远程调试部署另外收费,确保正常使用,不能正常使用全额退款。
简要概述:新型冠状病毒肺炎确诊病例活动轨迹数据处理
疫情轨迹数据处理
1. chinadata文件夹:全国病例轨迹,地点和链接数据,链接数据就是我们正在收集的文本数据来源
2. datadetail文件夹:每个省份的按每个病例分来的文本数据,目前只有海南省的,其他的省份还需要爬取数据之后,从新闻内容中获取
3. allchinadata.py用于合并chinadata文件夹中的全国数据表,生成文档为:allchinadata.csv,同时选出url列的域名部分数据,放在url.csv文档中。
4. chinadata.py用于获取全国数据,生成chinadata文件夹中的数据表,注意这个是追加方式,重新获取的话要删除chinadata文件夹中的表格,再运行程序。这个程序需要改进一下,获取字段中的is_today,需要修改成当天爬取日期,然后修改程序为增量爬取模式。
5. hn-datadetail.py用于海南按每个病例分来的文本获取,因为海南数据比较规整,不需要从新闻文本中分割获得。已经运行结果保存在datadetail文件夹。
演示视频:
点击查看:系统演示视频
运行结果:
远程协助:
温馨提示:索炜达.猿创官方提供收费远程协助,确保您项目运行成功。
点击查看:远程协助相关事项
我们提供完整项目文件清单如下:
文件目录
├ 1.项目源码
├ 2.运行截图
└ 3.演示视频