当前位置: 移动技术网 > IT编程>脚本编程>Python > python股票爬虫可视化

python股票爬虫可视化

2020年07月17日  | 移动技术网IT编程  | 我要评论

1.功能点

股票数据爬虫数据源股城网,重心放在多支股票的概览信息上【未放在单只股票历史数据的分析与可视化,这一点也值得去做】;

绘图用matplotlib,涉及饼图、柱状图、雷达图的设计、实现和优化,值得参考;

全量源码两周后提供

    1. 可以获取股票数据保存至excel文件
    1. 股票的爬取与展示
    1. 股票信息的可视化
    1. 股票信息文件的删除

2.业务分析

首先是数据源的获取,从股城网股票代码一览表获取,我们打开网页,源码模式观察,股票代码从href中获取
在这里插入图片描述
然后进入每支股票的详情页面爬取当日信息:
在这里插入图片描述
待爬取的位置:
在这里插入图片描述

3.代码设计说明

采用console中提示菜单的方式贯通整个操作过程,简约高效;
表格处理使用pandas库;
作图matplotlib,涉及饼图、柱状图、雷达图及各种图的优化;
计时器是封装好的常用的装饰器;

4.绘图代码说明

预留位置

5.效果展示

5.1 爬取股票信息

输入1回车
提示需要爬取的最大数目【建议15-20,因为后面绘图都是全量的,太多股票显示效果不好,没有随机采样有限个数个】此处列为TODO考虑作优化~
输入18个,因为网络和网页问题,可能会缺失几条股票信息!
在这里插入图片描述
例如我输入爬取40条,结果少了四条:
在这里插入图片描述
两个显示效果不好的例子
36支股票的效果已经很不好看了:
在这里插入图片描述
数目过多情况下,饼图已经重叠到爆炸:
在这里插入图片描述

5.2 展示股票信息

输入2回车
即可看到当前表格文件中存储的所有股票的信息,以pandas的dataframe格式展示,中间过多数据以…省略号缩写;
在这里插入图片描述

5.3 饼图

输入3回车,即可对当前文件中所有股票进行对比;
颜色和图例做过优化,但是仍有叠加情况【考虑过占比少和多的扇形交叉展示,但是此处数据根据涨跌幅做过排序】
点击关闭图形窗口即可继续运行系统!~
在这里插入图片描述

5.4 柱状图

输入4回车,即可生成当前所有股票【最高】柱状图;
在这里插入图片描述

5.5 雷达图 对比两支股票差距

输入5回车,先展示当前股票信息,最前面一列为股票的索引,从0开始;
在这里插入图片描述
然后根据提供的股票索引,输入两个存在的整数,即可生成雷达对比图;
在这里插入图片描述

5.6 删除旧股票信息文件&退出系统

输入6回车
即可将保存的股票表格文件删除,以方便下次爬取和生成新的股票表格文件;
输入0回车
即可退出并关闭程序;
在这里插入图片描述

6.总结

通过此系统的设计与开发并优化过程,熟悉了matplotlib与pandas两个重要库的基本操作和使用;
另外对爬虫的网页分析和爬取也有了一定程度的学习;
需要优化的地方更在于系统项目更具有业务上的意义的设计;

本文地址:https://blog.csdn.net/qq_33997198/article/details/107325441

如对本文有疑问, 点击进行留言回复!!

相关文章:

验证码:
移动技术网