股票市场一直是金融领域的焦点之一,对股票数据进行大数据分析有助于了解市场趋势、预测价格波动、优化投资策略等。随着大数据技术的快速发展和 应用,越来越多的投资者、交易员和分析师开始利用大数据技术来解读和分析股票市场数据。通过对股票数据的大数据分析可以提供有关市场走势、投资机会和风险的深入洞察,帮助投资者和交易员做出明智的决策,并提高投资和交易的效果。结合Python强大的数据分析和可视化工具,可以提供全面、准确的市场洞察和投资决策支持,为投资者和交易员带来更好的交易体验和投资回报。
二、大数据分析设计方案
下载老师提供的数据集,导入并理解数据集,观察数据集属性,经过数据清洗得到全新的数据集用于数据分析与可视化,用数据可视化分析股票股价趋势,股价的分布和股票之间的联系与对比。
三、数据分析步骤
1.导入库
2.导入数据集并显示数据
3.数据处理:查看是否含有缺失值,如果有删除缺失值并检查是否删除
其中open,high,low列含有空值
可以看出空值已删除
4.查看数据类型
data为日期
Open为开盘价,
High为当天最高价,
Low为最低价,
Close为当天收盘价,
Volume指当天总共的股票交易数。
5.重命名列并基于日期列创建两个新列“mouth”和“day”便于可视化
从图中得到信息:AAL股价在2017年趋势较为平稳,上下波动幅度不大
查看股票数据集中含有的数据种类
选取部分股票进行对比
多个股票价格趋势图画在同一张图上,我们的关注点是不同股票之间的对比。从上图我们可以得到一些简单的结论:AAP与AAPL股价波动较为明显,AAP呈现下降趋势,AAPL呈现上升趋势。其它股票相对于AAP,AAPL较低,趋势比较平稳。
8.股价均线图:一只股票这一年的股价趋势和它的均线。(以AAPL为例)
利用pandas生成30, 60, 90天的移动平均值。再在收盘价趋势图上画出这3条移动平均线。
从上图就可以非常直观看到多条均线的走势。AAPL在6月前都在上升通道中,股价稳定上涨。但是在7月到11月之间从3条均线都可以看到有下降趋势。
9.不同股票收盘价箱线图:多只股票价格分布,对比波动性。
由于不同股票的价格区间不同,想要比较他们的价格波动性,折线图显然不是最好的选择。而使用箱线图就能很好地展现数据的分布情况。
从箱线图中可以看到:AAP和AAPL股价波动最为明显,AAL和ZION的股价相对稳定。
只用pandas和matplotlib不能画出专业的k线图,所以我们用箱线图仿月k线图来展示股价趋势和成交价格最大值和最小值。这里除了趋势之外,我们还能看到一段时间内数据的分布,使用箱线图就可以很好地展示这些数据特征。
箱图和柱状图在同一画布:使得报告更紧凑,或者方便从不同维度解释数据
从散点图上看,成交量在不同价格区间内较为集中。
附完整程序源代码
总结至此,我们学习了:按需求选择图表利用dataframe的函数功能结合\进行换行,使得整体代码整洁。如何解释图表,发现图表传递的信息。