暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

堆叠面积图在时序数据统计中的应用

FishData 2021-03-03
625

01 为什么使用堆叠面积图

对于时序数据,比如销售额指标,可以使用以时间为横轴的面积图来展示总体趋势。如果需要对总体销售额的变化原因进行分析,直观的方式就是在下钻维度上对各个子类的销售额进行拆解展示,这时可以借助于堆叠面积图的各种颜色面积展示出子维度对于整体变化的影响。

02 什么是堆叠面积图

堆叠面积是在基本面积图的基础上,在单一统计的面积边界上再累加第二个统计值,通过上下边缘形成该统计量的区域,并且使用另外一种颜色填充该区域(更多的统计量以此类推)。

基本面积图可以认为是对折线图的扩张,即用一种颜色填充折现与X轴形成的区域。

03 使用Pandas绘制堆叠面积图

3.1 数据集下载

这个示例采用了“Rossmann Store Sales”数据集,下载地址https://www.kaggle.com/c/rossmann-store-sales/data,这是一个药店的销售数据,非常适合做销售额统计。

3.2 Pandas脚本


# 读取数据
df_sales = pd.read_csv("/Users/shenfeng/Develop/python_analysis/train.csv")
df_sales.head()
df_store = pd.read_csv("/Users/shenfeng/Develop/python_analysis/store.csv")  
df_store.head()                                                                                                                                                                                                                      
# join销售和店铺数据获得店铺类型
df_sales_store_type = df_sales.join(df_store.set_index('Store'), on='Store')                                                                                                                                                        
df_sales_store_type.head()
# 对门店类型和销售日期做分组,统计销售额
df_sales_by_store_type = df_sales_store_type.groupby(["Date", "StoreType"])["Sales"].sum()
# 限制前20天数据进行图形绘制
df_sales_by_store_type.iloc[0:40].unstack().plot.area()
文章转载自FishData,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论