暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

常用数据分析方法:分组分析法

笨鸟学数据分析 2021-10-22
3279
点击上方蓝字笨鸟学数据分析关注,学数据分析!

分组分析法跟对比分析法很相似,例如,下图为不同地区的销售额。

这相当于将销售额数据按照地区进行分组,然后可以很方便地进行对比分析。

生活中,我们可以按照人的属性,将人群按照性别、教育程度、城市等进行分组。

工作中也有很多例子,例如电商运营中按照销售渠道进行分组,分成天猫、京东、当当等,然后对比不同渠道的转化效果。

以上这些分组都是按照类别进行分组,在实际应用中还需要对数值型数据进行分组,例如年龄、销售额、数量等,对数值型数据的分组也叫分箱

例如,某公司想了解客户购买数量的情况,即只购买了一件的客户数,购买了1-6件的客户数,购买了6-11件的客户数以及购买了11件以上的客户数等,这里只是举个例子,在实际工作分组要根据具体情况而定。


下面说下在Excel中如何对数值型数据进行分组,或者分箱。

数据源是这样的,这是不同客户的购买数量,共有10000行,以下操作只会用到“数量”这一列。

接着对“数量”这列数据进行分组,总共分两步。

第一步:确定组距

组距可以自己指定,也可以先确定组数,即要分成几组,然后用最大值减去最小值,再除以组数,得到的结果向上取整后就是组距。

首先,用公式min和max求出这组数据的最小值/最大值,以便确保分组能够覆盖所有的数据。

假设分成4组,则计算组距的方式如下图所示。

计算出来的组距为4,接着进行分组。

第一组的下限就取最小值1,上限为下限+组距,这里是1+4=5,用区间表示为[1,5]。

第二组的下限为5(取不到),上限为下限+组距,这里是5+4=9,用区间表示为(5,9]。

以此类推,得到整个分组,如下图所示。

上图列出了分组上限及其对应的区间,接着用frequency公式计算每组的频数。


第二步:用公式统计每组的数量

在E7单元格中,输入公式:=FREQUENCY(B:B,D7:D10),回车,接着选中单元格区域E7:E10,在上方的编辑栏中Ctrl+Shift+Enter一起按,这是数组公式的执行方式,得到如下图所示的频数。

至此,就完成数据的分组。

当然,这里也可以用countifs来统计每组的频数,大家可以思考一下如何统计?


为了使分组数据更加直观,一般会绘制直方图进行可视化,对频数绘制柱状图即可。

有时候,为了使图表更加美观,可以加上一条平滑折线,如下图所示。

从上图中很容易得到以下结论:

1、大部分客户的购买数量在5件以下(含5件),共有8137个客户。

2、少数客户购买数量在5-9件之间,共有1679人。

3、极少数客户的购买数量大于9件。


以上就是数据分析中的分组分析法,总结一下。

1、分组分析有两种:按类别分组和对数值型数据进行分组(也叫分箱)。

2、对数值型数据进行分组可以通过Excel完成。

3、数值型数据的分组分析通过直方图进行可视化。

如果想要系统数据分析,长按识别二维码查看下方课程。

文章转载自笨鸟学数据分析,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论