分组分析法跟对比分析法很相似,例如,下图为不同地区的销售额。
这相当于将销售额数据按照地区进行分组,然后可以很方便地进行对比分析。
生活中,我们可以按照人的属性,将人群按照性别、教育程度、城市等进行分组。
工作中也有很多例子,例如电商运营中按照销售渠道进行分组,分成天猫、京东、当当等,然后对比不同渠道的转化效果。
以上这些分组都是按照类别进行分组,在实际应用中还需要对数值型数据进行分组,例如年龄、销售额、数量等,对数值型数据的分组也叫分箱。
例如,某公司想了解客户购买数量的情况,即只购买了一件的客户数,购买了1-6件的客户数,购买了6-11件的客户数以及购买了11件以上的客户数等,这里只是举个例子,在实际工作分组要根据具体情况而定。
下面说下在Excel中如何对数值型数据进行分组,或者分箱。
数据源是这样的,这是不同客户的购买数量,共有10000行,以下操作只会用到“数量”这一列。
接着对“数量”这列数据进行分组,总共分两步。
第一步:确定组距
组距可以自己指定,也可以先确定组数,即要分成几组,然后用最大值减去最小值,再除以组数,得到的结果向上取整后就是组距。
首先,用公式min和max求出这组数据的最小值/最大值,以便确保分组能够覆盖所有的数据。
假设分成4组,则计算组距的方式如下图所示。
计算出来的组距为4,接着进行分组。
第一组的下限就取最小值1,上限为下限+组距,这里是1+4=5,用区间表示为[1,5]。
第二组的下限为5(取不到),上限为下限+组距,这里是5+4=9,用区间表示为(5,9]。
以此类推,得到整个分组,如下图所示。
上图列出了分组上限及其对应的区间,接着用frequency公式计算每组的频数。
第二步:用公式统计每组的数量
在E7单元格中,输入公式:=FREQUENCY(B:B,D7:D10),回车,接着选中单元格区域E7:E10,在上方的编辑栏中Ctrl+Shift+Enter一起按,这是数组公式的执行方式,得到如下图所示的频数。
至此,就完成数据的分组。
当然,这里也可以用countifs来统计每组的频数,大家可以思考一下如何统计?
为了使分组数据更加直观,一般会绘制直方图进行可视化,对频数绘制柱状图即可。
有时候,为了使图表更加美观,可以加上一条平滑折线,如下图所示。
从上图中很容易得到以下结论:
1、大部分客户的购买数量在5件以下(含5件),共有8137个客户。
2、少数客户购买数量在5-9件之间,共有1679人。
3、极少数客户的购买数量大于9件。
以上就是数据分析中的分组分析法,总结一下。
1、分组分析有两种:按类别分组和对数值型数据进行分组(也叫分箱)。
2、对数值型数据进行分组可以通过Excel完成。
3、数值型数据的分组分析通过直方图进行可视化。