因子
介绍因子之前,先要搞清楚变量的分类,变量的分类分为:名义型变量、有序型变量、连续型变量变量分类
名义型变量 一般为字符串型,如城市的名字、职工的名字
有序型变量 这个则比较模糊,类似于‘ small ’、‘ mid’、‘ large’等级别的词语
连续型变量 一般为数字型,在某个范围内的数字,如增长率、身高、年龄
因子,在 R 中名义型变量和有序型变量称为因子,这些分类变量的可能值称为一个水平。由这些水平值构成的向量,称为因子。这次示范里例子来源于mtcars
可以看到cyl
和am
等列呈现出一个因子的形式我们用$符号将数据提取出来我们再使用table
函数查看被分为几个等级
显示分为三个等级,4 对应 11 个,6 对应 7 个,8 对应 14 个。接下来就是生成一个因子
> cyl <- factor(mtcars$cyl) #因子的函数是 factor
> cyl
[1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4
Levels: 4 6 8
为什么都是向量却要有这么多名称呢?R 主要是一门统计画图的语言,它们意义不同,产生的图片也不同。plot(mtcars$cyl)
如果为向量产生的是散点图
plot(factor(mtcars$cyl))
如果是因子,则产生的是条形图。
结束语
我还是那个在生信路上摸爬滚打的工具人。一起加油吧!如果需要提供帮助或者是反馈意见,可以发送邮件到 liwei12306@163.com

文章转载自生信工具人,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




