暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

摸爬滚打的第23天--R的因子

生信工具人 2020-05-21
128

因子

介绍因子之前,先要搞清楚变量的分类,变量的分类分为:名义型变量、有序型变量、连续型变量变量分类

  • 名义型变量 一般为字符串型,如城市的名字、职工的名字

  • 有序型变量 这个则比较模糊,类似于‘ small ’、‘ mid’、‘ large’等级别的词语

  • 连续型变量 一般为数字型,在某个范围内的数字,如增长率、身高、年龄

因子,在 R 中名义型变量和有序型变量称为因子,这些分类变量的可能值称为一个水平。由这些水平值构成的向量,称为因子。这次示范里例子来源于mtcars
可以看到cyl
am
等列呈现出一个因子的形式
我们用$符号将数据提取出来我们再使用table
函数查看被分为几个等级
显示分为三个等级,4 对应 11 个,6 对应 7 个,8 对应 14 个。接下来就是生成一个因子

>  cyl <- factor(mtcars$cyl)    #因子的函数是 factor
> cyl
[1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4
Levels: 4 6 8

为什么都是向量却要有这么多名称呢?R 主要是一门统计画图的语言,它们意义不同,产生的图片也不同。plot(mtcars$cyl)
如果为向量产生的是散点图
plot(factor(mtcars$cyl))
如果是因子,则产生的是条形图。

结束语

我还是那个在生信路上摸爬滚打的工具人。一起加油吧!如果需要提供帮助或者是反馈意见,可以发送邮件到 liwei12306@163.com

文章转载自生信工具人,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论