练习R:factor函数为有序分类变量创建值标签

因子factor包含两种可能,一是名义的无序分类变量,二是有序分类变量。
用R读取外部数据时,如果发现本应该是无序或有序分类的数据,那应当及时调整为factor类型,并且注意区分无序和有序。
另外,为方便统计分析和统计结果的描述,建议给factor加上值标签。
$ jobcat : int 3 1
雇员数据读入后,jobcat显示为数值变量,真实值为1/2/3的数字,我界定它本应该是一个有序分类变量,所以需要马上对其进行预处理。
data$jobcat <- factor(data$jobcat,ordered = T, levels = c("1","2","3"), labels = c("pt","bg","jl") )
ordered = T
命令转换为有序分类
levels = c("1","2","3")
按真实取值的1/2/3排序
labels = c("pt","bg","jl")
强制添加文字标签,此时pt代表1,bg代表2,jl代表3,注意pt这些是名字而已,并非真实值,真实值仍然是数字1/2/3。
来看结果:
$ jobcat : Ord.factor w/ 3 levels "pt"<"bg"<"jl": 3 1 1
提示jobcat已经是有序分类的因子了,而且顺序是pt < bg < jl 。
以上练习属于基础,掌握好了对以后灵活处理分类变量大有裨益。
文=数据小兵
(0)

相关推荐