R语言的tidyr包怎么用(r语言,tidyr,开发技术)

时间:2024-05-04 11:47:40 作者 : 石家庄SEO 分类 : 开发技术
  • TAG :

    R%E8%AF%AD%E8%A8%80%E7%9A%84tidyr%E5%8C%85%E6%80%8E%E4%B9%88%E7%94%A8

reshape2包在数据处理阶段帮助我们很容易的实现长宽格式数据之间的转换。tidyr包可以看作是reshape2包的进化版本,该包的作者依旧是Rstudio的首席科学家,R语言界的大神Hadley Wickham。tidyr包往往与dplyr包结合使用,目前渐有取代reshape2包之势, 是值得关注的一个R包。

在tidyr包中,有四个常用的函数,分别是:

gather():宽数据转换为长数据,将行聚集成列

spread():长数据转换为宽数据,将列展开为行

unite():多列合并为一列

separate():将一列分离为多列.

接下来我们主要对这四个函数进行详细学习,并在此基础上学习tidyr包其他的一些实用功能。

导入所用的包

如前面所说,gather()函数是将宽数据转换为长数据,调用公式如下:

首先我们先查看原始数据:

使用gather()函数进行数据重塑(代码中'%>%'为管道函数,这也是我们为什么要载入dplyr包的原因,关于管道函数,详见R Language Learning:dplyr包(十一))

spread()函数将长数据转为宽数据,即将列展开为行,调用公式如下:

我们使用R中的economics数据集来使用学习这一函数。

unite()函数是将数据框中多列合并为一列,调用公式如下:

在这里,我们使用unite()函数将日期和时间数值合并到一列上。

在学习了unite()函数后,separate()函数就很好理解了,它的作用正好和unite相反,即将数据框中的某列按照分隔符拆分为多列,一般用于时间序列的拆分,调用公式如下:

我们使用上一节得到的时间数据集,定义为data_unite,并对它进行拆分

从上面的数据中,我们可以看到类型与数值都存在缺失值。对于类型的缺失值,我们选择众数替换,对于数值型的缺失值,我们选择均值替换(也可选择中位数等,视具体情况而定)

本文:R语言的tidyr包怎么用的详细内容,希望对您有所帮助,信息来源于网络。
上一篇:JS数组求和的常用方法总结【5种方法】下一篇:

12 人围观 / 0 条评论 ↓快速评论↓

(必须)

(必须,保密)

阿狸1 阿狸2 阿狸3 阿狸4 阿狸5 阿狸6 阿狸7 阿狸8 阿狸9 阿狸10 阿狸11 阿狸12 阿狸13 阿狸14 阿狸15 阿狸16 阿狸17 阿狸18