R - Excel 文件


Microsoft Excel 是使用最广泛的电子表格程序,它以 .xls 或 .xlsx 格式存储数据。R 可以使用一些 excel 特定的包直接从这些文件中读取。很少有这样的包 - XLConnect、xlsx、gdata 等。我们将使用 xlsx 包。R 还可以使用这个包写入 Excel 文件。

安装 xlsx 包

您可以在 R 控制台中使用以下命令来安装“xlsx”包。它可能会要求安装该软件包所依赖的一些附加软件包。按照相同的命令和所需的包名称来安装其他包。

install.packages("xlsx")

验证并加载“xlsx”包

使用以下命令验证并加载“xlsx”包。

# Verify the package is installed.
any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.
library("xlsx")

当脚本运行时,我们得到以下输出。

[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars

输入为 xlsx 文件

打开微软Excel。将以下数据复制并粘贴到名为sheet1 的工作表中。

id	name      salary    start_date	dept
1	Rick	    623.3	  1/1/2012	   IT
2	Dan       515.2     9/23/2013    Operations
3	Michelle  611	     11/15/2014	IT
4	Ryan	    729	     5/11/2014	   HR
5	Gary	    43.25     3/27/2015  	Finance
6	Nina	    578       5/21/2013	   IT
7	Simon	    632.8	  7/30/2013	   Operations
8	Guru	    722.5	  6/17/2014	   Finance

还将以下数据复制并粘贴到另一个工作表中,并将该工作表重命名为“city”。

name	    city
Rick	    Seattle
Dan       Tampa
Michelle  Chicago
Ryan	    Seattle
Gary	    Houston
Nina	    Boston
Simon	    Mumbai
Guru	    Dallas

将 Excel 文件另存为“input.xlsx”。您应该将其保存在 R 工作区的当前工作目录中。

读取 Excel 文件

使用read.xlsx()函数读取 input.xlsx,如下所示。结果作为数据帧存储在 R 环境中。

# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)

当我们执行上面的代码时,它会产生以下结果 -

      id,   name,     salary,   start_date,   dept
1      1    Rick      623.30    2012-01-01    IT
2      2    Dan       515.20    2013-09-23    Operations
3      3    Michelle  611.00    2014-11-15    IT
4      4    Ryan      729.00    2014-05-11    HR
5     NA    Gary      843.25    2015-03-27    Finance
6      6    Nina      578.00    2013-05-21    IT
7      7    Simon     632.80    2013-07-30    Operations
8      8    Guru      722.50    2014-06-17    Finance