SAS - 格式化数据集


有时,我们更喜欢以不同于数据集中已有格式的格式显示分析的数据。例如,我们要向包含价格信息的变量添加美元符号和两位小数。或者我们可能想显示一个文本变量,全部大写。我们可以使用FORMAT来应用内置的 SAS 格式,而PROC FORMAT则应用用户定义的格式。单一格式也可以应用于多个变量。

句法

应用内置 SAS 格式的基本语法是 -

format variable name format name

以下是所使用参数的描述 -

  • 变量名称是数据集中使用的变量名称。

  • 格式名称是要应用于变量的数据格式。

例子

让我们考虑以下包含组织员工详细信息的 SAS 数据集。我们希望以大写形式显示所有名称。format语句用于 实现此目的。

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 
   format name $upcase9. ;
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;
   PROC PRINT DATA = Employee; 
RUN; 

当执行上面的代码时,我们得到以下输出。

格式1

使用过程格式

我们还可以使用PROC FORMAT来格式化数据。在下面的示例中,我们为变量 DEPT 分配新值,以扩展部门的名称。

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 

DATALINES; 
1 Rick 623.3 IT 		 
2 Dan 515.2 OPS
3 Mike 611.5 IT 	
4 Ryan 729.1 HR 
5 Gary 843.25 FIN 
6 Tusar 578.6 IT 
7 Pranab 632.8 OPS
8 Rasmi 722.5 FIN 
;
proc format;
value $DEP 'IT' = 'Information Technology'
      'OPS'= 'Operations' ;
RUN;
   PROC PRINT DATA = Employee; 
   format name $upcase9. DEPT $DEP.; 
RUN; 

当执行上面的代码时,我们得到以下输出。

格式2