SAS - 频率分布


频率分布是显示数据集中数据点频率的表格。表中的每个条目包含特定组或间隔内值出现的频率或计数,通过这种方式,表总结了样本中值的分布。

SAS 提供了一个称为PROC FREQ 的过程来计算数据集中数据点的频率分布。

句法

SAS 中计算频率分布的基本语法是 -

PROC FREQ DATA = Dataset ;
TABLES Variable_1 ;
BY Variable_2 ;

以下是所使用参数的描述 -

  • 数据集是数据集的名称。

  • Variables_1是需要计算频率分布的数据集的变量名称。

  • Variables_2是对频率分布结果进行分类的变量。

单变频分布

我们可以使用PROC FREQ确定单个变量的频率分布。在这种情况下,结果将显示变量每个值的频率。结果还显示了百分比分布、累积频率和累积百分比。

例子

在下面的示例中,我们找到了名为CARS1的数据集的可变马力的频率分布,该数据集是从库SASHELP.CARS 创建的。我们可以看到结果分为两类结果。每种汽车品牌都有一个。

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data = CARS1 ;
tables horsepower; 
by make;
run;

执行上述代码时,我们得到以下结果 -

频率_By2

多变频分布

我们可以找到多个变量的频率分布,将它们分组为所有可能的组合。

例子

在下面的示例中,我们计算按汽车类型分组的汽车品牌的频率分布,以及按每个品牌分组的每种类型汽车的频率分布

proc FREQ data = CARS1 ;
tables make type; 
run;

执行上述代码时,我们得到以下结果 -

FREQ_tables1

随权重的频率分布

通过权重选项,我们可以计算随变量权重偏置的频率分布。这里变量的值被视为观测值的数量而不是值的计数。

例子

在下面的示例中,我们计算变量 make 和 type 的频率分布,并将权重分配给马力。

proc FREQ data = CARS1 ;
tables make type; 
weight horsepower;
run;

执行上述代码时,我们得到以下结果 -

FREQ_tables3