SAS-标准差


标准差 (SD) 是衡量数据集中数据变化程度的指标。从数学上讲,它测量每个值与数据集平均值的距离或接近程度。标准差值接近 0 表示数据点往往非常接近数据集的平均值,高标准差表示数据点分布在更广泛的值范围内

在 SAS 中,SD 值是使用 PROC MEAN 和 PROC SURVEYMEANS 来测量的。

使用 PROC MEANS

使用 proc 测量 SD意味着我们在 PROC 步骤中选择 STD 选项。它显示数据集中存在的每个数值变量的 SD 值。

句法

SAS 中计算标准差的基本语法是 -

PROC means DATA = dataset STD;

以下是所使用参数的描述 -

  • 数据集- 是数据集的名称。

例子

在下面的示例中,我们从 SASHELP 库中的 CARS 数据集创建数据集 CARS1。我们选择带有 PROC 均值步骤的 STD 选项。

PROC SQL;
create table CARS1 as
SELECT make, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc means data = CARS1 STD;
run;

当我们执行上面的代码时,它会给出以下输出 -

SD_1.JPG

使用 PROC 调查手段

此过程还用于测量 SD 以及一些高级功能,例如测量分类变量的 SD 以及提供方差估计。

句法

使用 PROC SURVEYMEANS 的语法是 -

PROC SURVEYMEANS options statistic-keywords ;
BY variables ;
CLASS variables ;
VAR variables ;

以下是所使用参数的描述 -

  • BY - 表示用于创建观察组的变量。

  • CLASS - 表示用于分类变量的变量。

  • VAR - 表示将计算 SD 的变量。

例子

下面的示例描述了类选项的使用,该选项为类变量中的每个值创建统计信息。

proc surveymeans data = CARS1 STD;
class type;
var type horsepower;
ods output statistics = rectangle;
run;
proc print data = rectangle;
run;

当我们执行上面的代码时,它会给出以下输出 -

SD_2.JPG

使用 BY 选项

下面的代码给出了 BY 选项的示例。其中,结果针对 BY 选项中的每个值进行分组。

例子

proc surveymeans data = CARS1 STD;
var horsepower;
BY make;
ods output statistics = rectangle;
run;
proc print data = rectangle;
run;

当我们执行上面的代码时,它会给出以下输出 -

make =“奥迪”的结果

SD_3.JPG

品牌 =“BMW”的结果

SD_3.JPG