统计 - 转换


数据转换是指将函数应用于数据集中的每个项目。这里 $x_i$ 被它的变换值 $y_i$ 替换,其中 $y_i = f(x_i)$。通常进行数据转换是为了使图形的外观更易于解释。

有四个主要函数用于转换。

  • $ log x $ - 对数变换。例如,声音单位以分贝为单位,并且通常使用对数变换来表示。

  • $ \frac{1}{x} $ - 倒数变换。例如,完成比赛/任务的时间代表使用速度。速度越快,花费的时间就越少。

  • $ \sqrt{x} $ - 平方根变换。例如,使用半径来比较圆形地面的面积。

  • $ {x^2} $ - 幂变换。例如比较负数。

对数和平方根变换用于正数的情况,而倒数和幂变换可用于负数和正数的情况。

下图说明了如何使用对数变换以图形方式比较人口。

改造前

正态分布

改造后

对数变换