ggplot2 - 散点图和抖动图


散点图类似于通常用于绘图的折线图。散点图显示一个变量与另一个变量的相关程度。变量之间的关系称为相关性,通常在统计方法中使用。我们将使用名为“Iris”的相同数据集,其中每个变量之间存在很多变化。这是一个著名的数据集,它给出了 3 种鸢尾花各 50 朵花的变量萼片长度和宽度以及花瓣长度和宽度的测量值(以厘米为单位)。该物种被称为山鸢尾、云芝和维吉尼亚鸢尾。

创建基本散点图

使用“ggplot2”包创建散点图涉及以下步骤 -

要创建基本散点图,请执行以下命令 -

> # Basic Scatter Plot
> ggplot(iris, aes(Sepal.Length, Petal.Length)) +
+    geom_point()
创建基本散点图

添加属性

我们可以使用 geom_point() 函数中名为 shape 的属性来更改点的形状。

> # Change the shape of points
> ggplot(iris, aes(Sepal.Length, Petal.Length)) +
+    geom_point(shape=1)
添加属性

我们可以为所需散点图中添加的点添加颜色。

> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1)
添加带有颜色的属性

在此示例中,我们根据传说中提到的物种创建了颜色。这三个物种在上述图中具有独特的区别。

现在我们将重点关注建立变量之间的关系。

> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1) +
+    geom_smooth(method=lm)

geom_smooth函数有助于重叠模式和创建所需变量的模式。

属性方法“lm”提到了需要开发的回归线。

> # Add a regression line
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1) +
+    geom_smooth(method=lm)
几何平滑函数

我们还可以使用下面提到的语法添加没有阴影置信区域的回归线 -

># Add a regression line but no shaded confidence region
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1) +
+    geom_smooth(method=lm, se=FALSE)
添加回归线图

阴影区域代表置信区域以外的区域。

抖动图

抖动图包括可以描绘分散图的特殊效果。抖动只不过是分配给点以将它们分开的随机值,如下所述 -

> ggplot(mpg, aes(cyl, hwy)) +
+    geom_point() +
+    geom_jitter(aes(colour = class))
抖动图