ggplot2 - 简介


ggplot2 是一个 R 包,专为数据可视化和提供最佳探索性数据分析而设计。它提供了美丽、无忧无虑的绘图,可以处理微小的细节,例如绘制图例并表示它们。可以迭代地创建绘图并在以后进行编辑。该软件包设计为以分层方式工作,首先显示使用 R 进行探索性数据分析期间收集的原始数据的层,然后添加注释和统计摘要层。

即使是最有经验的 R 用户也需要帮助来创建优雅的图形。该库是在 R 中创建图形的出色工具,但即使经过多年的几乎日常使用,我们仍然需要参考我们的备忘单。

该包在称为“图形语法”的深层语法下工作,它由一组可以通过多种方式创建的独立组件组成。“图形语法”是使 ggplot2 非常强大的唯一原因,因为 R 开发人员不限于其他软件包中使用的一组预先指定的图形。语法包括一组简单的核心规则和原则。

2005年,威尔金森创建了或者更确切地说是首创了图形语法的概念,以描述所有统计图形之间包含的深层特征。它侧重于主要层,其中包括调整 R 嵌入的功能。

《图形语法》与R的关系

它告诉用户或开发人员,统计图形用于将数据映射到美学属性,例如相关几何对象(如点、线和条)的颜色、形状、大小。该图还可以包含在提到的坐标系上绘制的相关数据的各种统计变换。它还包括一个称为“Faceting”的功能,该功能通常用于为上述数据集的不同子集创建相同的图。R 包含各种内置数据集。这些独立的组成部分的组合就完整地构成了一个特定的图形。

现在让我们关注可以参考语法创建的不同类型的绘图 -

数据

如果用户想要可视化给定的一组美学映射,该映射描述了如何将数据中所需的变量映射在一起以创建映射的美学属性。

层数

它由几何元素和所需的统计变换组成。图层包括几何对象、短数据几何对象,它们实际上借助点、线、多边形等来表示绘图。最好的演示是对观测值进行分箱和计数,以创建特定的直方图来总结特定线性模型的二维关系。

比例尺用于映射数据空间中的值,该数据空间用于创建值,无论是颜色、大小还是形状。它有助于绘制提供逆映射所需的图例或轴,从而可以从上述图中读取原始数据值。

坐标系

它描述了如何将数据坐标一起映射到所提到的图形平面。它还提供读取图表所需的轴和网格线信息。通常它被用作笛卡尔坐标系,其中包括极坐标和地图投影。

刻面

它包括有关如何将数据分解为所需子集以及如何将子集显示为数据的倍数的规范。这也称为调节或网格化过程。

主题

它控制显示的细节,例如字体大小和背景颜色属性。为了创造一个有吸引力的Plotly,最好考虑参考文献。

现在,讨论语法不提供的限制或功能也同样重要 -

  • 它缺乏应使用哪些图形或用户有兴趣做什么的建议。

  • 它不描述交互性,因为它仅包括静态图形的描述。为了创建动态图形,应应用其他替代解决方案。

下面提到了用 ggplot2 创建的简单图表 -

使用 ggplot2 创建的图表