首发于R

R 数据可视化 —— ggplot 坐标系

前言

ggplot2 包含 6 种不同的坐标系:

  • coord_cartesian: 笛卡尔坐标系
  • coord_fixed: 固定 "纵横比" 的笛卡儿坐标
  • coord_flip: xy 翻转的笛卡尔坐标
  • coord_trans: 变换笛卡尔坐标系
  • coord_map/coord_quickmap: 地图
  • coord_polar: 极坐标系

1. 笛卡尔坐标系

1.1 coord_cartesian

coord_cartesian(
  xlim = NULL,
  ylim = NULL,
  expand = TRUE,
  default = FALSE,
  clip = "on"
)

笛卡尔坐标系是最常见的坐标系类型,在坐标系上限制数据范围会将图放大(就像你用放大镜看一样)。

注意:在前面使用标度函数来设置坐标轴范围时,会删除范围之外原始数据。

示例

对于如下的点图

p <- ggplot(mtcars, aes(disp, wt)) +
  geom_point() +
  geom_smooth()
p

我们有两种方式来进行缩放

# 范围之外的数据会被设置为 NA.
p1 <- p + scale_x_continuous(limits = c(325, 500))
# 不改变数据,只是放大某一范围
p2 <- p + coord_cartesian(xlim = c(325, 500))

plot_grid(p1, p2, labels = LETTERS[1:2])

我们可以看到,在 A 图中,由于范围之外的数据删除了,在范围之内的数据上计算平滑曲线,所以看到的曲线形状发生了改变,而 B 图保持与原图相同的形状。

可以设置 expand = FALSE,不添加扩展因子,允许数据与坐标轴重叠

p1 <- p + coord_cartesian(xlim = c(325, 500), expand = FALSE)

p2 <- p + coord_cartesian(expand = FALSE)

plot_grid(p1, p2, labels = LETTERS[1:2])

类似地,对于如下热图

d <- ggplot(diamonds, aes(carat, price)) +
  stat_bin2d(bins = 25, colour = "white")
d

两种缩放方式也是不一样的

p1 <- d + scale_x_continuous(limits = c(0, 1))

p2 <- d + coord_cartesian(xlim = c(0, 1))

plot_grid(p1, p2, labels = LETTERS[1:2])

1.2 coord_fixed

coord_fixed(ratio = 1, xlim = NULL, ylim = NULL, expand = TRUE, clip = "on")

coord_fixed 确保 x 轴和 y 轴具有相同的标度,即保证在任何情况下坐标轴的纵横比不变

默认是 1:1y:x) 即参数 ratio = 1,可以通过修改 ratio 参数的值来调整两者之间的比例。

示例

例如,对于默认的图形

p <- ggplot(mtcars, aes(mpg, wt)) + geom_point()
p

设置不同的 ratio

p1 <- p + coord_fixed(ratio = 1)

p2 <- p + coord_fixed(ratio = 5)

p3 <- p + coord_fixed(ratio = 1/5)

p4 <- p + coord_fixed(xlim = c(15, 30))

plot_grid(p1, p2, p3, p4, labels = LETTERS[1:4], nrow = 4)

1.3 coord_flip

默认情况下,坐标系以横轴为 x 轴,纵轴为 y 轴。对于某些情况下,想要对 x 轴与 y 轴进行翻转,可以使用 coord_flip

coord_flip(xlim = NULL, ylim = NULL, expand = TRUE, clip = "on")

示例

箱线图翻转

p1 <- ggplot(diamonds, aes(cut, price)) +
  geom_boxplot() 

p2 <- ggplot(diamonds, aes(cut, price)) +
  geom_boxplot() +
  coord_flip()

plot_grid(p1, p2, labels = LETTERS[1:2], nrow = 2)

直方图翻转

h <- ggplot(diamonds, aes(carat)) +
  geom_histogram()

h1 <- h + coord_flip()

h2 <- h + coord_flip() + scale_x_reverse()

plot_grid(h, h1, h2, labels = LETTERS[1:3], nrow = 3)

面积翻转

df <- data.frame(x = 1:5, y = (1:5) ^ 2)

p1 <- ggplot(df, aes(x, y)) +
  geom_area()

p2 <- p1 + coord_flip()

plot_grid(p1, p2, labels = LETTERS[1:2], nrow = 2)

1.4 coord_trans

coord_trans(
  x = "identity",
  y = "identity",
  xlim = NULL,
  ylim = NULL,
  limx = "DEPRECATED",
  limy = "DEPRECATED",
  clip = "on",
  expand = TRUE
)

在前面的章节中,我们使用标度函数来对数据值进行转换后绘制,但是 coord_trans 的转换方式与其不同,它的转换发生在统计变换之后。

coord_trans 的转换会影响几何对象的形状,可能原本的直线在变换之后变成了曲线

示例

我们可以比较一下 ggplot2 中的三种转换方式

dsamp <- diamonds[sample(nrow(diamonds), 1000),]

p1 <- ggplot(dsamp, aes(log10(carat), log10(price))) +
  geom_point()

p2 <- ggplot(dsamp, aes(carat, price)) +
  geom_point() +
  scale_x_log10() +
  scale_y_log10()

p3 <- ggplot(dsamp, aes(carat, price)) +
  geom_point() +
  coord_trans(x = "log10", y = "log10")

plot_grid(p1, p2, p3, labels = LETTERS[1:3], nrow = 3)

A 图和 B 图,我们在之前的例子已经说明了,虽然三种方式的图形是一样的,但是图 A 的坐标轴范围是根据转换后的值确定的。而图 B 保留了原始数据的坐标范围,图 C 的坐标轴之间的距离经过对数变换变换之后像是被拉扯过一样,前面的间距宽,后面的间距窄,但是数据还是原来的。

坐标轴变换与标度函数变换的区别是,标度函数的变换发生在统计计算之前,而坐标轴变换是发生在统计计算之后。

例如,我们为散点图添加一条拟合曲线

d <- subset(diamonds, carat > 0.5)

p1 <- ggplot(d, aes(carat, price)) +
  geom_point() +
  geom_smooth(method = "lm") +
  scale_x_log10() +
  scale_y_log10()

p2 <- ggplot(d, aes(carat, price)) +
  geom_point() +
  geom_smooth(method = "lm") +
  coord_trans(x = "log10", y = "log10")

plot_grid(p1, p2, labels = LETTERS[1:2], nrow = 2)

在图 B 中,原来的直线由于坐标轴的变换被拉扯成曲线了

这样就可以组合标度函数和坐标变换来进行逆变换

p1 <- ggplot(dsamp, aes(carat, price)) +
  geom_point() +
  geom_smooth(method = "lm")

p2 <- ggplot(dsamp, aes(carat, price)) +
  geom_point() +
  geom_smooth(method = "lm") +
  scale_x_log10() +
  scale_y_log10() +
  coord_trans(x = scales::exp_trans(10), y = scales::exp_trans(10))

plot_grid(p1, p2, labels = LETTERS[1:2], nrow = 2)

2. 极坐标系

极坐标系最常用于绘制饼图,饼图其实就是极坐标下的堆叠条形图

还可以用于绘制雷达图(直线图)、玫瑰图(条形图)等

coord_polar(theta = "x", start = 0, direction = 1, clip = "on")

其中,theta 参数用于指定变换为角度的坐标轴,默认为 x 轴。

示例

绘制简单的饼图

pie <- ggplot(mtcars, aes(x = factor(1), fill = factor(cyl))) +
  geom_bar(width = 1)

p1 <- pie + coord_polar(theta = "y")

cxc <- ggplot(mtcars, aes(x = factor(cyl))) +
  geom_bar(width = 1, colour = "black")

p2 <- cxc + coord_polar()

plot_grid(pie, p1, cxc, p2, labels = LETTERS[1:4], nrow = 2)

更改变换为角度的轴,将会是什么样子的呢

# 不知道什么图
p3 <- cxc + coord_polar(theta = "y")

# 牛眼图
p4 <- pie + coord_polar()

plot_grid(p3, p4, labels = LETTERS[1:2], nrow = 1)

绘制百分比图

# 绘制百分比图
df <- data.frame(
  variable = c("does not resemble", "resembles"),
  value = c(20, 80)
)
ggplot(df, aes(x = "", y = value, fill = variable)) +
  geom_col(width = 1) +
  scale_fill_manual(values = c("red", "yellow")) +
  coord_polar("y", start = pi / 3) +
  labs(title = "Pac man")

3. 地图

coord_map() 使用 mapproj 包定义的投影,将地球的一部分(近似为球形)投影到 2D 平面上。

一般来说,地图投影不会保留直线,所以这需要大量的计算。而 coord_quickmap 是一种保留直线的快速近似方法。它最适合靠近赤道的小区域

示例

地图的平面展示

nz <- map_data("nz")
# Prepare a map of NZ
nzmap <- ggplot(nz, aes(x = long, y = lat, group = group)) +
  geom_polygon(fill = "white", colour = "black")

# Plot it in cartesian coordinates
nzmap

变换为地图投影

nzmap + coord_map()

使用 coord_quickmap

nzmap + coord_quickmap()

发布于 2021-04-07 14:51