如何直观地理解群论?

大部分同学在学习代数学时,都会被一大堆的概念搞得晕头转向。 几年前,我刚开始看线性代数时也是这样,完全不明白为什么要定义这些奇怪的东西。直到后来看到 …
关注者
2,180
被浏览
760,003

55 个回答


最近正好学习群论有些微小的心得,对一些基础的定义和抽象概念有了一些直观理解:

群的定义、子群、陪集、正规子群、商群、直积群、同构、同态等……

虽然这些理解只涉及了群论的很小一部分,也没办法回答这些概念如何被引入,但我相信,通过构造一些几何意义比较明显的例子来说明,对于理解它们还是有些帮助的。

注:本回答内容都是一些粗浅而不严谨的个人体会和类比,各位大神若路过还请多多指正。


0) 构造三个例子


我们在这里给出三个群来作为例子,后面将通过它们之间的一些关系来理解前面提到的那些抽象概念。


\small G_a :复平面上的旋转变换,我们用单位复指数来表示(也就是 \small \text{U}(1) )

于是群元记为:

\small g_a(\theta)=\text e^{\text i\theta} \quad{\scriptsize(式1)}

代表着将复平面上的向量旋转 \small\theta 角度

群乘法自然就是复数乘法:

\small g_a(\theta_1)g_a(\theta_2)=\text e^{\text i\theta_1}\text e^{\text i\theta_2}=\text e^{\text i\left(\theta_1+\theta_2\right)} \quad{\scriptsize(式2)}


\small G_b :正实数的乘法群,可以理解为不变号(不改变正反方向 )的伸缩变换。

群元直接记为实数 \small\lambda ,即:

\small g_b(\lambda)=\lambda \quad{\scriptsize(式3)}

( \small \lambda\in \mathbb{R}^+ )

代表着将复平面上的向量变为原来的 \small \lambda

群乘法为普通乘法:

\small g_b(\lambda_1)g_b(\lambda_2)=\lambda_1\lambda_2 \quad{\scriptsize(式4)}

( \small \lambda_1,\lambda_2\in \mathbb{R}^+ )


\small G_c :既有伸缩(不变号)又有旋转的变换。

群元可以表示成除原点外的任意复数:

\small g_c(\lambda,\theta)=\lambda\text e^{\text i\theta} \quad{\scriptsize(式5)}

( \small \theta\in\mathbb{R},\ \lambda\in \mathbb{R}^+ )

代表着将复平面上的向量伸缩 \small \lambda 倍、同时旋转 \small\theta

群乘法为复数乘法:

\small\begin{align} g_c(\lambda_1,\theta_1)g_c(\lambda_2,\theta_2)&=\left(\lambda_1\text e^{\text i\theta_1}\right)\left(\lambda_2\text e^{\text i\theta_2}\right)\\ &=\left(\lambda_1\lambda_2\right)\text e^{\text i\left(\theta_1+\theta_2\right)} \end{align} \quad{\scriptsize(式6)}

( \small \theta_1,\theta_2\in\mathbb{R},\ \lambda_1,\lambda_2\in \mathbb{R}^+ )

(可以证明它们各自构成一个群 )

下面就用这三个例子以及它们之间的关系,来分别理解本文开头提到的一些定义和概念。


1) 群定义的几何直观


群定义即著名的“封结妖逆”四字诀,我们来对它们一一进行直观理解。

  • 封闭性:两个群元相乘后仍然是群元
直观理解:
我们可以认为一个群代表了“某一类”变换,这些变换的叠加(群乘法 )也属于“同一类”。
比如例子中的群 \small G_a 中,某个群元 \small \text e^{\text i\theta_1}\in G_a 代表将复平面上的向量旋转 \small\theta_1 角度,群元 \small \text e^{\text i\theta_2}\in G_a 代表将复平面上的向量旋转 \small\theta_2 角度,而它们的乘法 \small \text e^{\text i\theta_1}\text e^{\text i\theta_2}=\text e^{\text i(\theta_1+\theta_2)} 也是复平面上的旋转变换(旋转 \small\theta_1+\theta_2 角度 ),因此 \small \text e^{\text i\theta_1}\text e^{\text i\theta_2}=\text e^{\text i(\theta_1+\theta_2)}\in G_a
  • 结合律\small g_1(g_2g_3)=(g_1g_2)g_3=g_1g_2g_3
直观理解:
结合律可以理解为连续操作的唯一性,还是以群 \small G_a 为例:
将向量先旋转 \small\theta_1+\theta_2 角度再旋转 \small \theta_3 角度,等同于将向量先旋转 \small\theta_1 角度再旋转 \small \theta_2+\theta_3 角度,结果都是将向量旋转了 \small\theta_1+\theta_2+\theta_3 角度,即:
\small \text e^{\text i\theta_3}\left(\text e^{\text i\theta_2}\text e^{\text i\theta_1}\right)=\left(\text e^{\text i\theta_3}\text e^{\text i\theta_2}\right)\text e^{\text i\theta_1}=\text e^{\text i(\theta_1+\theta_2+\theta_3)}
这个条件看起来理所当然,但为了感受它对于群定义有多么必要,我们可以构造一个反例:剪刀石头布
(这个反例来自于知乎的另一个回答,但是我忘了收藏找不到了,如果原作者看到了请前来认领…… )
如果以 {剪刀, 石头, 布} 构成一个集合,并且按照胜负规则定义所谓的乘法:
剪刀·石头=石头·剪刀=石头;
石头·布=布·石头=布;
布·剪刀=剪刀·布=剪刀
那么我们可以验证这个“乘法”不满足结合律,比如:
石头·(布·剪刀)=石头·剪刀=石头,而:(石头·布)·剪刀=布·剪刀=剪刀
这样的乘法本身就是“畸形”的,因为它无法定义唯一的“连续操作”。
  • 幺元存在性\small \exists \ e\in G ,使得 \small \forall g\in G:\ eg=ge=g
直观理解:
幺元很好理解,就是“什么都不做”的变换。还是以群 \small G_a 为例:
先什么都不做(将向量旋转零度 ),然后再将一个向量旋转 \small\theta 角,最终结果也就是将向量旋转了 \small\theta 角,即: \small eg=g\ \rightarrow\ \text e^{0}\text e^{\text i\theta}=\text e^{\text i\theta} ,其中 \small e^0=1 ,就是群 \small G_a 中的幺元。
幺元存在性就意味着允许群元“什么都不做”,否则构不成群。
  • 逆元存在性\small \forall g\in G:\ \exists \ g^{-1}\in G ,使得 \small gg^{-1}=g^{-1}g=e
直观理解:
逆元也很好理解,就是“做了又反悔”的变换。还是以群 \small G_a 为例:
先将一个向量旋转 \small\theta 角,再将它旋转 \small -\theta 角,最终结果向量还在原地,等于什么也没做,即: \small eg=g\ \rightarrow\ \text e^{0}\text e^{\text i\theta}=\text e^{\text i\theta} \small gg^{-1}\ \rightarrow\ \text e^{\text i\theta}\text e^{-\text i\theta}=\text e^{0}=1 ,其中群元 \small \text e^{-\text i\theta} 就是 \small \text e^{\text i\theta} 的逆元。
逆元存在性意味着允许群元“悔棋”,否则构不成群,只能构成半群,因为每个群元都找不到自己的另一半。

2) 陪集的几何直观


先来看群 \small G_c\small G_a

显然, \small G_a\small G_c 的一个子群,对应着 \small G_c 中的群参数 \small \lambda=1 的特殊情形。

另一方面,如果我们取伸缩系数 \small \lambda\neq 1 的群元 \small x=\lambda_x\text e^{\text i\theta_x} ,就可以得到 \small G_a 的一个左陪集:

\small xG_a=\left\{\lambda_x\text e^{\text i\left(\theta+\theta_x\right)}|\theta\in\mathbb{R}\right\} \quad{\scriptsize(式7)}

而由于 \small \theta+\theta_x\small \theta 的取值范围都是整个实数域,因此上面这个集合其实等价于:

\small xG_a=\{\lambda_x\text e^{\text i\theta}|\theta\in\mathbb{R}\} \quad{\scriptsize(式8)}

直观理解:
它的几何意义,是将复平面上的单位向量变换到半径为 \small x 的圆上的任一点的所有变换的集合,我们不妨就将它视为半径为 \small x 的圆本身。
如下图中的红色圆:
如果 \small \lambda_x=1 ,则此时 \small xG_a=G_a 就是单位圆。

同理,我们可以找出一个右陪集:

\small G_ax=\{\text e^{\text i\theta}\lambda_x|\theta\in\mathbb{R}\} \quad{\scriptsize(式9)}

由于伸缩变换和旋转变换具有可交换性,因此 \small G_ax\small xG_a 是相等的,也就具有相同的几何意义。

另一方面,我们可以看出, \small G_b 也是 \small G_c 的一个子群,对应着 \small G_c 中的群参数 \small \theta=0 的特殊情形。

这样,我们也可以同样构造 \small G_b 的左陪集和右陪集:

\small y G_b=G_by=\{\lambda\text e^{\text i\theta_y}|\lambda\in\mathbb{R^+}\} \quad{\scriptsize(式10)}

直观理解:
它的几何意义,是将实轴上的向量变成倾角为 \small \theta=\theta_y\neq 0射线上的任一点的所有变换的集合,我们也不妨直接将它视为倾角为 \small\theta=\theta_y 的射线本身。
如下图中的红色射线:
如果 \small y=0 ,则此时 \small yG_b=G_b 就是与正实轴重合的射线。

3) 正规子群的几何直观


群论里说,如果 \small G 的子群 \small H 满足:

\small \forall x\in G:\ xH=Hx,\ \text {i.e.}\ xHx^{-1}=H \quad{\scriptsize(式11)}

则称 \small H\small G正规子群,又称不变子群

在本文给出的例子中,显然 \small G_a\small G_b 都是 \small G_c 的正规子群。

直观理解:
这个例子的几何意义相对来说比较无聊:
1) \small G_a 经过共轭变换后仍然是它自身,也就是单位圆先后经过一次 \small \lambda 倍和一次 \small \frac{1}{\lambda} 倍的缩放后,还是单位圆;
2) \small G_b 经过共轭变换后仍然是它自身,也就是正实轴上的射线先后经过一次 \small\theta 角和 \small-\theta 的旋转后,又回到了正实轴上。

4) 商群的几何直观


根据商群的定义,如果 \small H\small G 的正规子群,那么相对于 \small H 的商群 \small K 定义为:

\small K=G/H=\{gH:\ g\in G\} \quad{\scriptsize(式12)}

这是我学习群论时曾经感到最困惑的概念之一,所幸当我构造出本文这个例子时,发现可以从中窥视商群的一些几何意义。

从定义我们可以看出,商群 \small K 并不是 \small G 的子群,而是正规子群 \small H 的一堆陪集 \small gH (而不是 \small G 中的群元 )重新组成的集合,但这些陪集之间同样也存在着群结构。

回到我们的例子, \small G_a\small G_c 的一个正规子群,相应的商群就是:

\small K_a=G_c/G_a=\{xG_a:\ x\in G\} \quad{\scriptsize(式13)}

那么这个商群的几何意义是什么呢?

直观理解:
根据前面讨论的左陪集 \small xG_a 的几何意义,我们不妨做这样的类比:
商群 \small K_a 在几何上就对应着复平面上所有同心圆之间的旋转加伸缩变换的集合,但由于圆在旋转变换下不变( \small \text e^{\text i\theta}G_a=G_a ),因此实际作用下来只造成伸缩变换(于是每两个同心圆之间的伸缩变换就对应着 \small K_a 的一个群元及其逆元 ),即:
\small xG_a=\lambda\text e^{\text i\theta}G_a=\lambda G_a \quad{\scriptsize(式14)}
群乘法就是两次伸缩变换的叠加,即:
\small \left(\lambda_1G_a,\lambda_2G_a\right)\ \rightarrow\ \lambda_2\lambda_1G_a \quad{\scriptsize(式15)}

另一方面, \small G_b 也是 \small G_c 的一个正规子群,相应的商群就是:

\small K_b=G_c/G_b=\{yG_b:\ y\in G\} \quad{\scriptsize(式16)}

直观理解:
根据前面讨论的左陪集 \small yG_b 的几何意义,我们也可以做出这样的类比:
商群 \small K_b 在几何上就对应着复平面上所有从原点出发的射线(不包含原点 )之间的旋转加伸缩变换的集合,但由于射线在伸缩变换下不变( \small \lambda G_b=G_b ),因此实际作用下来只造成旋转变换(每两条射线之间的旋转变换就对应着 \small K_b 的一个群元及其逆元 ),即:
\small yG_a=\lambda\text e^{\text i\theta}G_a=\text e^{\text i\theta} G_a \quad{\scriptsize(式17)}
群乘法就是两次旋转变换的叠加,即:
\small \left(\text e^{\text i\theta_1}G_b,\text e^{\text i\theta_2}G_b\right)\ \rightarrow\ \text e^{\text i\left(\theta_1+\theta_2\right)}G_b \quad{\scriptsize(式18)}

5) 直积的几何直观

根据群直积的定义:

\small H\otimes K=\{hk:\ h\in H,k\in K\} \quad{\scriptsize(式19)}

我们可以发现,群 \small G_c 正好就是群 \small G_a,G_b 的直积:

\small G_c=G_a\otimes G_b=\{\lambda\text e^{\text i\theta}:\ \text e^{\text i\theta}\in G_a,\lambda\in G_b\} \quad{\scriptsize(式20)}

而联想到前面讨论的群 \small G_a 和群 \small G_b 各自的几何意义,它们的直积群 \small G_c 的几何意义也就很明显了:

直观理解:
根据前面的类比,群 \small G_a 是旋转变换、几何上对应着单位圆,群 \small G_b 是伸缩变换,几何上对应着与正实轴重合的射线,于是两者的直积就可以从两个视角去理解:
1) 将单位圆进行伸缩,覆盖整个除原点外的复平面(后文简称“空心复平面” );
2) 将正实轴的射线进行旋转,也覆盖整个空心复平面。
无论哪种,最终得到的都是整个空心复平面,这正好也就是群 \small G_c 覆盖的区域,所以我们不妨将这个直积理解为“一条线扫完整个复平面”的过程。
另外,我们注意到,积和商是一对互逆的运算,因此直观上我们难免会产生这样的联想:
\small G_b 是否也可以看成 \small G_c “除以” \small G_a 后得到的“商”?(反之亦然 )
但我们前面已经定义了商群,而商群是陪集的集合构成的群,并不是 \small G_c 的子群,所以这似乎和直觉矛盾了。
不过没关系,马上我们会看到, \small G_b 和商群 \small K_a 其实是同构的(毕竟它们的几何意义都是伸缩变换 ),并且,几何上商群 \small K_a 可以理解为空心复平面 \small G_c “除以”同心圆后剩下的“伸缩”的动作,这和空心复平面 \small G_c “除以”同心圆 \small G_a 后得到的那条射线 \small G_b 的确是可以对应的。

6) 同态与同构的几何直观


我们先来说同态。

如果用一句话简单概括同态,就是:

同态映射就像是茶壶配茶杯的关系。——辜鸿铭

我们把这句话再说得更具体一点,并且加上群结构,就可以凑出同态的定义来:

假设有 \small m 个茶壶和 \small mn 个茶杯,且满足:

  • 所有茶壶构成一个群,记作 \small A ,所有茶杯构成另一个群,记作 \small B
  • 一把茶壶固定搭配 \small n 个茶杯,即存在映射 \small\varphi\small \left\{b_k^{(1)},b_k^{(2)},\cdots,b_k^{(n)}\right\}\ \rightarrow\ a_k
  • 映射 \small\varphi 是满射,即所有茶杯都有茶壶,所有茶壶都有茶杯,没有单身狗,真爱满人间;
  • 映射 \small\varphi 保留了各自的群乘法结构,即: \small b_{i}^{(r)}b_{j}^{(s)}=b_{k}^{(t)}\ \Rightarrow\ a_ia_j=a_k

那么群 \small A 和群 \small B 之间的映射就是同态映射。

另外,如果茶杯 \small a_E 是茶杯群中的幺元,那么它对应的茶壶的集合 \small \left\{b_E^{(1)},b_E^{(2)},\cdots,b_E^{(n)}\right\} 可以构成茶壶群的一个子群(证明略 ),这个子群被称为同态映射核,记作 \small\ker\varphi

上面说的例子是离散的,现在我们回到本文开头给出的连续群的例子。

很明显,群 \small G_c (茶杯 )到群 \small G_a (茶壶 )之间就存在一个同态映射:

\small\varphi_a:\ \lambda\text e^{\text i\theta}\ \rightarrow\ \text e^{\text i\theta} \quad{\scriptsize(式21)}

且保留了群乘法:

\small\varphi_a:\ \lambda_1\text e^{\text i\theta_1}\lambda_2\text e^{\text i\theta_2}=\lambda_1\lambda_2\text e^{\text i\left(\theta_1+\theta_2\right)}\ \rightarrow\ \text e^{\text i\left(\theta_1+\theta_2\right)} \quad{\scriptsize(式22)}

而这个同态映射的核显然就是 \small G_c\small \theta=0 的变换的集合(这映射到 \small G_a 中就是幺元 \small \text e^{\text i0}=1 ),即:

\small \ker\varphi_a=\left\{\lambda\text e^{\text i0}:\lambda\in\mathbb{R}^+\right\}=\left\{\lambda:\lambda\in\mathbb{R}^+\right\} \quad{\scriptsize(式23)}

结果我们发现,这个同态核居然就是伸缩群 \small G_b

接下来说说这个同态核的几何意义。

直观理解:
我们发现,群 \small G_c 到群 \small G_a 的同态映射 \small\varphi_a 其实等于是将空心复平面上的点全部投影到了单位圆上,这样, \small G_c 中的长度伸缩的信息就被舍弃了;
而这个同态映射的核 \small \ker\varphi_a 的几何意义也就很明显了:它就代表同态映射中丢失的长度伸缩信息。
所以在我们的例子中,同态映射其实相当于一次降维操作,被压缩的那个“维度”,就是同态映射的核。
另一方面,我们在 \small G_c 到群 \small G_b 之间也可以构造一个同态映射,此时是旋转的信息被抹去,空心复平面上的点全部降维到正实轴的射线上,而同态核就是降维时丢失的旋转信息 \small G_a
这其中的微妙关系实在值得玩味……

接下来我们来说同构。

理解了同态之后,同构映射理解起来就简单多了,只要把同态的一对多变成一对一,同态映射就变成了同构映射。

同态是一夫多妻的旧社会,同构是一夫一妻的新社会。

在我们的例子中,群 \small G_a 和群 \small G_b 之间其实就可以构造一个映射:

\small \varphi_{ba}:\ g_b=x\ \rightarrow\ g_a=\text e^{\text i\ln x} \quad{\scriptsize(式24)}

这个映射的逆映射也是唯一的:

\small \varphi_{ba}^{-1}:\ g_a=\text e^{\text i y}\ \rightarrow\ g_b=\text e^y \quad{\scriptsize(式25)}

它们显然也是满射(各自覆盖了群参数的定义域 ),并且保留了群乘法:

\small \varphi_{ba}:\ x_1x_2\ \rightarrow\ \text e^{\text i\ln (x_1x_2)}=\text e^{\text i\left(\ln x_1+\ln x_2\right)}=\text e^{\text i\ln x_1}\text e^{\text i\ln x_2} \quad{\scriptsize(式26)}

所以这就是一个同构映射。

不过这个映射并不是我们想讨论的重点,接下来我们要来讨论一个更有意思的同构映射,就是前面提到的商群 \small K_a 与子群 \small G_b 之间的同构。

这个同构映射其实十分显然:

\small{\it\Phi}:\ \lambda\text e^{\text i\theta} G_a=\lambda G_a\ \rightarrow\ \lambda \quad{\scriptsize(式27)}

( \small\lambda G_a\in K_a,\ \lambda\in G_b )

(注意:映射的左边虽然有无穷多个 \small\theta ,但由于 \small \lambda\text e^{\text i\theta} G_a=\lambda G_a ,这意味着不同 \small\theta 对应的陪集、也就是商群的群元其实只有一个,即 \small\lambda G_a ,因此这个映射是一对一的同构而不是多对一的同态 )

直观理解:
商群 \small K_a 与子群 \small G_b 之间的同构关系意味着,单位圆的缩放可以“降维”成正实轴上的向量的缩放,两种缩放本质上是可以等同的,仅仅是它们的作用对象不同而已。

另一方面,在 \small K_b\small G_a 之间,我们也能建立这样的同构关系,它意味着射线之间的旋转关系和单位圆上点之间的旋转关系是一一对应的。

这样,我们也就将商群和直积群之间的关系联系起来了。

而这种同构关系其实也可以看成著名的群同态基本定理的一个案例:

\small \varphi: G_c \to G_a 是一个群同态,记 \small G_b=\ker \varphi,则 \small G_c/G_b \cong G_a
( \small \cong 表示同构关系 )

数形结合如此完美。


本回答改编自学习笔记:

私房笔记 | 群论一些基础概念的直观理解

(笔记内容与本回答高度重合,不用重复观看 )


考虑某个对象 X

我们会从灵魂深处问出这样的问题:什么是 X 的一个对称性呢?

通常来说,我们对于这个对象 X 会有一些关于结构的前置印象(形状,距离,线性等等,比如说圆、三角、方块儿,再比如说度量,抑或是向量空间等等)。

X 的一个对称性应该是一个映射(为什么是一个从 XX 的映射呢?因为我们是对 X 进行了变换操作,而 X 本身并没变)

\phi: X\to X\tag*{}

满足

  1. 保持结构,比如 \mathrm{dist}(x,y)=\mathrm{dist}(\phi(x),\phi(y)),在比如 \phi(x+y)=\phi(x)+\phi(y) ,并且
  2. 可以撤销这一操作。


现在,我们首先来尝试一般性地瞅瞅这玩意儿咋回事,以给我们一点启发:

G=\{\phi\}X 的对称性的集合。

  1. 如果 \phi_{1},\phi_{2} 保持结构,则它们的复合 \phi_{1}\circ\phi_{2},\phi_{2}\circ\phi_{1} 也保持。
    \Rightarrow 我们可以分解 G 的元素
    \Rightarrow G\times G\xrightarrow[]{m}G ,结合性
  2. “摆烂——什么都不做”应该也是 X 的一个对称性。
    \Rightarrow \mathrm{id}_{X}\in G\mathrm{id}_{X}\circ \phi=\phi\circ\mathrm{id}_{X}=\phi
  3. 因为 \phi 可以撤销,我们应该有 \phi^{-1}\in G ,所以 \phi\circ\phi^{-1}=\mathrm{id}_{X}\phi^{-1}\circ\phi=\mathrm{id}_{X}


这样通过最一般的映射来看是不是群的定义马上就呼之欲出呢?

定义 一个群(group)是一个有序对

(G,m)\tag*{}

其中 G 是一个集合,而 m 是一个映射

\begin{aligned} G\times G&\to G\\ (g_{1},g_{2})&\mapsto m(g_{1},g_{2})=:g_{1}g_{2}=:g_{1}\cdot g_{2} \end{aligned}\tag*{}

使得

  1. m 满足结合律,i.e.
    m(m(g_{1},g_{2}),g_{3})=m(g_{1},m(g_{2},g_{3}))\tag*{}
    i.e.
    (g_{1}g_{2})g_{3}=g_{1}(g_{2}g_{3})\qquad \text{或}\qquad (g_{1}\cdot g_{2})\cdot g_{3}=g_{1}\cdot (g_{2}\cdot g_{3})\tag*{}
  2. \exists 一个元素 \mathrm{1}_{G}\in G ,使得
    m\left(\frac{1}{G},g\right)=g=m\left(g,\frac{1}{G}\right)\tag*{}
    i.e.
    \mathrm{1}_{G} g=g=g \mathrm{1}_{G}\qquad \mathrm{1}_{G}\cdot g=g=g\cdot \mathrm{1}_{G}\tag*{}
  3. \forall g\in G\exists 元素 h\in G 使得
    m(g,h)=\mathrm{1}_{G}=m(h,g)\tag*{}
    i.e.
    gh=\mathrm{1}_{g}=hg\qquad \text{或}\qquad g\cdot h=\mathrm{1}_{G}=h\cdot g\tag*{}
    我们经常记 g^{-1}:=h ,称为“ g”。