3 Groupes
3.1 Définitions, morphismes et sous-objets
Un groupe est un monoïde dans lequel tous les éléments sont inversibles. Lorsque la loi de composition est commutative, on dit que le groupe est abélien.
Un morphisme entre deux groupes \(G\) et \(G'\) est une fonction \(f \! :G → G'\) telle que, pour tous \(x\) et \(y\) dans \(G\), \(f(xy) = f(x)f(y)\) (on montrera plus bas que c’est automatiquement un morphisme de monoïdes).
L’exemple le plus fondamental de groupe est l’ensemble \(𝔖(E)\) des permutations d’un ensemble \(E\). Plus généralement, l’ensemble des unités d’un monoïde forme toujours un groupe.
Si on déplie toutes les définitions intervenant dans la définition de groupe, on voit qu’un groupe est un ensemble \(G\) muni d’une loi de composition interne qu’on notera multiplicativement pour cette discussion, d’un élément \(e ∈ G\) et d’une fonction \(x ↦ x⁻¹\) de \(G\) dans lui même tel que :
la multiplication est associative : \(∀ x\; y\; z, x(yz) = (xy)z\)
\(e\) est neutre à gauche : \(∀ x, ex = x\)
\(e\) est neutre à droite : \(∀ x, xe = x\)
\(⁻¹\) est une inversion à gauche : \(∀ x, x⁻¹x = e\).
\(⁻¹\) est une inversion à droite : \(∀ x, xx⁻¹ = e\).
Il existe de nombreuses variantes équivalentes de la liste ci-dessus. La variante choisie est très symétrique et donne d’emblée toute la structure, ce qui permet d’éviter les empilements de quantificateurs qui arrivent quand \(e\) et \(⁻¹\) ne sont pas introduits a priori et que les axiomes au-delà de l’associativité se transforment en
Cette variante peut sembler plus symétrique car elle ne fixe pas de choix de \(e\) et \(⁻¹\) mais c’est une illusion comme le montre le lemme suivant qu’on pourra parfois utiliser pour raccourcir certaines vérifications (mais ce genre de raccourci n’est jamais indispensable et le lemme suivant est surtout une curiosité dont la lecture n’est vraiment pas indispensable).
Soit \(G\) un ensemble muni d’une loi de composition interne associative. Si
alors il existe un unique \(e\) et une unique fonction \(⁻¹\) tels que \(G\) muni de sa loi de composition, de \(e\) et de \(⁻¹\) est un groupe.
Fixons \(e\) promis par la condition. Montrons d’abord que
Soit \(x\) dans \(G\). Par hypothèse sur \(e\) appliquée à \(x\) on obtient \(y\) tel que \(yx = e\). Par hypothèse sur \(e\) appliquée à \(y\) on obtient \(z\) tel que \(zy = e\). On calcule alors, en utilisant aussi que \(∀ w, ew = w\) et l’associativité,
Montrons maintenant \(∀ w, we = w\). Soit \(w\). On obtient par hypothèse un \(y\) tel que \(yw = e\) et le paragraphe précédent assure qu’on a aussi \(wy = e\). On calcule alors \(we = w(yw) = (wy)w = ew = w\).
On en déduit immédiatement l’unicité de \(e\). En effet si \(e'\) convient aussi, la propriété de \(e'\) donne \(e'e = e\) et le paragraphe précédent donne \(e'e = e'\).
Montrons que, \(∀ x, ∃! y, xy = e \text{ et } yx = e\). Soit \(x\) dans \(G\). On a déjà l’existence de \(y\). Supposons que \(y'\) convient aussi. On a alors \(xy = xy'\) qu’on multiplie à gauche à par \(y\) pour obtenir \(y = y'\). On obtient ainsi une unique fonction d’inversion.
Au vu de ce lemme, on peut être tenté de radiner sur les axiomes dans la définition de groupe. Les lecteurs et lectrices tentés par cette mesquinerie sont invités à s’auto-punir en essayant de montrer que, pour tout ensemble \(G\) non vide muni d’une loi de composition interne et d’une fonction \(⁻¹ \! :G → G\), il existe \(e ∈ G\) tel que \((G, \cdot , ⁻¹, e)\) est un groupe si et seulement si
Le lemme suivant liste quelques propriétés fondamentales des morphismes de groupes. On pourrait argumenter que les deux premiers items pourraient faire partie de la définition plutôt que de radiner mais cela permet de souligner le contraste avec les propriétés des morphismes multiplicatifs en général.
Soit \(f \! :G → G'\) un morphisme de groupes.
\(f(1_G) = 1_{G'}\) (\(f\) est donc un morphisme de monoïdes)
\(∀ x, f(x⁻¹) = f(x)⁻¹\).
\(f\) est injectif si et seulement si \(\ker (f) = \{ 1_G\} \) où, par définition, \(\ker (f) = f⁻¹(\{ 1_{G'}\} )\).
Si \(f\) est bijectif alors \(f⁻¹\) est automatiquement un morphisme de groupes. On dit alors que \(f\) est un isomorphisme entre \(G\) et \(G'\).
Pour le premier point, on commence par noter que \(1_G1_G = 1_G\) donc on obtient \(f(1_G)f(1_G) = f(1_G) = f(1_G)1_{G'}\). Comme \(f(1_G)\) est inversible (car tous les éléments de \(G'\) le sont), il est simplifiable à gauche d’après le lemme 2.0.4 donc \(f(1_G) = 1_{G'}\). Ainsi \(f\) est un morphisme de monoïdes donc le lemme 2.0.7 et le premier point règlent les deuxième et quatrième points.
Montrons le troisième point. Soit \(x\) et \(y\) dans \(G\). On a
\begin{align*} f(x) = f(y) & ⇔ f(x)f(y)⁻¹ = 1_{G'} \\ & ⇔ f(xy⁻¹) = 1_{G'} \\ & ⇔ xy⁻¹ ∈ \ker f \end{align*}donc \(f\) est injectif si et seulement si \(∀ x\; y, xy⁻¹ \in \ker f ⇔ x = y\). Ainsi si \(\ker f = \{ 1_G\} \) alors \(f\) est injective. Réciproquement si \(f\) est injective alors \(∀ x\; y, xy⁻¹ \in \ker f ⇔ x = y\) et on peut spécialiser cet énoncé à \(y = 1_G\) pour obtenir \(∀ x, x \in \ker f ⇔ x = 1_G\), c’est à dire \(\ker f = \{ 1_G\} \).
On peut bien sûr définir le noyau d’un morphisme de monoïde et on obtient ainsi un sous-monoïde. Mais il s’agit d’une notion peu intéressante car l’analogue du dernier point du lemme ci-dessus n’est pas vrai. Considérons par exemple une fonction \(f\) idempotente d’un ensemble \(X\) dans lui-même qui n’est pas l’identité, disons la projection de \(ℤ²\) sur le premier facteur. Le morphisme de \(ℕ\) dans \(X^X\) qui envoie \(n\) sur \(fⁿ\) a un « noyau » réduit au neutre \(0\) mais il n’est pas injectif car tous les entiers strictement positifs sont envoyés sur \(f\).
On note \(\operatorname{Aut}(G)\) l’ensemble des isomorphismes d’un groupe \(G\) dans lui-même. Il s’agit d’une groupe pour la structure induite par \(\operatorname{Aut}(G) ⊂ 𝔖(G)\) (on reverra dans un instant la notion de sous-groupe).
Soit \(G\) un groupe.
Pour tout \(g\) dans \(G\), on définit \(c_g : G → G\) comme \(h ↦ ghg⁻¹\). Il s’agit un automorphisme de \(G\) appelé la conjugaison par \(g\).
L’application \(g ↦ c_g\) est un morphisme de \(G\) dans \(\operatorname{Aut}(G)\).
Pour tout \(g\) dans \(G\), on définit \(L_g : G → G\) comme \(h ↦ gh\). Il s’agit d’une bijection de \(G\) appelée translation à gauche par \(g\), mais ce n’est pas un morphisme de groupe, sauf si \(g = 1\). Par contre \(g ↦ L_g\) est un morphisme injectif de \(G\) dans \(𝔖(G)\).
Soit \(G\) un groupe.
\(\{ 1\} \) et \(G\) sont des sous-groupes de \(G\).
\(\operatorname{Aut}(G)\) est un sous-groupe de \(𝔖(G)\).
La définition ci-dessus est écrite pour assurer que la structure de groupe sur \(G\) se restreint en structure de groupe sur \(H\). Le premier point du lemme suivant donne un critère qui est parfois plus commode à vérifier.
Soit \(G\) et \(G'\) des groupes, \(H ⊂ G\), \(H' ⊂ G'\) et \(f \! :G → G'\) un morphisme.
\(H ≤ G ⇔ \big (H ≠ ∅ \text{ et } ∀ x\; y,\; x ∈ H \text{ et } y ∈ H ⇒ xy⁻¹ ∈ H\big )\)
Si \(H ≤ G\) alors \(f(H) ≤ G'\). En particulier \(\operatorname{im}(f) ≤ G'\).
Si \(H' ≤ G'\) alors \(f⁻¹(H') ≤ G\). En particulier \(\ker (f) ≤ G\).
L’intersection d’une famille de sous-groupes de \(G\) est un sous-groupe de \(G\).
Dans le premier point, l’implication de la gauche vers la droite est claire. Supposons maintenant que \(H\) n’est pas vide et que pour tous \(x\) et \(y\) dans \(H\), \(xy⁻¹\) est dans \(H\). La première hypothèse fournit \(x₀ ∈ H\). La deuxième assure alors que \(x₀x₀⁻¹ ∈ H\), c’est à dire \(1 ∈ H\). Soit \(x\) dans \(H\). Comme \(1 ∈ H\), on obtient \(1x⁻¹ ∈ H\) donc \(x⁻¹ ∈ H\). Soit \(x\) et \(y\) dans \(H\). Comme \(y⁻¹\) est aussi dans \(H\), on obtient \(x(y⁻¹)⁻¹ ∈ H\) donc \(xy ∈ H\).
Pour les autres points, il suffit d’appliquer le lemme 2.0.13 concernant les monoïdes en vérifiant en plus la stabilité par inversion.
Soit \(H\) un sous-groupe de \(G\) et \(f(x) ∈ f(H)\). Comme \(f(x)⁻¹ = f(x⁻¹)\), \(f(x⁻¹) ∈ f(H)\).
Soit \(H'\) un sous-groupe de \(G'\) et \(x ∈ f⁻¹(H')\). Comme \(f(x⁻¹) = f(x)⁻¹\) et que \(H'\) est stable par inversion, \(f(x⁻¹)\) est dans \(H'\).
Soit \(ℋ\) une famille de sous-groupe de \(G\) et \(K\) l’intersection des éléments de \(ℋ\). Soit \(x ∈ K\). Pour tout \(H ∈ ℋ\), \(x⁻¹\) est dans \(H\), donc \(x⁻¹\) est dans \(K\).
Le second point du lemme ci-dessus et le dernier point de l’exemple 3.1.5 expliquent en quel sens les groupes de permutations sont les exemples fondamentaux.
Tout groupe est isomorphe à un sous-groupe d’un groupe de permutations, via les translations à gauche qui envoient \(G\) injectivement dans \(𝔖(G)\).
Le sous-groupe engendré par une partie \(S\) d’un groupe \(G\) est l’intersection de tous les sous-groupes de \(G\) contenant \(S\) :
Si \(⟨S⟩ = G\), on dit que \(S\) engendre \(G\), ou bien que \(S\) est une partie génératrice de \(G\). On dit que \(G\) est cyclique s’il est engendré par un singleton.
La terminologie « groupe cyclique » est parfois réservée aux groupes finis. On utilise alors la terminologie « groupe monogène » pour les groupes infinis engendré par un singleton. Par ailleurs la formulation « engendré par un singleton » est un peu pédante, en pratique on dit plutôt « engendré par un élément », même si c’est techniquement moins correct.
Le lemme suivant rassemble les propriétés formelles des sous-groupes engendrés.
sous-groupe engendré Soit \(S\) une partie d’un groupe \(G\).
\(⟨S⟩\) est un sous-groupe de \(G\) qui contient \(S\).
Pour tout \(H ≤ G\), \(⟨S⟩ ≤ H ⇔ S ⊂ H\) (ainsi \(⟨S⟩\) est le plus petit sous-groupe de \(G\) qui contient \(S\)). Cette propriété universelle caractérise \(⟨S⟩\).
L’application \(⟨\cdot ⟩\) est croissante : \(∀ S\; S', S ⊂ S' ⇒ ⟨S⟩ ⊂ ⟨S'⟩\).
Pour tout morphisme \(f \! :G → G'\), \(⟨f(S)⟩ = f(⟨S⟩)\).
C’est exactement la même démonstration que pour le lemme 2.0.16 car cette dernière a été rédigé de façon suffisamment abstraite.
Comme dans le cas des sous-monoïdes, on a aussi une description explicite.
Soit \(S\) une partie d’un groupe \(G\). Les éléments du sous-groupe engendré par \(S\) sont tous les produits (finis) d’éléments de \(S\) et d’inverses d’éléments de \(S\) :
où le cas \(k = 0\) correspond au produit vide, c’est à dire au neutre de \(G\).
L’ensemble \(H\) du membre de droite contient \(1\) par définition et il est stable par multiplication et inversion. C’est donc un sous-groupe qui contient \(S\). De plus tout sous-groupe contenant \(S\) contient nécessairement \(H\) car il doit contenir \(1\) et \(S\) et être stable par produit et inversion. Donc \(H\) vérifie la propriété universelle de \(⟨S⟩\) donc \(H = ⟨S⟩\) d’après le lemme précédent.
L’ordre d’un groupe est son cardinal. L’ordre d’un élément d’un groupe est l’ordre du sous-groupe qu’il engendre.
Dans \((ℤ/4ℤ, +)\) l’élément \(1\) est d’ordre \(4\), ce qui est aussi l’ordre de \(ℤ/4ℤ\), car \(1\) engendre \(ℤ/4ℤ\). L’ordre de \(2\) est \(2\) car le sous-groupe engendré par \(2\) est \(\{ 0, 2\} \).
groupe produit En plus de la notion de sous-groupe, l’autre façon facile de créer des nouveaux groupes à partir d’anciens est de prendre des produits. Si \((G_i)_{i ∈ I}\) est une famille de groupes alors la multiplication et l’inversion composante par composante définissent une structure de groupe sur \(\prod _i G_i\). Le groupe obtenu est appelé le groupe produit des \(G_i\). Chaque projection \(pⱼ \! :∏_i G_i → Gⱼ\) est un morphisme de groupe par construction. Le produit est caractérisé, à unique isomorphisme près, par la propriété universelle suivante : pour tout groupe \(H\) et toute collection de morphismes de groupes \(φ_i : H → G_i\), il existe un unique morphisme \(φ : H → ∏_i G_i\) tel que \(p_j ∘ φ = φ_j\) pour tout \(j\).
3.2 Actions de groupes
Soit \(ρ\) une action de \(G\) sur \(X\). Il est parfois commode de penser en terme de la fonction décurryfiée \(\barρ \! :G × X → X\) qui envoie \((g, x)\) sur \(ρ(g)(x)\) (par exemple si \(G\) et \(X\) sont munis d’une structure topologique, on peut parler de continuité de \(\barρ\) sans avoir à discuter de quelle topologie on munit \(𝔖(X)\)). Mais ce point de vue rend beaucoup moins élégant l’écriture de la définition, il faut demander, pour tous \(g₁\), \(g₂\) et \(x\), \(\barρ(g₁g₂, x) = \barρ(g₁, \barρ(g₁, x))\) plutôt que d’écrire simplement \(ρ(g₁g₂) = ρ(g₁)ρ(g₂)\).
Lorsque le contexte est clair, on omet souvent le symbole désignant le morphisme et les parenthèses indiquant l’application de fonction, on écrit simplement \(gx\) plutôt que \(ρ(g)(x)\). La définition prend alors l’allure d’une règle d’associativité : pour tous \(g₁\), \(g₂\) et \(x\), \((g₁g₂)x = g₁(g₂x)\). On écrit aussi \(G ↷ X\) pour dire « \(G\) agit sur \(X\) » ou \(ρ \! :G ↷ X\) pour introduire une action \(ρ\) de \(G\) sur \(X\).
Soit \(G\) un groupe, on note \(Gᵒᵖ\) le groupe obtenu en munissant l’ensemble \(G\) de la loi de composition interne \(⋆\) définie par \(g⋆h = hg\) pour tous \(g\) et \(h\) dans \(G\). On vérifie sans peine qu’il s’agit d’un groupe, avec le même neutre et la même fonction d’inversion. On l’appelle groupe opposé de \(G\). Une action à droite de \(G\) sur un ensemble \(X\) est une action à gauche de \(Gᵒᵖ\) sur \(X\). Soit \(ρ\) une telle action, on a alors, pour tous \(g₁\), \(g₂\) et \(x\), \(ρ(g₁g₂)x = ρ(g₂ ⋆ g₁)x = ρ(g₂)ρ(g₁)x\). On voit donc qu’il faut écrire l’élément agissant à droite pour retrouver une règle d’associativité : \(x(g₁g₂) = (xg₁)g₂\). On utilise la notation \(X ↶ G\) pour dire que \(G\) agit à droite sur \(X\). On notera que l’inversion est un morphisme de \(G\) dans \(Gᵒᵖ\) et que \((Gᵒᵖ)ᵒᵖ = G\) donc on peut toujours convertir une action à gauche en action à droite et vice-versa en précomposant par l’inversion. Dans toute la suite, quand on écrira « action » sans précision, il s’agira toujours d’une action à gauche. Tous les énoncés généraux sur les actions de groupes sont valables, mutatis mutandis, pour les actions à droite, la démonstration consistant à appliquer l’énoncé au groupe opposé.
Pour tout ensemble \(X\), \(𝔖(X)\) et ses sous-groupes agissent sur \(X\). Par exemple, si \(V\) est un espace vectoriel, \(\operatorname{GL}(V)\) agit sur \(V\). Tout groupe \(G\) agit sur lui-même par conjugaison et par translation à gauche (cf. exemple 3.1.5). Il agit aussi à droite sur lui-même par translation à droite : \(g ↦ (R_g \! :h ↦ hg)\). Le groupe des matrices inversibles de taille \(n\) à coefficients dans un corps \(𝕂\) agit sur \(𝕂ⁿ\) par multiplication. Le groupe \(𝔖ₙ\) des permutations de \(\{ 1, \dots , n\} \) agit à droite sur l’ensemble des matrices \(ℳₙ(𝕂)\) par permutations des lignes : \((Aσ)_{i,j} = A_{σ(i), j}\). On peut aussi permuter les colonnes. Pour toute action d’un groupe \(G\) sur un ensemble \(X\), \(G\) agit sur l’ensemble \(𝒫(X)\) des parties de \(X\) : \(gA\) est l’image directe de \(A\) par l’action de \(g\) sur \(X\). Pour toute action d’un groupe \(G\) sur un ensemble \(X\) et pour tout ensemble \(Y\), \(G\) agit à droite sur \(Y^X\), l’ensemble des fonctions de \(X\) dans \(Y\), par pré-composition : \(∀ g\; f, fg = (x ↦ f(gx))\). Le groupe \(G\) agit aussi à gauche sur \(X^Y\), par post-composition. On notera que les deux exemples précédents peuvent être vus comme des cas particuliers de celui-ci.
Soit \(G\) un groupe agissant sur un ensemble \(X\) et \(x\) un élément de \(X\).
L’orbite de \(x\) sous l’action de \(G\) est \(𝒪ₓ = \{ gx ; g ∈ G\} \), parfois noté simplement \(G\cdot x\) ou \(Gx\) (quand le groupe n’est pas clair d’après le contexte) ou \(ω(x)\).
Le stabilisateur de \(x\) est \(G_x := \{ g ∈ G \; |\; gx = x\} \), parfois noté \(\operatorname{Stab}_G(x)\).
Le fixateur d’un élément \(g\) de \(G\) est \(\operatorname{Fix}_g := \{ x ∈ X \; |\; gx = x\} \), parfois noté \(X^g\).
La diversité des notations dans la définition précédente est un peu désagréable mais elle provient directement de l’ubiquité de ces notions. En écriture manuscrite on évitera d’utiliser simultanément \(Gₓ\) et \(Gx\).
Pour l’action standard de \(\operatorname{SO}₂(ℝ)\) sur \(ℝ²\), l’orbite de l’origine est réduite à l’origine tandis que celle de tout autre point est un cercle autour de l’origine. C’est l’origine de la terminologie orbite. Le stabilisateur de l’origine est tout \(\operatorname{SO}₂(ℝ)\) tandis que les autres points ont tous un stabilisateur trivial (ie. réduit au neutre de \(\operatorname{SO}₂(ℝ)\), la matrice \(I₂\)). Tous les éléments de \(\operatorname{SO}₂(ℝ)\) ont un fixateur réduit à l’origine, sauf \(I₂\) dont le fixateur est tout \(ℝ²\).
Soit \(G\) un groupe et \(H ≤ G\). Les orbites de l’action par translation à droite de \(H\) sur \(G\) sont appelées classes à gauche suivant \(H\). Les orbites de l’action par translation à gauche de \(H\) sur \(G\) sont appelées classes à droite suivant \(H\).
Pour toute action d’un groupe \(G\) sur un ensemble \(X\), le stabilisateur d’une partie \(A\) pour l’action induite sur \(𝒫(X)\) est l’ensemble des \(g\) tels que \(g(A) = A\) (on dit que \(A\) est invariant sous l’action de \(g\)). Il ne faut pas confondre cette condition avec la condition plus forte demandant que \(A\) soit fixé point par point : \(∀ a ∈ A, ga = a\). Attention, on dit parfois que \(A\) est stable par \(g\) si \(g(A) ⊂ A\) mais il s’agit d’une condition plus faible que l’invariance (par exemple \(ℝ₊\) est stable par la translation \(x ↦ x + 1\) mais pas invariant). Le lemme suivant assure que cette subtilité n’apparait pas quand une partie est stable par tous les éléments d’un groupe.
Soit \(G ↷ X\) une action de groupe. Une partie \(A\) de \(X\) est stable sous l’action de tous les éléments de \(G\) si et seulement si elle est invariante sous l’action de tous les éléments de \(G\).
Si \(A\) est invariante alors elle est stable car \(∀ g, gA = A ⇒ gA ⊂ A\). Réciproquement supposons \(∀ g, gA ⊂ A\). Soit \(g\) dans \(G\). On a \(gA ⊂ A\) mais aussi \(g⁻¹A ⊂ A\) donc \(gg⁻¹A ⊂ gA\), c’est à dire \(A ⊂ gA\). Ainsi \(gA = A\) par double inclusion.
Le stabilisateur d’un point est un sous-groupe du groupe qui agit.
Soit \(x\) un élément de \(X\). Le stabilisateur \(Gₓ\) contient \(1\) car \(1\) agit comme \(\operatorname{Id}_X\). Soit \(g\) et \(h\) dans \(Gₓ\). On a \(hx = x\) donc \(x = h⁻¹x\) donc \(h⁻¹ ∈ Gₓ\). De plus \(ghx = gx = x\) donc \(gh ∈ Gₓ\). On remarque que le critère du lemme 3.1.8 n’aide pas ici car il n’y a pas de moyen plus simple de vérifier que \(Gₓ\) est non vide que de vérifier qu’il contient \(1\) ni de façon de montrer que \(gh⁻¹ ∈ Gₓ\) sans montrer que \(h⁻¹ ∈ Gₓ\).
Si \(y = gx\), les stabilisateurs \(G_x\) et \(G_y\) sont conjugués par \(g\) : \(G_y = c_g(G_x)\). En particulier ils ont même cardinal.
Soit \(g'\) dans \(G\). On a
\begin{align*} g’ ∈ G_y & ⇔ g’y = y \\ & ⇔ g’gx = gx \\ & ⇔ g⁻¹g’gx = x \\ & ⇔ c_{g⁻¹}(g’) ∈ G_x \\ & ⇔ g’ ∈ c_{g⁻¹}⁻¹(G_x) \\ & ⇔ g’ ∈ c_g(G_x) \qedhere \end{align*}Soit \(ρ : G → 𝔖(X)\) une action de groupe. On dit que cette action est :
libre si \(∀ g ≠ 1, ∀ x, gx ≠ x\), autrement dit, \(∀ x, Gₓ = \{ 1\} \) ou encore \(∀ g ≠ 1, \operatorname{Fix}_g = ∅\) ;
fidèle si \(ρ\) est injective, autrement dit, \(⋂_x Gₓ = \{ 1\} \) ou encore \(∀ g ≠ 1, \operatorname{Fix}_g ≠ X\) ;
transitive s’il existe \(x₀\) tel que \(𝒪_{x₀} = X\). De façon équivalente, l’action est transitive si \(∀ x, 𝒪ₓ = X\).
Toute action libre sur un ensemble non vide est fidèle.
L’action d’un groupe sur lui-même par translation à gauche (ou à droite) est libre et transitive.
L’action de \(ℤ\) sur \(ℤ × ℤ\) par translation de la première composante est libre mais pas transitive.
L’action standard de \(\operatorname{SO}₂(ℝ)\) sur \(ℝ²\) est fidèle mais pas libre ni transitive.
L’action de \(ℤ²\) sur \(ℤ\) définie par \(∀ (k, l)\; m, (k, l)m = k + m\) est transitive mais pas fidèle (et donc a fortiori pas libre).
L’observation suivante est très facile mais fondamentale.
La relation est réflexive car, pour tout \(x\), \(1x = x\). Elle est symétrique car, pour tous \(x\) et \(y\) tels que \(x ∼ y\), on obtient \(g\) tel que \(gx = y\) et on alors \(y = g⁻¹x\). Elle transitive car pour tous \(x\), \(y\) et \(z\) tels que \(x ∼ y\) et \(y ∼ z\), on obtient \(g\) et \(g'\) tels que \(x = gy\) et \(y = g'z\) et on a alors \(x = gg'z\).
On notera qu’il est possible de définir la notion d’action pour des structures algébriques plus faibles que les groupes comme les monoïdes, mais la proposition ci-dessus utilise toute la structure de groupe. Par exemple le corollaire suivant serait faux pour les actions de monoïdes (avec le même contre-exemple que dans la remarque 3.1.4, vu comme action de \(ℕ\) sur \(ℤ\)).
Les orbites d’une action de groupe forment une partition. De plus, pour tous \(x\) et \(y\), \(𝒪ₓ = 𝒪_y ⇔ ∃ g, y = gx\).
Les orbites sont les classes d’équivalence de la relation associée à l’action.
Soit \(H\) un sous-groupe d’un groupe \(G\). Pour tout section \(σ \! :G/H → G\), c’est à dire tout fonction telle que \(π ∘ σ = \operatorname{Id}\), l’application de \(G/H × H\) dans \(G\) qui envoie \((y, h)\) sur \(σ(y)h\) est une bijection.
Montrons l’injectivité. Soit \((y, h)\) et \((z, k)\) tels que \(σ(y)h = σ(z)k\). On a \(σ(y) = σ(z)kh⁻¹\) et \(kh⁻¹\) est dans \(H\) donc \(σ(y) ∼ σ(z)\) donc \(π(σ(y)) = π(σ(z))\), c’est à dire \(y = z\) puisque \(π ∘ σ = \operatorname{Id}\). L’égalité \(σ(y)h = σ(z)k\) se réécrit donc \(σ(y)h = σ(y)k\) et on en déduit \(h = k\). Ainsi \((y, h) = (z, k)\).
Montrons maintenant la surjectivité. Soit \(g\) dans \(G\). On pose \(y = π(g)\). Comme \(π(g) = π(σ(y))\), on a \(g ∼ σ(y)\) donc on obtient \(h ∈ H\) tel que \(g = σ(y)h\).
Notons qu’on peut aussi expliciter l’inverse de cette application, il s’agit de \(g ↦ (π(g), σ(π(g))⁻¹g)\), mais cela ne rend pas la démonstration plus claire.
Pour tout sous-groupe \(H\) d’un groupe \(G\), \(♯G = ♯(G/H)♯H\). En particulier le cardinal de \(H\) divise celui de \(G\). En particulier, pour tout \(x ∈ G\), \(o(x) \mid ♯G\) et donc \(x^{♯G} = 1\).
Il suffit d’appliquer la proposition précédente à une section de \(G → G/H\) fournie par l’axiome du choix (bien sûr dans le cas où \(G\) est fini cet axiome n’est pas nécessaire ici).
Soit \(G\) un groupe agissant sur un ensemble \(X\). Pour tout \(A ⊂ X\), on a
Il suffit de dérouler les définitions. Les trois premières lignes du calcul suivant ne sont pas spécifiques au cas des actions de groupe.
\begin{align*} π⁻¹(π(A)) & = \{ x | π(x) ∈ π(A)\} \\ & = \{ x \; |\; ∃ a ∈ A, π(a) = π(x) \} \\ & = \{ x \; |\; ∃ a ∈ A, a ∼ x \} \\ & = \{ x \; |\; ∃ a ∈ A, ∃ g ∈ G, x = ga \} \\ & = \{ x \; |\; ∃ g ∈ G, x ∈ gA \} \\ & = ⋃_{g ∈ G} gA \qedhere \end{align*}Soit \(G\) un groupe, \(X\) et \(Y\) des ensembles. Étant donnée une action de \(G\) sur \(X\), on dit qu’une fonction \(f \! :X → Y\) est \(G\)-invariante si, pour tous \(g\) et \(x\), \(f(gx) = f(x)\). Dans ce cas \(f\) descend en fonction de \(G \backslash X\) dans \(Y\). quotient par une action de groupe
Si \(Y\) aussi est muni d’une action de \(G\), on dit que \(f\) est \(G\)-équivariante si, pour tous \(g\) et \(x\), \(f(gx) = gf(x)\). Dans ce cas \(f\) descend en application de \(G \backslash X\) dans \(G \backslash Y\).
On notera qu’une fonction \(G\)-invariante n’est rien d’autre qu’une fonction qui est \(G\)-équivariante pour l’action triviale de \(G\) sur \(Y\) (celle qui envoie tous les éléments de \(G\) sur \(\operatorname{Id}_Y\)).
Soit \(𝕂\) un corps et \(E\) un \(𝕂\)-espace vectoriel. On note \(ℙ(E)\) l’espace projectif sur \(E\), c’est à dire l’ensemble des droites vectorielles de \(E\). On considère l’action du groupe multiplicatif \(𝕂^× = 𝕂 ∖ \{ 0\} \) sur \(E ∖ \{ 0\} \) par multiplication scalaire. L’application \(f \! :E ∖ \{ 0\} → ℙ(E)\) qui envoie \(v\) sur \(𝕂v\) est \(𝕂^×\)-invariante et induit une bijection de \(𝕂^× \backslash (E ∖ \{ 0\} )\) sur \(ℙ(E)\).
Toute application linéaire inversible \(φ ∈ \operatorname{GL}(E)\) se restreint en permutation \(𝕂^×\)-équivariante de \(E ∖ \{ 0\} \) qui induit une permutation au quotient. Vu dans l’identification précédente, il s’agit de la permutation de \(ℙ(E)\) qui envoie toute droite sur son image par \(φ\).
Le théorème fondamental suivant relie l’action de \(G\) sur lui-même par translation à droite et son action sur \(X\).
Pour tout \(x\), on considère l’action de \(Gₓ\) sur \(G\) par translation à droite. L’application de \(G\) dans \(X\) qui envoie \(g\) sur \(gx\) descend au quotient en bijection \(G/Gₓ → 𝒪ₓ\). En particulier \(♯(G/Gₓ) = ♯𝒪ₓ\).
On a vu dans le théorème 1.0.5 qu’il suffit de vérifier que, \(∀ g\; g', g ∼ g' ⇔ gx = gx'\) et que \(g ↦ gx\) est surjective de \(G\) dans \(𝒪ₓ\). La surjectivité provient directement de la définition de \(𝒪ₓ\). Montrons la première condition. Soit \(g\) et \(g'\) dans \(G\). On a :
\begin{align*} g ∼ g’ & ⇔ ∃ h ∈ Gₓ, gh = g’ \\ & ⇔ g⁻¹g’ ∈ Gₓ \\ & ⇔ g⁻¹g’x = x \\ & ⇔ g’x = gx \qedhere \end{align*}Soit \(G\) un groupe fini agissant sur un ensemble fini \(X\). Soit \(σ \! :G\backslash X → X\) une section de la projection \(π \! :X → G\backslash X\) (c-à-d une application telle que \(π ∘ σ = \operatorname{Id}_{G\backslash X}\)). On a l’équation aux classes :
et chaque terme de la somme est un entier. En particulier, si \(G\) agit librement sur \(X\) alors \(♯X = ♯(G\backslash X) ♯G\).
Lorsque \(G\) est fini et qu’on considère l’action (libre) d’un sous-groupe par translation, on retrouve le théorème de Lagrange.
Le théorème suivant est une réciproque partielle du théorème de Lagrange. Il en existe de nombreuses démonstrations. Nous utiliserons l’équation aux classes et le lemme arithmétique suivant.
Soit \(p\) un nombre premier et \(m\) un entier naturel. Si \(m\) n’est pas divisible par \(p\) alors le coefficient binomial \(\binom {pᵏm}{pᵏ}\) ne l’est pas non plus.
On commence par donner une démonstration sophistiquée puis on expliquera une démonstration artisanale. Pour tout \(P\) et \(Q\) dans \(ℤ/pℤ[X]\) on a \((P + Q)^p = P^p + Q^p\). Cette observation classique dans le cas de \(ℤ/pℤ\) sera généralisée pour inclure notamment le cas de \(ℤ/pℤ[X]\) dans le lemme 7.4.8. On peut donc calculer \((1 + X)^{p^km} = (1 + X^{p^k})^m\) donc le coefficient de \(X^{p^k}\) dans ce polynôme est \(m\). Par ailleurs la formule du binôme de Newton assure que ce coefficient est aussi \(\binom {p^km}{p^k}\). Ainsi on a \(\binom {p^km}{p^k} = m\) dans \(ℤ/pℤ\). Par hypothèse l’image de \(m\) dans \(ℤ/pℤ\) n’est pas nulle donc celle de \(\binom {p^km}{p^k}\) non plus.
Donnons maintenant une démonstration élémentaire qui reste dans \(ℤ\). Pour tous entiers naturels \(n\) et \(q\) avec \(q ≤ n\), on a
Pour \(n = pᵏm\) et \(q = pᵏ\), on obtient
Pour tout \(j ≤ pᵏ\), on écrit \(j = p^{vⱼ}mⱼ\) où \(p ∤ mⱼ\) et \(vⱼ {\lt} k\) sauf pour \(j = pᵏ\) où \(vⱼ = k\) et \(mⱼ = 1\). Dans tous les cas \(vⱼ ≤ k\). On a alors \(pᵏm - pᵏ + j = p^{vⱼ}(p^{k - vⱼ}(m-1) + mⱼ)\). On pose \(nⱼ = p^{k - vⱼ}(m-1) + mⱼ\) et on observe que \(p\) ne divise pas \(nⱼ\). En effet, si \(j {\lt} pᵏ\) on a \(vⱼ {\lt} k\) donc \(p |p^{k - vⱼ}(m-1)\) et \(p\) ne divise pas \(mⱼ\) tandis que dans le cas \(j = pᵏ\), \(nⱼ = m\) et c’est notre hypothèse sur \(m\).
Ainsi la grande équation ci-dessus devient
où \(p\) ne divise aucun des \(nⱼ\) donc, comme \(p\) est premier, \(p\) ne divise pas non plus le coefficient binomial.
Soit \(G\) un groupe fini et \(p\) un nombre premier. On écrit \(♯G = pᵏ m\) avec \(p ∤ m\). Il existe un sous-groupe \(H ≤ G\) de cardinal \(pᵏ\). On dit que \(H\) est un \(p\)-Sylow de \(G\).
On note \(X\) l’ensemble des parties de \(G\) de cardinal \(pᵏ\). Cet ensemble est de cardinal \(\binom {pᵏm}{pᵏ}\). On considère l’action de \(G\) sur \(𝒫(G)\) induite par l’action par translation à gauche de \(G\) sur lui-même, comme dans l’exemple 3.2.2. Comme les bijections préservent le cardinal, cette action se restreint en action de \(G\) sur \(X\). Soit \(σ : G \backslash X → X\) une section du quotient. L’équation aux classes montre que \(♯X\) est la somme des entiers \(♯G/♯G_{σ(y)}\) pour \(y\) parcourant le quotient. D’après le lemme 3.2.22, le cardinal de \(X\) n’est pas divisible par \(p\). Donc, pour au moins un \(y\), \(♯G/♯G_{σ(y)}\) n’est pas divisible par \(p\). Posons \(A = σ(y)\) pour un tel \(y\) et \(d = ♯G/♯G_{σ(y)}\). On a donc \(pᵏm = ♯G = d♯G_A\) et \(p ∤ d\). Comme \(p\) est premier, on en déduit \(pᵏ | ♯G_A\). Or \(G_A\) agit sur \(A\) et, comme l’action de \(G\) sur \(X\) est libre, l’action de \(G_A\) sur \(A\) l’est aussi. Donc \(♯G_A | ♯A\) par le cas particulier de l’équation aux classes. Or \(♯A = pᵏ\) par définition de \(X\). Donc \(♯G_A | pᵏ\) et finalement \(♯G_A = pᵏ\) par antisymétrie de la relation de divisibilité sur \(ℕ\). Ainsi \(G_A\) est un \(p\)-Sylow de \(G\). On notera le coup de théâtre : le \(p\)-Sylow n’est pas trouvé comme élément de \(X\) mais comme stabilisateur d’un tel élément.
On procède par double décompte de l’ensemble \(A = \{ (g, x) ∈ G × X \; |\; gx = x\} \). En comptant par « tranches verticales », c’est à dire à \(g\) fixé, on obtient
Pour le décompte par tranches horizontales, on va en plus regrouper les tranches par orbites sous l’action de \(G\). On calcule en utilisant le théorème 3.2.19 :
\begin{align*} ♯A & = ∑_{x ∈ X} ♯\{ g \; |\; gx = x\} \\ & = ∑_{x ∈ X} ♯Gₓ \\ & = ∑_{y ∈ G \backslash X} ∑_{x ∈ π⁻¹(y)} ♯Gₓ\\ & = ∑_{y ∈ G \backslash X} ∑_{x ∈ π⁻¹(y)} \frac{♯G}{♯π⁻¹(y)} \qquad \text{ par le théorème~ \ref{thm:stab_orbite}}\\ & = ∑_{y ∈ G \backslash X} ♯π⁻¹(y)\frac{♯G}{♯π⁻¹(y)} \\ & = ♯(G \backslash X)♯G \end{align*}et on conclut en comparant les deux décomptes.
La formule de Burnside a de nombreuses applications amusantes en combinatoire, il y aura des exemples en TD.
3.3 Quotients de groupes et groupes quotients
Le groupe \(𝕌\) des nombres complexes de module \(1\) est un quotient du groupe des nombres réels, via \(t ↦ \exp {it}\).
Soit \(π \! :G → G'\) un quotient de groupe. Soit \(p \! :G → G/\ker π\) le quotient associé à l’action par translation à droite du sous-groupe \(\ker π\) sur \(G\). Il existe une unique bijection \(φ \! :G/\ker π → G'\) telle que \(π = φ ∘ p\).
D’après le corollaire 1.0.8, il suffit de montrer que \(p\) et \(π\) induisent la même relation d’équivalence sur \(G\). Comme \(π\) est un morphisme, la relation induite par \(π\) peut se réécrire en \(x ∼ x'\) si \(x⁻¹x' ∈ \ker π\) (c’est le même calcul que dans la démonstration du critère d’injectivité du lemme 3.1.3). On peut encore récrire cela comme \(∃ g ∈ \ker π, x' = xg\), ce qui est bien la relation associée à l’action par translation à droite par \(\ker π\), et donc à \(p\).
Dans le lemme précédent, il n’y a pas de structure de groupe sur \(G/\ker π\) mais on peut transporter la structure de \(G'\) via \(φ\), en définissant le produit comme \((x, y) ↦ φ⁻¹(φ(x)φ(y))\), le neutre comme \(φ⁻¹(1)\) et l’inversion comme \(x ↦ φ⁻¹(φ(x)⁻¹)\). On obtient ainsi une structure de groupe telle que \(p\) est un morphisme. Il est donc naturel de se demander si, pour tout sous-groupe \(H ≤ G\), il existe une structure de groupe sur \(G/H\) qui fasse de \(p \! :G → G/H\) un morphisme de groupe. Il s’agit d’une idée trop optimiste en général, il faut imposer une condition sur \(H\).
On dit qu’un sous-groupe \(H\) d’un groupe \(G\) est distingué s’il est stable sous l’action par conjugaison de tous les éléments de \(G\) : \(∀ g ∈ G, c_g(H) ⊂ H\). On note alors \(H ⊲ G\).
Vu le lemme 3.2.5, \(H ⊲ G\) si et seulement si il est invariant sous l’action par conjugaison de tous les éléments de \(G\) : \(∀ g ∈ G, c_g(H) = H\). Autrement dit, \(H ⊲ G\) si et seulement si \(∀ g ∈ G, gH = Hg\) (pour les actions par translation à gauche et à droite de \(G\) sur \(𝒫(G)\)).
Pour tout groupe \(G\), \(\{ 1\} ⊲ G\) et \(G ⊲ G\). Si \(G\) est abélien alors, pour tout sous-groupe \(H ≤ G\), \(H ⊲ G\).
Soit \(G\) un groupe et \(H\) un sous-groupe de \(G\). Il existe une structure de groupe sur \(G/H\) qui fasse de la projection un morphisme de groupes si et seulement si \(H ⊲ G\). Cette structure est alors unique et \(H\) est le noyau de la projection.
Le lemme 2.0.9 assure que \(G/H\) possède une structure de monoïde qui fasse de \(π \! :G → G/H\) un morphisme de monoïdes si et seulement si la loi de composition interne sur \(G\) est compatible avec la relation d’équivalence produit sur \(G\), et que cette structure de monoïde est alors unique. On obtient donc le critère :
Supposons la condition ??. Soit \(g\) dans \(G\) et \(h\) dans \(H\). On spécialise \(\eqref{eq:descente_loi}\) à \(x₁ = 1\), \(x₂ = h\), \(y₁ = y₂ = g⁻¹\) et on obtient \(1⁻¹h ∈ H \text{ et } gg⁻¹ ∈ H ⇒ (1g⁻¹)⁻¹(hg⁻¹) ∈ H\). Or on a supposé \(h ∈ H\) et \(H\) est un sous-groupe donc contient \(1\). On obtient donc \(ghg⁻¹ ∈ H\). Ainsi \(H\) est distingué.
Réciproquement supposons \(H ⊲ G\) et montrons la condition ??. Soit \(x₁\), \(x₂\), \(y₁\) et \(y₂\) tels que \(x₁⁻¹x₂ ∈ H\) et \(y₁⁻¹y₂ ∈ H\). On a :
Donc la loi de composition descend au quotient.
Il reste à voir qu’on obtient une structure de groupe et pas seulement une structure de monoïde. Comme \(π\) est un morphisme de monoïde, elle envoie les inversibles de \(G\) sur des inversibles de \(G/H\) d’après le lemme 2.0.7. Or tous les éléments de \(G\) sont inversibles et \(π\) est surjective donc tous les éléments de \(G/H\) sont inversibles. Remarquons qu’il est instructif de vérifier directement que la fonction d’inversion sur \(G\) descend au quotient.
Soit \(G\) et \(G'\) deux groupes, et \(φ \! :G → G'\) un morphisme.
Pour tout \(H' ⊲ G'\), \(φ⁻¹(H') ⊲ G\). En particulier \(\ker φ ⊲ G\).
Si \(φ\) est surjectif et \(H ⊲ G\) alors \(φ(H) ⊲ G'\).
La clef est que, pour tout \(g ∈ G\), \(φ ∘ c_g = c_{φ(g)} ∘ φ\). Soit \(H' ⊲ G'\). Le lemme 3.1.8 assure que \(φ⁻¹(H')\) est un sous-groupe de \(G\). Soit \(g ∈ G\). On a
\begin{align*} φ(c_g(φ⁻¹(H’))) & = c_{φ(g)}(φ(φ⁻¹(H’))) & \text{par la formule clef}\\ & ⊂ c_{φ(g)}(H’) & \\ & ⊂ H’ & \text{car $H' ⊲ G'$} \end{align*}donc \(c_g(φ⁻¹(H')) ⊂ φ⁻¹(H')\).
Supposons maintenant que \(φ\) est surjective et \(H ⊲ G\). Le lemme 3.1.8 assure que \(φ(H)\) est un sous-groupe de \(G'\). Soit \(g'\) dans \(G'\). Par surjectivité de \(φ\), on obtient \(g ∈ G\) tel que \(φ(g) = g'\). On calcule
en utilisant la formule clef et l’hypothèse \(H ⊲ G\).
Une partie \(H\) d’un groupe \(G\) est un sous-groupe distingué si et seulement si il existe un groupe \(G'\) et un morphisme \(φ \! :G → G'\) tel que \(H = \ker φ\).
groupe quotient Soit \(H\) un sous-groupe distingué d’un groupe \(G\). Pour tout morphisme \(φ \! :G → G'\) tel que \(H ⊂ \ker φ\), il existe un unique morphisme \(\barφ \! :G/H → G'\) tel que \(φ = \barφ ∘ π\).
On a alors
\(\ker \barφ = π(\ker φ)\),
\(\barφ \text{ injectif }⇔ H = \ker φ\)
\(\barφ \text{ surjectif }⇔ φ\text{ surjectif }\).
Réciproquement, si \(\barφ\) existe alors \(H ⊂ \ker φ\).
Soit \(φ \! :G → G'\) tel que \(H ⊂ \ker φ\). D’après la propriété universelle des quotients d’ensembles (théorème 1.0.5), l’unicité est acquise et pour l’existence il suffit de vérifier que, pour tout \(x\) et \(y\) dans \(G\), \(x ∼ y ⇒ φ(x) = φ(y)\). Soit \(x\) et \(y\) tels que \(x ∼ y\). On a \(x⁻¹y ∈ H\) et \(H ⊂ \ker φ\) on a \(x⁻¹y ∈ \ker φ\) donc \(φ(x) = φ(y)\). On obtient ainsi l’existence de \(\barφ\). Le lemme 2.0.9 assure qu’il s’agit d’un morphisme. On étudie maintenant le noyau de \(\barφ\). On calcule :
\begin{align*} π⁻¹\ker \barφ& = π⁻¹\barφ⁻¹(\{ 1\} ) \\ & = (\barφ ∘ π)⁻¹(\{ 1\} ) \\ & = φ⁻¹(\{ 1\} ) \\ & = \ker φ, \end{align*}et on obtient la conclusion annoncée en appliquant \(π\) et le lemme 1.0.18 qui assure que \(π ∘ π⁻¹ = \operatorname{Id}_{𝒫(G/H)}\).
En particulier \(\barφ\) est injectif si et seulement si \(π(\ker φ) = \{ 1\} \). Or on sait déjà que \(π⁻¹(\{ 1\} ) = H ⊂ \ker φ\) donc \(\{ 1\} ⊂ π(\ker φ)\) (en utilisant encore le lemme 1.0.18). Ainsi
\begin{align*} \barφ\text{ injective} & ⇔ π(\ker φ) ⊂ \{ 1\} \\ & ⇔ \ker φ ⊂ π⁻¹(\{ 1\} ) \\ & ⇔ \ker φ ⊂ H \\ & ⇔ \ker φ = H \end{align*}où la dernière équivalence provient encore de l’hypothèse \(H ⊂ \ker φ\).
La condition de surjectivité provient directement du théorème 1.0.5, il n’y a rien de spécifique à la théorie des groupes ici.
Le fait que la condition annoncée est nécessaire à l’existence de \(\barφ\) provient aussi de ce théorème et du premier paragraphe de cette démonstration.
La propriété universelle de \(G/H\) caractérise \(G/H\) à unique isomorphisme près, au sens suivant. Supposons que \(K\) soit un groupe muni d’un morphisme \(p \! :G → K\) tel que \(H ⊂ \ker p\) et, pour tout morphisme \(φ \! :G → G'\) tel que \(H ⊂ \ker φ\), il existe un unique \(\barφ\) tel que \(φ = \barφ ∘ p\). Alors il existe un unique isomorphisme \(ψ \! :G/H → K\) tel que \(ψ ∘ π = p\). En effet, la propriété universelle de \(G/H\) appliquée au morphisme \(p\) fournit un morphisme \(ψ \! :G/H → K\) tel que \(ψ ∘ π = p\). Ensuite la propriété universelle de \(K\) appliquée au morphisme \(π\) fournit \(θ \! :K → G/H\) tel que \(θ ∘ p = π\). On a donc le diagramme :
où les deux petits triangles commutent donc le grand aussi. L’unicité dans la propriété universelle de \(G/H\) appliquée au morphisme \(π\) assure que \(θ ∘ ψ = \operatorname{Id}\). On montre de même que \(ψ ∘ θ = \operatorname{Id}\) et donc \(ψ\) est bien un isomorphisme. Cette remarque explique en quel sens les détails de la construction de \(G/H\) ne sont pas très important, la propriété universelle contient l’essentiel. On note que cette démonstration est exactement calquée sur celle du corollaire 1.0.8.
Le corollaire suivant est immédiat et extrêmement utile. On l’appelle souvent le premier théorème d’isomorphisme quand il est associé à deux autres énoncés moins cruciaux qui seront vus en TD.
Tout morphisme de groupe \(φ : G → G'\) induit un unique isomorphisme \(\barφ : G/\ker φ → \operatorname{im}φ\).
□
Soit \(H\) et \(H'\) des sous-groupes distingués dans des groupes \(G\) et \(G'\). Soit \(φ\! :G → G'\) un morphisme. Si \(φ(H) ⊂ H'\) alors \(φ\) descend en un unique morphisme de \(G/H\) dans \(G'/H'\).
On a alors
\(\ker \barφ = π(φ⁻¹(H'))\),
\(\barφ \text{ injectif }⇔ φ⁻¹(H') ⊂ H ⇔ φ⁻¹(H') = H\)
\(\barφ \text{ surjectif } ⇔ ∀ x' ∈ G', ∃ x ∈ G, ∃ h' ∈ H', x' = φ(x)h'\).
En particulier \(φ\text{ surjectif } ⇒ \barφ \text{ surjectif}\).
On applique le théorème 3.3.9 à \(π' ∘ φ\), en notant que \(\ker (π' ∘ φ) = φ⁻¹(\ker π') = φ⁻¹(H')\) donc la condition à vérifier est \(H ⊂ φ⁻¹(H')\), ce qui équivaut à \(φ(H) ⊂ H'\).
Supposons cette condition vérifiée, de sorte qu’on obtient un unique \(\barφ\). Le théorème assure que \(\ker \barφ = π(\ker (π' ∘ φ))\), c’est à dire \(π(φ⁻¹(H'))\) par le calcul ci-dessus, et il assure que \(\barφ\) est injectif si et seulement si \(φ⁻¹(H') = H\). Puisqu’on a déjà supposé \(H ⊂ φ⁻¹(H')\), cette dernière condition est équivalente à \(φ⁻¹(H') ⊂ H\).
Le théorème assure aussi la première équivalence ci-dessous :
\begin{align*} \barφ \text{ surjective} & ⇔ π’ ∘ φ \text{ surjective} \\ & ⇔ ∀ z ∈ G’/H’, ∃ g ∈ G, π’(φ(g)) = z \\ & ⇔ ∀ g’ ∈ G’, ∃ g ∈ G, π’(φ(g)) = π’(g’) \\ & ⇔ ∀ g’ ∈ G’, ∃ g ∈ G, φ(g) ∼ g’ \\ & ⇔ ∀ g’ ∈ G’, ∃ g ∈ G, ∃ h’ ∈ H’, g’ = φ(g)h \qedhere \end{align*}Soit \(G\) un groupe et \(N ⊲ G\). On note \(π\) la projection de \(G\) sur \(G/N\). L’ensemble des sous-groupes de \(G\) qui contiennent \(N\) est en bijection croissante avec l’ensemble des sous-groupes de \(G/N\) par l’application \(U ↦ π(U)\), de réciproque \(H ↦ π⁻¹(H)\). De plus \(U ⊲ G ⇔ π(U) ⊲ G/N\).
Dans le contexte du théorème précédent, soit \(U\) un sous-groupe de \(G\). Si \(U\) contient \(N\) alors \(N\) peut aussi être vu comme sous-groupe de \(U\), et il est clair que \(N\) est aussi distingué dans \(U\). Ainsi on peut former le groupe quotient \(U/N\) et \(π|_{U}\) induit un isomorphisme de \(U/N\) sur \(π(U)\) d’après le corollaire 3.3.11. En fait la construction des quotients comme ensembles de classes d’équivalence assure une égalité d’ensembles \(π(U) = U/N\). Bien que cela brise la barrière d’abstraction des groupes quotients, il est donc souvent commode d’écrire la correspondance du théorème précédent sous la forme \(U ↦ U/N\).
Le lemme 3.1.8 assure que, pour tout \(U ≤ G\), \(π(U) ≤ G/N\) donc l’application est bien définie dans le sens direct. Soit \(H ≤ G/N\). La préimage \(π⁻¹(H)\) est une sous-groupe de \(G\) d’après le lemme 3.1.8. De plus \(\{ 1\} ⊂ H\) donc \(π⁻¹(\{ 1\} ) ⊂ π⁻¹(H)\), c’est à dire \(N ⊂ π⁻¹(H)\) et l’application réciproque est bien définie aussi.
Il reste à calculer leurs composées. Pour tout \(H ≤ G/N\), on a \(π(π⁻¹(H)) = H\) d’après le lemme 1.0.18.
Soit \(U ≤ G\) tel que \(N ⊂ U\). On calcule
\begin{align*} π⁻¹(π(U)) & = ⋃_{n ∈ N} Un \text{ d'après le lemme~ \ref{lem:sature_action}} \\ & = U \text{ car $N ⊂ U$ donc $∀ n, Un = U$}. \end{align*}Montrons que \(U\) est distingué si et seulement si \(π(U)\) l’est. Si \(U\) est distingué, le lemme 3.3.7 montre que \(π(U)\) est distingué car \(π\) est surjective.
Réciproquement supposons que \(π(U)\) est distingué. En plus du résultat \(∀ U ≤ G, N ⊂ U ⇒ π⁻¹(π(U)) = U\) établi ci-dessus, le premier point clef est que, pour tout \(g\) dans \(G\), \(c_{π(g)} ∘ π = π ∘ c_g\). Le second est que, comme \(N\) est distingué, pour tout \(g\) dans \(G\), \(c_g(U)\) contient \(N\). Soit \(g\) dans \(G\). On calcule :
\begin{align*} c_g(U) & = π⁻¹(π(c_g(U))) \\ & = π⁻¹(c_{π(g)}(π(U))) \\ & = π⁻¹(π(U)) \\ & = U \qedhere \end{align*}Une intersection de sous-groupes distingués d’un groupe \(G\) est un sous-groupe distingué.
Le lemme 3.1.8 assure déjà qu’une telle intersection est un sous-groupe. La stabilité par conjugaison est claire car l’image directe d’une intersection par une bijection est l’intersection des images directes.
Le sous-groupe distingué engendré par une partie \(S\) d’un groupe \(G\) est l’intersection de tous les sous-groupes distingués contenant \(S\). C’est un sous-groupe distingué d’après le lemme précédent, on le note \(⟪S⟫\).
sous-groupe distingué engendré Soit \(S\) une partie d’une groupe \(G\).
\(⟪S⟫\) est un sous-groupe distingué de \(G\) qui contient \(S\).
\(⟨S⟩ ⊂ ⟪S⟫\).
Pour tout \(H ⊲ G\), \(⟪S⟫ ≤ H ⇔ S ⊂ H\) (ainsi \(⟪S⟫\) est le plus petit sous-groupe distingué de \(G\) qui contient \(S\)). Cette propriété universelle caractérise \(⟪S⟫\).
L’application \(⟪\cdot ⟫\) est croissante : \(∀ S\; S', S ⊂ S' ⇒ ⟪S⟫ ⊂ ⟪S'⟫\).
Pour tout morphisme \(f \! :G → G'\), \(⟪f(S)⟫ = f(⟪S⟫)\).
\(⟪S⟫\) est l’ensemble des produits (finis) de conjugués des éléments de \(S\) et de leurs inverses.
3.4 Abélianisation
La terminologie « commutateur » provient du fait que \(x\) et \(y\) commutent si et seulement si \([x, y] = 1\).
Soit \(G\) un groupe et \(f \! :G → G'\) un morphisme de groupes.
pour tous \(x\) et \(y\) dans \(G\), \(f([x, y]) = [f(x), f(y)]\).
\(f(D(G)) ⊂ D(G')\).
\(D(G) ⊲ G\)
Le premier point est un calcul direct. Soit \(S\) l’ensemble des commutateurs d’éléments de \(G\) et \(S'\) celui de \(G'\). Par définition, \(D(G) = ⟨S⟩\) et \(D(G') = ⟨S'⟩\). On a donc \(f(D(G)) = f(⟨S⟩) = ⟨f(S)⟩\) par le lemme 3.1.12. Or \(f(S) ⊂ S'\) d’après le premier point donc \(⟨f(S)⟩ ⊂ D(G')\), par un autre point du lemme 3.1.12.
Montrons maintenant le troisième point. Soit \(g\) dans \(G\). Le premier point appliqué à la conjugaison \(c_g\) montre que \(c_g(S) ⊂ S\) et le même résultat pour \(g⁻¹\) montre l’inclusion réciproque donc \(c_g(S) = S\). On a donc \(c_g(D(G)) = c_g(⟨S⟩) = ⟨c_g(S)⟩ = ⟨S⟩ = D(G)\).
L’abélianisé d’un groupe \(G\) est le groupe quotient \({G}_{\mathrm{ab}} := G/D(G)\).
Pour montrer que \({G}_{\mathrm{ab}}\) est abélien, il suffit de montrer que, pour tous \(x\) et \(y\) dans \(G\), \(π(x)\) et \(π(y)\) commutent. Or \([π(x), π(y)] = π([x, y]) = 1\) d’après le lemme 3.4.2.
Soit \(φ \! :G → G'\) un morphisme à valeurs dans un groupe abéliens. On veut descendre \(φ\) au quotient \({G}_{\mathrm{ab}}\). D’après la propriété universelle des groupes quotients (théorème 3.3.9), il suffit de vérifier que \(D(G) ⊂ \ker φ\). Comme \(\ker φ\) est un sous-groupe, il suffit de vérifier que les commutateurs sont dans \(\ker φ\). Soit \(x\) et \(y\) dans \(G\). On a \(φ([x, y]) = [φ(x), φ(y)] = 1\) où la première égalité provient encore du lemme 3.4.2 et la deuxième utilise l’hypothèse que \(G'\) est abélien.
Cette proposition explique en quel sens \({G}_{\mathrm{ab}}\) est le plus grand quotient abélien de \(G\). Comme d’habitude, cette propriété caractérise \({G}_{\mathrm{ab}}\) à unique isomorphisme près (comparer avec le corollaire 1.0.8 et la remarque 3.3.10). Ce qui est nouveau ici est que la construction de \({G}_{\mathrm{ab}}\) ne dépend d’aucune donnée auxiliaire (par exemple relation d’équivalence ou un sous-groupe distingué qui ne serait pas livré de série avec le groupe de départ). Le corollaire suivant montre que cette construction est fonctorielle, on peut aussi l’appliquer aux morphismes, de façons compatible avec la construction sur les groupes et la composition des morphismes.
Pour tout morphisme de groupes \(f \! :G → G'\), il existe un unique morphisme \({f}_{\mathrm{ab}} \! :{G}_{\mathrm{ab}} → {G’}_{\mathrm{ab}}\) qui fait commuter le diagramme suivant :
De plus \({(\operatorname{Id}_G)}_{\mathrm{ab}} = \operatorname{Id}_{{G}_{\mathrm{ab}}}\) et, pour tout morphisme \(g \! :G' → G''\), on a \({(g ∘ f)}_{\mathrm{ab}} = {g}_{\mathrm{ab}} ∘ {f}_{\mathrm{ab}}\).
Pour obtenir \({f}_{\mathrm{ab}}\), on applique la propriété universelle de \({G}_{\mathrm{ab}}\) au morphisme \(π ∘ f \! :G → {G’}_{\mathrm{ab}}\) (en utilisant que \({G’}_{\mathrm{ab}}\) est abélien).
Comme \(\operatorname{Id}_{{G}_{\mathrm{ab}}} ∘ π = π ∘ \operatorname{Id}_G\), l’unicité dans la propriété universelle assure que \({(\operatorname{Id}_G)}_{\mathrm{ab}} = \operatorname{Id}_{{G}_{\mathrm{ab}}}\). Pour la formule de composition, on contemple le diagramme suivant
Comme les deux carrés commutent, le grand rectangle commute. L’unicité dans la propriété universelle appliquée à \(g ∘ f\) assure alors que \({(g ∘ f)}_{\mathrm{ab}} = {g}_{\mathrm{ab}} ∘ {f}_{\mathrm{ab}}\).
Il existe un autre aspect de la compatibilité entre l’abélianisé et les morphismes. Pour tout groupe \(G\) et tout groupe abélien \(G'\), la proposition 3.4.4 fournit une bijection entre les ensembles de morphismes \(\operatorname{Hom}(G, G')\) et \(\operatorname{Hom}({G}_{\mathrm{ab}}, G')\), qui envoie \(φ\) sur \(\barφ\) dans un sens et précompose par la projection dans l’autre. Cette famille de bijections paramétrée par \(G\) et \(G'\) se comporte bien vis à vis de la composition au départ ou à l’arrivée, au sens du lemme suivant.
Soit \(φ \! :H → G\) un morphisme de groupes et soit \(ψ \! :G' → H'\) un morphismes de groupes abéliens. Pour tout \(f \! :G → G'\),
Par unicité dans la propriété universelle de \({H}_{\mathrm{ab}}\) appliquée à \(ψ ∘ f ∘ φ\), il suffit de montrer la commutativité du diagramme de l’énoncé, c’est à dire de calculer, en regardant le diagramme, \((ψ ∘ \bar f ∘ {φ}_{\mathrm{ab}}) ∘ π_H = ψ ∘ \bar f ∘ π_G ∘ φ = ψ ∘ f ∘ φ\).
3.5 Monoïdes libres
Cette section présente notre premier exemple de construction d’objet libre. Cet exemple est de loin le plus simple, il sert d’échauffement mais aussi de construction intermédiaire en vue de la section suivante.
monoïde libre Soit \(S\) un ensemble. Un monoïde libre sur \(S\) est un monoïde \(M\) muni d’une fonction \(ι \! :S → M\) qui vérifie la propriété universelle suivante : pour tout monoïde \(N\) et toute fonction \(f\) de \(S\) dans \(N\), il existe un unique morphisme \(\bar f \! :M → N\) tel que \(f = \bar f ∘ ι\).
Soit \(S\) un ensemble à un élément, noté \(a\). Le monoïde \((ℕ, +, 0)\) muni de \(a ↦ 1\) est un monoïde libre sur \(S\). Pour tout \(f \! :S → M\) et \(n ∈ ℕ\), on a \(\bar f(n) = f(a)^n\).
Étant donné un ensemble \(S\), un mot sur \(S\) est une suite finie \(m = (s₁, \dots , sₙ)\) d’éléments de \(S\). On autorise le cas \(n = 0\) correspondant à une suite vide notée \(1\). La longueur \(|m|\) d’un tel mot est l’entier naturel \(n\). L’ensemble des mots sur \(S\) est noté \(M(S)\). On le munit de l’opération de concaténation qui envoie \(((s₁, \dots , sₙ), (t₁, \dots , tₘ))\) sur \((s₁, \dots , sₙ, t₁, \dots , tₘ)\) de longueur \(n+m\). On note \(i_S\) l’application de \(S\) dans \(M(S)\) qui envoie \(s\) sur \((s)\).
En pratique l’application \(ι_S\) est le plus souvent implicite et on note donc \(s₁ \cdots sₙ\) le mot \((s₁, \dots , sₙ)\).
Pour tout ensemble \(S\), l’ensemble des mots \(M(S)\) muni de la concaténation et du mot vide est un monoïde. Muni de \(ι_S \! :S ↪ M(S)\), il s’agit d’un monoïde libre sur \(S\).
Comme d’habitude, la propriété universelle des monoïdes libres assure que \(M(S)\) est l’unique monoïde libre sur \(S\) modulo unique isomorphisme, on l’appelle souvent le monoïde libre sur \(S\).
La vérification des axiomes de monoïdes est immédiate, il s’agit donc de démontrer la propriété universelle qui définit les monoïdes libres. Soit \(N\) un monoïde et \(f\! :S → N\) une application. L’unicité de \(\bar f\) est claire car, pour tout mot \(s₁ \cdots sₙ\),
Il s’agit donc de montrer que l’application \(\bar f\) définie par la formule ci-dessus est bien un morphisme de monoïde. Les deux vérifications sont immédiates.
3.6 Groupes libres
groupe libre Soit \(S\) un ensemble. Un groupe libre sur \(S\) est un groupe \(F\) muni d’une application \(ι \! :S → F\) qui vérifie la propriété universelle suivante : pour tout groupe \(G\) et toute fonction \(f\) de \(S\) dans \(G\), il existe un unique morphisme de groupes \(\bar f \! :F → G\) tel que \(f = \bar f ∘ ι\).
Modulo les notations, il s’agit exactement de la même définition que la définition 3.5.1 dans laquelle on a remplacé le mot monoïde par le mot groupe.
Le groupe trivial est libre sur l’ensemble vide. Le groupe \(ℤ\) est libre sur tout ensemble à un élément, l’unique élément \(a\) étant envoyé sur \(1\). Pour tout \(f \! :S → G\) et \(n ∈ ℤ\), on a \(\bar f(n) = f(a)^n\).
L’existence d’un groupe libre sur n’importe quel ensemble est nettement moins évident que dans le cas des monoïdes. La construction a une saveur très informatique, avec l’apparition de notions de mots comme dans la section précédente mais aussi celle de réécriture. On verra dans la section suivante que cette construction débouche rapidement sur des problèmes algorithmiques difficiles.
Pour tout ensemble \(S\) on note \(S^{±1}\) l’ensemble \(S × \{ -1, 1\} \), on identifie chaque \(s ∈ S\) avec \((s, 1) ∈ S^{±1}\) et on définit une fonction inversion de \(S^{±1}\) dans lui-même par \((s, ε) ↦ (s, -ε)\). On étend l’opérateur d’inversion à l’ensemble des mots sur \(S^{±1}\) en envoyant le mot vide sur lui-même et tout \(m₁ \cdots mₙ\) sur \(mₙ⁻¹ \cdots m₁⁻¹\). On dit qu’un mot \(m\) admet une réduction en position \(i\) si \(i {\lt} |m|\) et \(mᵢ₊₁ = mᵢ⁻¹\). L’opération de réduction élémentaire associée envoie \(m\) sur le mot de longueur \(|m| - 2\) obtenu en retirant \(mᵢ\) et \(mᵢ₊₁\) de \(m\). Un mot \(m'\) est une réduction d’un mot \(m\) s’il existe une suite, nécessairement finie, de réductions élémentaire menant de \(m\) à \(m'\). Un mot est réduit s’il n’admet aucune réduction. Par exemple le mot vide est réduit et, pour \(S = \{ a, b\} \), le mot \(aaba⁻¹\) est réduit tandis que \(ab⁻¹b\) ne l’est pas. On note \(F(S) ⊂ M(S^{±1})\) l’ensemble des mots réduits sur \(S^{±1}\).
Soit \(G\) un groupe \(G\) et \(ι \! :S → G\) une fonction. On « étend » \(ι\) à \(S^{±1}\) en envoyant \((s, ε)\) sur \(ι(s)^ε\). La propriété universelle de \(M(S^{±1})\) étend cette fonction en morphisme de monoïdes \(\barι \! :M(S^{±1}) → G\). Les éléments de l’image de \(\barι\) sont appelés mots en les éléments de \(ι(S)^{± 1}\) dans \(G\).
Soit \(S\) un ensemble, \(F\) un groupe et \(ι \! :S → F\) une fonction. La paire \((F, ι)\) est un groupe libre sur \(S\) si et seulement si \(\barι\) restreinte à \(F(S)\) est une bijection. Autrement dit, tout élément de \(F\) s’écrit de façon unique comme mot réduit en les éléments de \(ι(S)^{±1}\).
Supposons que \((F, ι)\) est un groupe libre sur \(S\). On commence par démontrer que \(ι(S)\) engendre \(F\). On pose \(F' = ⟨ι(S)⟩\). On note que \((F', ι)\) vérifie aussi la propriété universelle des groupes libres sur \(S\). En effet, pour tout groupe \(G\) et toute fonction \(f \! :S → G\), la propriété universelle pour \((F, ι)\) fournit un morphisme \(\bar f\) qu’on peut restreindre à \(F'\). L’unicité fonctionne aussi car la contrainte sur \(\bar f ∘ ι\) et le fait que \(\bar f\) est un morphisme impose les valeurs sur \(⟨ι(S)⟩\).
Ainsi \(F = ⟨ι(S)⟩\) et le lemme 3.1.13 assure que tout élément de \(F\) est dans l’image \(\barι(M(S^{±1}))\). Après simplifications, on obtient une écriture comme mot réduit. Il reste à montrer l’unicité de cette écriture. On considère la fonction \(f\) de \(S\) dans \(𝔖(F(S))\) qui envoie \(s\) sur
il s’agit bien d’une bijection de \(F(S)\) car elle admet pour inverse
La propriété universelle de \((F, ι)\) étend \(f\) en morphisme \(\bar f \! :F → 𝔖(F(S))\). Pour tout mot réduit \(x = ι(s₁)^{ε₁}\cdots ι(sₙ)^{εₙ}\), \(f(x)\) envoie le mot vide sur \(s₁^{ε₁}\cdots sₙ^{εₙ}\), en effet \(f\) est un morphisme et \(\bar f ∘ ι = f\). Ainsi on retrouve l’écriture en mot réduit de \(x\) qui est donc unique.
Réciproquement supposons que la restriction \(j\) de \(\barι\) à \(F(S)\) est une bijection. Soit \(G\) un groupe et \(f\) une fonction de \(S\) dans \(G\). On étend \(f\) en \(f' \! :S^{±1}\) en envoyant \(s⁻¹\) sur \(f(s)⁻¹\). On pose \(\bar f = \bar{f'} ∘ j⁻¹\), où \(\bar{f'} \! :M(S^{± 1}) → G\) provient de la propriété universelle de \(M(S^{±1})\). Cette fonction de \(F\) dans \(G\) vérifie \(\bar f ∘ ι = f\) par construction. Il reste à montrer qu’il s’agit d’un morphisme. Ce n’est pas évident car \(F(S)\) n’est pas un sous-monoïde de \(M(S^{± 1})\) : la concaténation de deux mots réduits n’est pas forcément réduite. Soit \(x\) et \(y\) dans \(F\). Soient \(m = j⁻¹(x)\) et \(p = j⁻¹(y)\) les mots en \(S^{±1}\) qui représentent \(x\) et \(y\) respectivement.
Montrons que \(\bar f(xy) = \bar f(x)\bar f(y)\) par récurrence sur \(|m|\). Si \(|m| = 0\) alors \(x = 1\) et l’égalité est claire. Supposons le résultat connu pour les mots de longueur \(n\) et supposons \(|m| = n+1\). On écrit \(m = m's\) pour \(s ∈ S^{±1}\) et \(|m'| = n\). On pose \(x' = ι(m')\). Si \(p = s⁻¹p'\) alors \(xy = x'y'\) où \(y' = ι(p')\) et on calcule
\begin{align*} \bar f(xy) & = \bar f(x’y’) \\ & = \bar f(x’)\bar f(y’) \text{ par hypothèse de récurrence}\\ & = \bar f(x’)f(s)f(s)⁻¹\bar f(y’) \\ & = \bar f(x)\bar f(y). \end{align*}Notons qu’on n’affirme pas que \(m'p'\) est réduit (c’est faux en général) et que la simplification de la première ligne a lieu dans \(F\) tandis que la complexification de la troisième ligne a lieu dans \(G\). Si au contraire la dernière lettre de \(m\) n’est pas l’inverse de la première lettre de \(m'\) alors \(mm'\) est réduit et l’égalité visée est évidente.
Le lemme fondamental qui fait fonctionner toute la construction des groupes libres est le résultat suivant.
Soit \(S\) un ensemble. Pour tout mot \(m ∈ M(S^{± 1})\), il existe un unique mot réduit obtenu par réduction de \(m\).
L’unicité n’est pas claire car \(m\) peut admettre plusieurs réductions et la provenance des lettres survivantes après réduction n’est pas unique Par exemple, si \(m = ss⁻¹s\), on peut réduire en éliminant les deux premières lettres, la troisième survivant ou bien on peut réduire en éliminant les deux dernières lettres, la première survivant. Dans les deux cas on trouve comme mot réduit \(s\).
L’existence est claire car chaque réduction diminue strictement la longueur de \(m\) et que le mot vide est réduit. Montrons l’unicité par récurrence forte sur \(|m|\). Si \(|m| = 0\) alors \(m = 1\) qui est réduit. Supposons le résultat connu pour tous les mots de longueur strictement plus petite que \(|m|\). Soit \(m, p¹, \dots , pⁿ\) et \(m, q¹, \dots , qᵏ\) deux suites de réductions élémentaires aboutissant à des mots \(pⁿ\) et \(qᵏ\) réduits (ici les exposant ne sont pas des puissances mais une simple numérotation mise en exposant pour éviter une confusion avec l’énumération des lettres de chaque mot). Il a deux cas à considérer. Si les réductions de \(m\) à \(p¹\) et \(q¹\) se recouvrent alors \(p¹ = q¹\) et on conclut directement par hypothèse de récurrence. En effet la situation est soit le cas trivial où c’est la même réduction soit \(m = m'xx⁻¹xm'\) pour un certain \(x ∈ S^{±1}\) où une des réduction élimine \(xx⁻¹\) et l’autre élimine \(x⁻¹x\). L’autre cas est celui de réductions disjointes. On a alors \(m = m¹xx⁻¹m²yy⁻¹m³\) pour des mots \(m¹\), \(m²\) et \(m³\) (éventuellement vides), et \(x\) et \(y\) dans \(S^{±1}\) et \(p¹\) et \(q¹\) dont obtenus en réduisant une des deux paires. Dans ce cas \(p¹\) et \(q¹\) admettent la réduction élémentaire commune \(r¹ = m¹m²m³\). On utilise ensuite l’existence pour réduire \(r¹\) en \(r^l\). Par hypothèse de récurrence appliquée à \(p¹\) et \(r¹\), \(pⁿ = r^l\). Par hypothèse de récurrence appliquée à \(q¹\) et \(r¹\), \(qᵏ = r^l\). Ainsi \(pⁿ = qᵏ\), ce qu’on voulait démontrer.
Le lemme ci-dessus permet de définir une loi de composition interne sur \(F(S)\) : la concaténation suivie de la réduction. Le mot vide est clairement neutre pour cette opération. Par ailleurs l’inversion des mots préserve \(F(S)\) et on a une application \(ι_S \! :S → F(S)\) qui envoie \(s\) sur le mot \(s\).
Pour tout ensemble \(S\), l’ensemble \(F(S)\) des mots réduits sur \(S^{±1}\) munis de la structure décrite ci-dessus forme un groupe libre sur \(S\).
Le seul axiome de groupe qui n’est pas évident est l’associativité, mais elle découle facilement du lemme 3.6.4. En effet pour tous mots réduits \(x\), \(y\) et \(z\), les produits \((xy)z\) et \(x(yz)\) sont tous deux des réductions de la concaténation de \(x\), \(y\) et \(z\). Le fait que \((F(S), ι_S)\) est libre sur \(S\) découle immédiatement de la proposition 3.6.3.
Tout groupe est quotient d’un groupe libre. Si une partie \(S\) engendre un groupe \(G\) alors \(G\) est un quotient de \(F(S)\).
La première partie découle de la seconde puisque tout groupe \(G\) est engendré par l’ensemble de tous ses éléments. Montrons la seconde partie. Soit \(G\) un groupe et \(S\) une partie génératrice de \(G\). La propriété universelle de \(F(S)\) appliquée à l’inclusion \(i \! :S ↪ G\) fournit un morphisme de groupe \(π \! :F(S) → G\). On a \(π(F) = π(⟨ι_S(S)⟩) = ⟨π(ι_S(S))⟩ = ⟨ι(S)⟩ = G\) donc \(π\) est bien surjective.
Comme dans le cas de l’abélianisation, la propriété universelle qui définit les groupes libres assure la fonctorialité de la construction ci-dessus, au sens de la proposition suivante :
Soit \(S\) et \(S'\) des ensembles. Pour toute fonction \(f \! :S → S'\), il existe une unique fonction \(F(f) \! :F(S) → F(S')\) telle que \(F(f) ∘ ι_S = ι_{S'} ∘ f\).
De plus \(F(\operatorname{Id}) = \operatorname{Id}\) et cette opération est compatible avec la composition : \(F(g ∘ f) = F(g) ∘ F(f)\).
Pour tout groupe \(G\), la bijection \(\operatorname{Hom}(S, G) ≃ \operatorname{Hom}(F(S), G)\) est naturelle : pour toute fonction \(φ \! :S₂ → S₁\) et tout morphisme \(ψ \! :G₁ → G₂\), on a pour tout fonction \(f \! :S₁ → G₁\), \(ψ ∘ \bar f ∘ F(φ) = \overline{ψ ∘ f ∘ φ}\).
C’est exactement la même démonstration que dans le cas de l’abélianisation. On définit \(F(f)\) comme \(\overline{ι_{S'} ∘ f}\). Comme \(\operatorname{Id}_{F(S)} ∘ ι_S = ι_S ∘ \operatorname{Id}_S\), l’unicité dans la propriété universelle assure \(F(\operatorname{Id}) = \operatorname{Id}\). La formule de composition découle de la commutativité de :
et de l’unicité dans la construction de \(F(g∘ f)\). Pour la naturalité on contemple le diagramme suivant :
et la formule découle de l’unicité dans la propriété universelle de \(F(S₂)\) appliquée à \(ψ ∘ f ∘ φ\).
La démonstration ci-dessus suit exactement celle des corollaires 3.4.5 et 3.4.6. Ce fait est étonnant car l’abélianisation d’un morphisme de groupes transforme un morphisme en morphisme entre des groupes plus petits tandis que la transformation d’une fonction \(f\) en morphismes de groupes libres est une extension à des objets bien plus gros (par exemple \(F(S)\) est infini dès que \(S\) n’est pas vide). Ces deux opérations peuvent se traiter exactement de la même façon car les propriétés universelles correspondantes ont exactement la même forme abstraite. Bien sûr on peut aussi expliciter \(F(f)\) et démontrer à la main la formule de composition, mais on perd alors le parallèle formel (et la possibilité de trouver l’énoncé abstrait qui englobe les deux cas).
Soit \(S\) et \(S'\) deux ensembles finis. Les groupes \(F(S)\) et \(F(S')\) sont isomorphes si et seulement si \(S\) et \(S'\) ont le même cardinal.
Supposons d’abord que \(S\) et \(S'\) ont même cardinal. On obtient alors une bijection \(f \! :S → S'\) puis, par la proposition précédente, des morphismes \(F(f) \! :F(S) → F(S')\) et \(F(f⁻¹) \! :F(S) → F(S')\) tels que \(F(f) ∘ F(f⁻¹) = F(f ∘ f⁻¹) = F(\operatorname{Id}) = \operatorname{Id}\) et de même \(F(f⁻¹) ∘ F(f)\) donc \(F(f)\) est un isomorphisme.
Réciproquement, supposons qu’il existe un isomorphisme \(φ \! :F(S) → F(S')\). La précomposition par \(φ\) fournit une bijection entre les ensembles de morphismes de groupes \(\operatorname{Hom}(F(S'), ℤ/2ℤ)\) et \(\operatorname{Hom}(F(S), ℤ/2ℤ)\). Or les propriétés universelles de \(F(S')\) et \(F(S)\) respectivement mettent en bijection ces ensembles avec les ensembles de fonctions de \(S'\) dans \(ℤ/2ℤ\) et de \(S\) dans \(ℤ/2ℤ\) qui sont de cardinaux \(2^{♯S'}\) et \(2^{♯S}\) respectivement. Ainsi \(2^{♯S'} = 2^{♯S}\) et, comme \(S\) et \(S'\) sont finis, on conclut que \(♯S' = ♯S\).
Le théorème précédent reste vrai si \(S\) et \(S'\) sont infinis mais la démonstration est plus compliquée. La démonstration précédente fonctionne jusqu’à l’égalité \(2^{♯S'} = 2^{♯S}\) mais le passage à \(♯S = ♯S'\) est indépendant des axiomes usuels de la théorie des ensembles (même en y ajoutant l’hypothèse du continu, il faut ajouter une hypothèse du continu généralisée). Pour contourner ce problème on peut se ramener au cas des groupes abéliens libres (discuté dans le chapitre 5) puis au théorème de la dimension (à condition de disposer de celui-ci en dimension infinie).
Au vu de ce théorème, on pourrait imaginer que si \(F(S)\) s’injecte comme sous-groupe de \(F(S')\) alors \(♯S ≤ ♯S'\) (la réciproque est claire). Mais ce n’est pas du tout ce qui se passe.
Soit \(S\) un ensemble à deux éléments. Il existe un morphisme injectif de \(F(ℕ)\) dans \(F(S)\). En particulier \(F(S)\) contient des sous-groupes isomorphes à \(F(\{ 1, \dots n\} )\) pour tout \(n\).
On note \(a\) et \(b\) les deux éléments de \(S\). On définit \(f \! :ℕ → F(S)\) par \(n → c_{bⁿ}(a) ∈ F(S)\). Montrons que le morphisme \(φ \! :F(ℕ) → F(S)\) correspondant à \(f\) est injectif. Soit \(x = n₁^{ε₁}\cdots n_N^{ε_N}\) un élément de \(F(ℕ)\) écrit comme mot réduit non vide, avec chaque \(n₁\) dans \(ℕ\). On veut montrer \(φ(x) ≠ 1\). Montrons par récurrence sur \(N\) qu’on peut écrire \(φ(x)\) sous la forme \(b^{m₁}a^{j₁} \cdots b^{m_M}a^{j_M}b^{-n_N}\) où \(M ≥ 1\), les \(mᵢ\) et les \(jᵢ\) sont dans \(ℤ\) et non nuls, et \(j_M\) est du signe de \(ε_N\). Ce résultat est plus fort que \(φ(x) ≠ 1\). Pour \(N = 1\) le résultat est clair. Supposons-le jusqu’à \(N\). On a alors par hypothèse de récurrence
avec \(j_M\) du signe de \(ε_N\). Le mot de départ était réduit donc il y a deux possibilités. Si \(n_{N+1} ≠ n_N\) on a :
qui est bien de la forme annoncée car \(n_{N+1} - n_N ≠ 0\). Sinon, \(n_{N+1} = n_N\) mais \(ε_{N+1} = ε_N\). Dans ce cas
et \(j_M\) est du même signe que \(ε_N\) donc du même signe que \(ε_{N+1}\). Ainsi \(j_M + ε_{N+1}\) n’est pas nul et est du même signe que \(ε_{N+1}\).
On peut montrer que tout sous-groupe d’un groupe libre est libre, c’est le théorème de Nielsen-Schreier. Toutes les démonstrations éclairantes de ce théorème font intervenir de la géométrie.
3.7 Présentations de groupes
Soit \(S\) un ensemble et \(R\) une partie de \(F(S)\). Le groupe défini par l’ensemble de générateurs \(S\) et l’ensemble de relation \(R\) est le quotient \(F(S)/⟪R⟫\). On le note \(⟨S\; |\; R⟩\).
Lorsque \(S\) et \(R\) sont finis et explicite on utilise cette notation en listant les éléments de \(S\) et de \(R\) sans les entourer d’accolades. Lorsqu’un groupe \(G\) est déjà connu par ailleurs et muni d’une famille génératrice \(S\), on dit aussi que \(⟨S\; |\; R⟩\) est une présentation de \(G\) si \(⟪R⟫\) est le noyau de l’application de \(F(S)\) dans \(G\) induite par l’inclusion de \(S\) dans \(G\) (comme dans la démonstration du corollaire 3.6.6). Par extension on appelle aussi présentation d’un groupe \(G\) toute paire \((S, R)\) telle que \(G\) est isomorphe à \(⟨S \; |\; R⟩\). On dit qu’un groupe \(G\) est de type fini s’il admet une famille génératrice finie et de présentation finie s’il admet une présentation \((S, R)\) où \(S\) et \(R\) sont tous deux finis.
On notera que \(S\) s’envoie dans \(⟨S \; |\; R⟩\) en composant \(ι_S\) et la projection de \(F(S)\) sur \(⟨S \; |\; R⟩\). En pratique la composée \(ι_{S, R}\) de ces deux applications est presque toujours implicite quand on l’applique à un élément : on utilise le même symbole pour un élément de \(S\) et son image.
Le groupe \(ℤ/nℤ\) admet pour présentation \(⟨x\; |\; xⁿ⟩\). En effet \(ℤ\) est isomorphe à \(F(\{ x\} )\) par \(m ↦ xᵐ\) et \(nℤ\) est envoyé sur le sous-groupe (distingué) engendré par \(xⁿ\).
présentation de groupe Soit \(S\) un ensemble et \(R\) une partie de \(F(S)\). L’application \(ι_{S, R} \! :S → ⟨S\; |\; R⟩\) vérifie que, pour tout \(r = ι_S(s₁)^{ε₁}\cdots ι_S(sₙ)^{εₙ}\) dans \(R\), \(ι_{S, R}(s₁)^{ε₁}\cdots ι_{S, R}(sₙ)^{εₙ} = 1\) (on dit que \(ι_{S, R}\) est compatible avec \(R\)). De plus l’image de \(ι_{S, R}\) engendre \(⟨S\; |\; R⟩\).
Soit \(G\) un groupe et \(f\) une application de \(S\) dans \(G\). Si \(f\) est compatible avec \(R\) alors il existe un unique morphisme \(\bar f \! :⟨S\; |\; R⟩ → G\) qui fait commuter
Le morphisme \(\bar f\) est surjectif si et seulement si \(f(S)\) engendre \(G\).
Soit\(r = s₁^{ε₁}\cdots sₙ^{εₙ}\) dans \(R\). On a
\begin{align*} ι_{S, R}(s₁)^{ε₁}\cdots ι_{S, R}(sₙ)^{εₙ} & = π(ι_S(s₁))^{ε₁}\cdots π(ι_S(sₙ)^{εₙ} \\ & = π(r) \\ & = 1. \end{align*}On sait déjà que \(ι_S(S)\) engendre \(F(S)\). Comme la projection de \(F(S)\) sur \(⟨S\; |\; R⟩\) est surjective, \(ι_{S, R}(S)\) engendre \(⟨S\; |\; R⟩\).
Soit \(G\) un groupe et \(f \! :S → G\) une application compatible avec \(R\). On a le diagramme suivant :
L’existence \(\tilde f\) faisant commuter le triangle du haut découle directement de la propriété universelle de \(F(S)\) appliquée à \(f\), il n’y a aucune condition à vérifier. L’existence de \(\bar f\) faisant commuter le triangle du bas provient de la propriété universelle des groupes quotients, il suffit de vérifier que \(R ⊂ \ker \tilde f\), ce qui est précisément la condition de compatibilité imposée.
Il reste à expliquer comment les unicités des deux propriétés universelles invoquées se composent pour donner l’unicité voulue ici. Supposons que \(\hat f : ⟨S\; |\; R⟩ → G\) convient aussi. On a alors \(\hat f ∘ (π ∘ ι_S) = f\) donc \((\hat f ∘ π) ∘ ι_S = f\) et l’unicité dans la propriété universelle de \(F(S)\) assure que \(\hat f ∘ π = \tilde f\). L’unicité dans la propriété universelle du quotient assure ensuite que \(\hat f = \bar f\).
Enfin on a \(\bar f(⟨S\; |\; R⟩) = \bar f(⟨ι_{S, R}(S)⟩) = ⟨\bar f(ι_{S, R}(S))⟩ = ⟨f(S)⟩\), ce qui démontre le critère de surjectivité.
Pour tout groupe \(G\), l’application de \(\operatorname{Hom}(ℤ/nℤ, G)\) dans \(\{ x ∈ G \; |\; xⁿ = 1\} \) qui envoie \(φ\) sur \(φ(1)\) est une bijection. Un morphisme \(φ\) est surjectif si et seulement si \(φ(1)\) engendre \(G\) et il est injectif si et seulement si \(φ(1)\) est d’ordre \(n\).
Montrons que \(G := ⟨a, b\; |\; a², b², (ab)³⟩\) est isomorphe à \(𝔖₃\). On considère l’application \(f \! :\{ a, b\} → 𝔖₃\) qui envoie \(a\) sur la transposition \((12)\) et \(b\) sur la transposition \((23)\). Cette application vérifie la condition de propriété universelle car \(f(a)²\), \(f(b)²\) et \((f(a)f(b))³\) valent tous \(1\). De plus \(\{ f(a), f(b)\} \) engendre \(𝔖₃\) donc \(\bar f\) est surjective. Il suffit maintenant de montrer que \(♯G ≤ ♯𝔖₃\). Puisque \(a\) et \(b\) engendrent \(G\), tout élément de \(G\) s’écrit comme \(\prod _{i=1}^n a^{kᵢ}b^{lᵢ}\) avec \(n\) un entier naturel, chaque \(kᵢ\) et \(lᵢ\) dans \(ℤ\) et non nul sauf éventuellement \(k₁\) ou \(lₙ\). En utilisant que \(a² = b² = 1\), on peut supposer que chaque \(kᵢ\) et \(lᵢ\) vaut un sauf éventuellement \(k₁\) ou \(lₙ\). Enfin la relation \((ab)³ = 1\) assure que \(bab = a⁻¹b⁻¹a⁻¹\), c’est à dire \(bab = aba\) en utilisant encore \(a² = b² = 1\). Donc on peut supposer qu’il n’y a qu’une seul \(b\) dans l’écriture des éléments de \(G\). Ainsi \(G ⊂ \{ 1, a, b, ab, ba, aba\} \) et \(♯G ≤ 6 = ♯𝔖₃\).
On a donc trouvé une présentation de \(𝔖₃\) par les générateurs \(τ₁ := (12)\) et \(τ₂ = (23)\) et les relations \(τ₁²\), \(τ₂²\) et \((τ₁τ₂)³\). Ainsi pour tout groupe \(H\), les images de \(τ₁\) et \(τ₂\) fournissent une bijection de \(\operatorname{Hom}(𝔖₃, H)\) vers \(\{ (x, y) ∈ H \; |\; x² = y² = (xy)³ = 1\} \).
Soit \(S\) et \(S'\) des ensembles, \(R\) une partie de \(F(S)\) et \(R'\) une partie de \(F(S')\). Pour tout fonction \(f \! :S → F(S')\), si \(\bar f(R) ⊂ ⟪R'⟫\) alors il existe un unique morphisme de groupe \(\bar f \! :⟨S\; |\; R⟩ → ⟨S'\; |\; R'⟩\) qui fait commuter le digramme
On applique la propriété universelle de \(⟨S\; |\; R⟩\) à \(π ∘ f\), en utilisant que \(π\) envoie \(⟪R'⟫\) sur \(\{ 1\} \).
groupe coproduit On peut utiliser les présentations de groupes pour construire le coproduit (ou « produit libre ») \(\ast _i G_i\) d’une famille de groupes \(G_i\). Il s’agit d’un groupe muni de morphismes (injectifs) \(φ_j \! :G_j → \ast _i G_i\) vérifiant la propriété universelle duale de celle du produit : pour tout groupe \(H\) et toute collection de morphismes de groupes \(ψ_i : G_i → H\), il existe un unique morphisme \(Ψ : \ast _i G_i → H\) tel que \(Ψ ∘ φ_j = ψ_j\) pour tout \(j\). On note \(πᵢ \! :F(Gᵢ) → Gᵢ\) le morphisme induit par l’identité et on pose
La démonstration de la propriété universelle est laissée en exercice.
La notion de présentation de groupe semble être un façon très concrète de manipuler les éléments d’un groupe, mais elle cache de un redoutable problème algorithmique, connus sous le nom de « problème du mot ». On peut donner des exemples explicites de présentations de groupes pour lesquelles on peut démontrer qu’il n’existe aucun algorithme permettant de décider si deux mots en les générateurs et leurs inverses représentent le même élément du groupe (ou, de façon équivalente, si un mot représente l’élément neutre).