1 Quotients et relations d’équivalences
Une des procédures les plus fondamentales des mathématiques consiste à créer de nouveaux ensembles en identifiant certains éléments d’un ensemble donné. On dit que le nouvel ensemble est un quotient de l’ensemble de départ. Par exemple l’ensemble des nombres rationnels est obtenu à partir de l’ensemble des fractions, c’est à dire les paires constituées d’un entier relatif et d’un entier strictement positif, en identifiant \((p, q)\) et \((p', q')\) dès que \(pq' = p'q\). Dans cette procédure, il y a des conditions à vérifier pour assurer que ces identifications se comportent bien puis des conditions à vérifier pour construire des fonctions entre ensembles construits par identification. Par exemple il n’est pas du tout évident que l’addition des fractions, qui envoie \(((p₁, q₁), (p₂, q₂))\) sur \((p₁q₂ + p₂q₁, q₁q₂)\) se comporte bien lorsque qu’on passe à l’ensemble des nombres rationnels. Ce chapitre est dédié à l’étude générale de cette procédure. Son impact va bien au-delà du cours d’algèbre. Par exemple on peut construire l’ensemble des nombres réels comme quotient d’un ensemble de suites de nombres rationnels, et les espaces \(L^p\) de Lebesgue sont construits comme quotients de certains espaces des fonctions.
La définition général de quotient \(Y\) d’un ensemble \(X\) est d’une simplicité presque suspecte, on demande simplement un moyen de transformer les éléments de \(X\) en éléments de \(Y\) et que tous les éléments de \(Y\) proviennent de \(X\). Le travail consiste ensuite à comprendre quelles sont les identifications autorisées, ce sera l’objet de la définition 1.0.2 et surtout du théorème 1.0.3.
La synecdoque remplaçant la paire \((Y, π)\) par \(Y\) ou par \(π\) est courante lorsque le contexte ne laisse pas de place à l’ambigüité. Lorsque \(Y\) et \(π\) sont clairs, l’image \(π(x)\) d’un élément \(x\) est souvent notée \(\bar x\) ou \([x]\) ou même… \(x\). Lorsque le contexte identifie clairement \(Y\) comme quotient de \(X\), on appelle souvent \(π\) la projection canonique de \(X\) sur \(Y\).
En pratique on note souvent \(∼\) les relations d’équivalence.
Soit \(X\) un ensemble.
Pour tout ensemble \(Y\) et toute fonction \(f \! :X → Y\), la relation sur \(X\) définie par \(xRx'\) si \(f(x) = f(x')\) est une relation d’équivalence, dite associée à \(f\).
Réciproquement, pour toute relation d’équivalence \(R\) sur \(X\), il existe un quotient \((Y, π)\) de \(X\) tel que, pour tous \(x\) et \(x'\), \(x R x'\) si et seulement si \(π(x) = π(x')\).
Les deux parties sont légèrement dissymétriques mais la symétrie est restaurée dès que l’on remarque que, dans le premier point, on ne change pas \(R\) en remplaçant \(Y\) par l’image de \(f\). On verra plus loin que le quotient \((Y, π)\) promis par la deuxième partie est essentiellement unique. Par ailleurs la démonstration construit un quotient particulier : l’ensemble des classes d’équivalences de \(R\), qu’on note souvent \(X/R\) et qu’on appelle souvent abusivement le quotient de \(X\) par \(R\).
Les vérifications du premier point sont très faciles et laissées en exercice.
Pour le deuxième point, on se donne une relation d’équivalence \(R\) sur \(X\). On note \(Y\) l’image dans l’ensemble \(𝒫(X)\) de l’application \(π \! :x ↦ \{ x' \; |\; x R x'\} \). L’application \(π\) est surjective de \(X\) dans \(Y\) par définition de \(Y\). Soit \(x\) et \(x'\) dans \(X\). Supposons \(π(x) = π(x')\). Par réflexivité de \(R\), \(x'Rx'\), donc \(x' ∈ π(x')\) par définition de \(π\) puis \(x' ∈ π(x)\) par notre hypothèse d’égalité. Par définition de \(π\) on obtient alors \(xRx'\). Réciproquement, supposons \(xRx'\). On veut montrer que \(π(x) = π(x')\). Comme \(R\) est symétrique, il suffit de montrer que, pour tout \(x₁\) et \(x₂\), \(x₁ R x₂ ⇒ π(x₂) ⊂ π(x₁)\). Soit \(x₁\) et \(x₂\) tels que \(x₁ R x₂\). Soit \(x₃ ∈ π(x₂)\). On a \(x₂ R x₃\) par définition de \(π\). La transitivité de \(R\) donne alors \(x₁ R x₃\), c’est à dire \(x₃ ∈ π(x₁)\).
Sur \(X = ℤ × ℕ^*\), on considère la relation \((p, q) ∼ (p', q')\) si \(pq' = p'q\). On vérifie sans peine qu’il s’agit d’une relation d’équivalence. Le quotient \(X/∼\) est appelé ensemble des nombres rationnels et noté \(ℚ\).
Pour tout ensemble \(X\) on peut considérer la relation triviale pour laquelle tout élément n’est équivalent qu’à lui-même. La construction de la démonstration précédente fournit comme quotient \(X/∼ = \{ \{ x\} \; ;\; x ∈ X\} \) muni de \(X → X/∼\) qui envoie \(x\) sur \(\{ x\} \). Mais bien sûr \(X\) lui-même, muni de l’application \(\operatorname{Id}_X\), est aussi un quotient de \(X\) pour cette relation d’équivalence.
ensemble quotient Soit \(π : X → Y\) un quotient de relation associée \(∼\). Soit \(f \! :X → Z\). Si
alors il existe une unique fonction \(φ : Y → Z\) telle que \(f = φ ∘ π\). Autrement dit, on a le diagramme commutatif
L’application \(φ\) est surjective si et seulement si \(f\) l’est. Elle est injective si et seulement si \(∀ x\; x', x ∼ x' ⇔ f(x) = f(x')\).
Réciproquement, si \(φ\) existe alors \(∀ x\; x', x ∼ x' ⇒ f(x) = f(x')\).
Dans le théorème, le terme « diagramme commutatif » signifie qu’à chaque fois qu’on peut aller d’un ensemble à un autre en suivant les flèches, les composées des applications correspondantes sont égales. Lorsque la condition du théorème est vérifiée, on dit que \(f\) est compatible avec la relation d’équivalence où encore que \(f\) descend au quotient en \(φ\), ou induit \(φ\) au quotient.
Supposons que \(f\) est compatible avec \(∼\). Montrons l’existence de \(φ\). Comme \(π\) est surjective, l’axiome du choix fournit \(σ \! :Y → X\) telle que \(π ∘ σ = \operatorname{Id}\). On pose \(φ = f ∘ σ\). Montrons que \(φ ∘ π = f\). Soit \(x\) dans \(X\). On a \(φ∘π(x) = (f ∘ σ) ∘ π(x) = f(σ(π(x))\). Or \(π(σ(π(x)) = π ∘ σ (π(x)) = π(x)\) donc \(σ(π(x)) ∼ x\). L’hypothèse sur \(f\) assure alors que \(f(σ(π(x)) = f(x)\).
Montrons maintenant l’unicité. Soit \(φ\) et \(φ'\) telles que que \(φ ∘ π = φ' ∘ π = f\). Soit \(y\) dans \(Y\). Comme \(π\) est surjective, on obtient \(x\) tel que \(y = π(x)\). On a alors \(φ(y) = φ(π(x)) = φ'(π(x)) = φ'(y)\).
Supposons \(φ\) surjective et montrons que \(f\) l’est. Soit \(z\) dans \(Z\). Par surjectivité de \(φ\), on obtient \(y\) tel que \(φ(y) = z\). Par surjectivité de \(π\) on obtient \(x\) tel que \(π(x) = y\) et on a \(f(x) = φ(π(x)) = φ(y) = z\) donc \(z ∈ \operatorname{im}f\). Réciproquement supposons que \(f\) est surjective. Soit \(z\) dans \(Z\). Par hypothèse on obtient \(x\) tel que \(f(x) = z\). On a alors \(φ(π(x)) = f(x) = z\) donc \(z ∈ \operatorname{im}φ\).
On a déjà supposé \(∀ x\; x', x ∼ x' ⇒ f(x) = f(x')\). On a :
\begin{align*} φ \text{ injective} & ⇔ ∀ y\; y’, φ(y) = φ(y’) ⇒ y = y’ \\ & ⇔ ∀ x\; x’, φ(π(x)) = φ(π(x’)) ⇒ π(x) = π(x’) \text{ car $π$ surj} \\ & ⇔ ∀ x\; x’, f(x) = f(x’) ⇒ π(x) = π(x’) \text{ car $f = φ∘π$} \\ & ⇔ ∀ x\; x’, f(x) = f(x’) ⇒ x ∼ x’ \end{align*}Réciproquement, supposons que \(f\) s’écrive sous la forme \(φ ∘ π\). Soit \(x\) et \(x'\) tels que \(x ∼ x'\). On a alors \(π(x) = π(x')\) donc \(f(x) = φ(π(x)) = φ(π(x')) = f(x')\).
Dans la démonstration d’existence, l’application \(σ\) est loin d’être unique en général, mais la partie unicité du théorème montre que cela n’a pas d’importance. Cette démonstration d’existence est souvent racontée de la façon imagée suivante. Pour chaque \(y\) dans \(Y\), on veut définir \(φ(y)\). Par surjectivité de \(π\), il existe \(x\) tel que \(y = π(x)\). On « pose \(φ(y) = f(x)\) et on vérifie que le résultat ne dépend pas de \(x\) parmi les préimages de \(y\) ». La phrase entre guillemets ne veut rien dire mais cela reste un bon moyen de se former une intuition. Il y a de nombreuses variantes encore plus poétiques de cette explication, comme par exemple « on pose \(φ([x]) = f(x)\) et on vérifie que \(φ\) est bien définie ».
On peut aussi noter que, selon les fondements choisis, l’axiome du choix peut être évité dans la démonstration ci-dessus. Par exemple en théorie des ensembles de Zermelo-Fraenkel, tout graphe défini une fonction (sans utiliser d’axiome supplémentaire) et on peut utiliser la surjectivité de \(π\) et l’hypothèse sur \(f\) pour montrer que
est un graphe. Mais la preuve donnée plus haut me semble bien plus intuitive et on ne s’occupe pas de fondements dans ce cours.
Soit \(T\) un réel strictement positif. On considère la relation d’équivalence sur \(ℝ\) définie par \(t ∼ t'\) si \(t' - t ∈ Tℤ\). Une fonction définie sur \(ℝ\) descend au quotient si et seulement si elle est \(T\)-périodique.
La propriété universelle implique en particulier que le quotient associé à une relation d’équivalence est essentiellement unique, au sens précis de l’énoncé suivant.
Si \(π₁ \! :X → Y₁\) et \(π₂ \! :X → Y₂\) sont deux quotients associés à la même relation d’équivalence \(∼\) alors il existe une unique bijection \(φ \! :Y₁ → Y₂\) telle que \(π₂ = φ ∘ π₁\).
Puisque la fonction \(π₂\) est associée à \(∼\), elle est en particulier compatible avec \(∼\) donc descend au quotient en une unique application \(φ \! :Y₁ → Y₂\) telle que \(π₂ = φ ∘ π₁\). Il reste à montrer que \(φ\) est une bijection. De même \(π₁\) descend au quotient en \(ψ \! :Y₂ → Y₁\) telle que \(π₁ = ψ ∘ π₂\).
On contemple donc le diagramme suivant :
Comme les deux petits triangles commutent, tout le diagramme commute. En effet \((ψ ∘ φ) ∘ π₁ = ψ ∘ (φ ∘ π₁) = ψ ∘ π₂ = π₁\). Or l’application \(\operatorname{Id}_{Y₁}\) vérifie aussi cette relation : \(\operatorname{Id}_{Y₁} ∘ π₁ = π₁\). Par unicité dans la propriété universelle de \((Y, π₁)\) appliquée à \(π₁\), on obtient donc \(ψ ∘ φ = \operatorname{Id}_{Y₁}\). On montre de même que \(φ ∘ ψ = \operatorname{Id}_{Y₂}\).
Soit \(T\) un réel strictement positif. L’application de \(ℝ\) dans \(𝕌\) (le groupe des nombres complexes de module 1) définit par \(t → \exp (2iπt/T)\) est un quotient. La relation d’équivalence associée est \(t ∼ t'\) si \(t - t' ∈ Tℤ\). On notera que \(𝕌\) n’est pas égal à \(ℝ/∼\) l’ensemble des classes d’équivalence pour \(∼\), mais le corollaire 1.0.8 assure qu’il existe une unique bijection \(φ\) qui fait commuter le diagramme suivant :
On a vu plus haut que les fonctions qui descendent au quotient par \(∼\) sont les fonctions \(T\)-périodiques. Comme \(𝕌\) est un quotient de \(ℝ\) par \(∼\), cet exemple explique précisement en quel sens les fonctions périodiques sur \(ℝ\) peuvent être vues comme des fonctions définies sur un cercle.
Le corollaire suivant de la propriété universelle des quotients explique comment définir une application entre deux quotients.
Soit \(π₁ \! :X₁ → Y₁\) et \(π₂ \! :X₂ → Y₂\) deux quotients et \(f \! :X₁ → X₂\). Si \(∀ x₁\; x₁', x₁ ∼ x₁' ⇒ f(x₁) ∼ f(x₁')\) alors il existe une unique application \(φ \! :Y₁ → Y₂\) telle que \(π₂ ∘ f = φ ∘ π₁\).
Réciproquement si \(φ\) existe alors \(∀ x₁\; x₁', x₁ ∼ x₁' ⇒ f(x₁) ∼ f(x₁')\).
Il suffit d’appliquer le théorème à \(π₂ ∘ f\) car, pour tous \(x₁\) et \(x₁'\) dans \(X₁\), \(f(x₁) ∼ f(x₁') ⇔ π₂ ∘ f(x₁) = π₂ ∘ f(x₁')\).
Dans l’énoncé précédent, le même symbole \(∼\) est utilisé pour les relations d’équivalence sur \(X₁\) et \(X₂\). On pourrait utiliser \(∼₁\) et \(∼₂\) mais en pratique il n’y a aucune ambigüité. On sait que \(f\) est une fonction de \(X₁\) dans \(X₂\). Dans l’expression \(∀ x₁\; x₁', x₁ ∼ x₁' ⇒ f(x₁) ∼ f(x₁')\), le fait qu’on applique \(f\) à \(x₁\) et \(x₂\) force \(x₁\) et \(x₂\) à vivre dans \(X₁\) donc la quantification universelle porte sur les éléments de \(X₁\), le premier \(∼\) est celui de \(X₁\) et le second est celui de \(X₂\). Dans les chapitres qui suivent, ce type d’inférence sera aussi utilisé constamment pour interpréter tous les symboles de lois de composition internes.
L’application \((p, q) ↦ (-p, q)\) de \(ℤ × ℕ^*\) dans lui-même descend en application de \(ℚ\) dans lui-même.
Un autre cas courant d’utilisation de la propriété universelle consiste à définir une application d’un produit de quotients vers un quotient (par exemple une loi de composition interne sur un quotient).
Soit \(π₁ \! :X₁ → Y₁\), \(π₂ \! :X₂ → Y₂\) et \(π₃ \! :X₃ → Y₃\) trois quotients et \(f \! :X₁ × X₂ → X₃\). Si
alors il existe une unique application \(φ \! :Y₁ × Y₂ → Y₃\) telle que \(π₃ ∘ f = φ ∘ (π₁ × π₂)\).
Comme \(π₁\) and \(π₂\) sont surjectives, \(π₁ × π₂\) l’est aussi donc \(π₁ × π₂ : X₁ × X₂ → Y₁ × Y₂\) est un quotient de \(X₁ × X₂\) et la relation d’équivalence associée est \((x₁, x₂) ∼ (x₁', x₂')\) si \(x₁ ∼ x₁'\) et \(x₂ ∼ x₂'\). On est donc ramené au corollaire 1.0.10.
La loi de composition interne sur \(ℤ × ℕ^*\) qui envoie \(((p₁, q₁), (p₂, q₂))\) sur \((p₁q₂ + p₂q₁, q₁q₂)\) descend au quotient en loi de composition interne sur \(ℚ\) (la vérification de la condition de l’énoncé est laissée en exercice). On appelle addition des nombres rationnels la loi ainsi définie.
Dans la démonstration précédente, on notera l’intérêt de ne pas se limiter à la construction explicite d’un quotient comme ensemble de classes d’équivalences (comme dans la démonstration du théorème 1.0.3). En effet, si on suppose que \(Y₁\) (resp. \(Y₂\)) est l’ensemble des classes d’équivalences de \(X₁\) (resp. \(X₂\)) alors \(Y₁ × Y₂\) n’est pas l’ensemble des classes d’équivalences de \(X₁ × X₂\). Par exemple si \(X₁ = \{ a\} \) et \(X₂ = \{ b\} \) (nécessairement munis de la relation d’équivalence triviale), on a \(Y₁ × Y₂ = \{ (\{ a\} , \{ b\} )\} \) tandis que \((X₁ × X₂)/∼ = \{ \{ (a, b)\} \} \).
On a vu dans les théorèmes 1.0.3 et 1.0.8 que les quotients et les relations d’équivalence décrivent essentiellement le même objet mathématique. Cet objet a une troisième incarnation qui est parfois utile, la notion de partition d’un ensemble.
Une partition d’un ensemble \(X\) est une collection de parties non-vides de \(X\) dont la réunion est \(X\) et qui sont deux à deux disjointes.
Pour tout quotient \(π \! :X → Y\), l’ensemble \(\{ π⁻¹(y) \; ;\; y ∈ Y\} \) est une partition de \(X\). Réciproquement, si \(\{ X_i \; ;\; i ∈ I\} \) est une partition de \(X\) alors l’application \(π\) de \(X\) dans \(I\) qui à \(x\) associe l’unique \(i\) tel que \(x ∈ X_i\) est un quotient.
Soit \(π : X → Y\) un quotient de \(X\). Comme tout élément de \(X\) a une image par \(π\), \(X\) est la réunion des \(π⁻¹(y)\). Comme \(π\) est surjective, tous les \(π⁻¹(y)\) sont non-vides. Comme chaque élément de \(x\) n’a qu’une image par \(π\), ils sont deux à deux disjoints.
Pour la réciproque, on observe d’une part que \(π\) est bien définie en utilisant que les \(X_i\) recouvrent \(X\) et sont disjoints et d’autre part qu’elle est surjective car chaque \(X_i\) est non-vide.
On a donc trois points de vue essentiellement équivalents. Par ordre décroissant d’importance générale, il s’agit de la notion de quotient, la notion de relation d’équivalence et la notion de partition. La prééminence de la notion de quotient peut choquer car le quotient n’est défini que modulo un unique isomorphisme mais il faut simplement s’habituer au fait que, dans bien des contextes, il s’agit d’une unicité plus naturelle que l’égalité.
On termine par un lemme technique qui sera parfois utile dans la suite.
Soit \(π : X → Y\) un quotient.
\(∀ B ∈ 𝒫(Y), π(π⁻¹(B)) = B\)
\(π⁻¹ \! :𝒫(Y) → 𝒫(X)\) est injective
Soit \(B\) une partie de \(Y\). On a \(π(π⁻¹(B)) ⊂ B\) sans utiliser la surjectivité de \(π\). Montrons l’autre inclusion. Soit \(b\) dans \(B\). La surjectivité de \(π\) fournit \(x ∈ X\) tel que \(π(x) = b\). Comme \(b ∈ B\), \(x ∈ π⁻¹(B)\) donc \(π(x) ∈ π(π⁻¹(B))\), c-à-d \(b ∈ π(π⁻¹(B))\). Soit \(B\) et \(B'\) des parties de \(Y\) telles que \(π⁻¹(B) = π⁻¹(B')\). En appliquant \(π\) et le point précédent, on obtient \(B = B'\).