7 Extensions d’algèbres et de corps
7.1 Éléments entiers et adjonction de racine
Comme tous les anneaux, \(ℚ\) est une \(ℤ\)-algèbre. Montrons qu’un élément de \(ℚ\) est entier sur \(ℤ\) si et seulement si il appartient à \(ℤ\). Soit \(x₀ ∈ ℚ\). Si \(x₀ ∈ ℤ\) alors \(P = X - x₀\) est bien un élément unitaire de \(ℤ[X]\) qui annule \(x₀\) (ie \(P(x₀) = 0\)). Réciproquement, supposons que \(x₀\) soit racine d’un polynôme unitaire \(P ∈ ℤ[X]\). On écrit \(x₀ = a/b\) avec \(a\) et \(b\) dans \(ℤ\) premiers entre eux et \(b ≠ 0\). On écrit \(P = Xⁿ + ∑_{i = 0}^{n-1} aᵢXⁱ\). En multipliant la relation \(P(x₀) = 0\) par \(bⁿ\), on obtient \(aⁿ + ∑_{i = 0}^{n-1} aᵢaⁱb^{n-i} = 0\). Dans le membre de gauche, \(b\) divise la somme donc \(b\) divise \(aⁿ\). Or \(b\) et \(a\) sont premiers entre eux donc \(b\) est une unité de \(ℤ\), c’est à dire \(b = ± 1\) et \(x₀\) est dans \(ℤ\).
Dans l’algèbre des endomorphismes d’un espace vectoriel de dimension finie sur un corps \(𝕂\), tous les éléments sont entiers sur \(𝕂\) puisque tout endomorphisme admet un polynôme annulateur unitaire.
Soit \(A\) un anneau commutatif et \(B\) une \(A\)-algèbre. Si \(B\) est commutative alors l’ensemble des éléments entiers sur \(A\) est une sous-algèbre de \(B\).
On note d’abord que les éléments de \(A\) sont entiers car, pour tout \(a ∈ A\), \(X - a\) annule \(a\). Soit \(x\) et \(y\) des éléments de \(B\) entiers sur \(A\). On veut montrer que \(x ± y\) et \(xy\) sont entiers sur \(A\). Notons \(z\) l’un de ces éléments (l’argument qui suit sera le même dans les trois cas). On écrit sous la forme \(X^n - P\) un polynôme annulateur de \(x\) unitaire dans \(A[X]\), avec \(\deg (P) {\lt} n\). De même on écrit \(X^m - Q\) un polynôme annulateur de \(y\).
On pose \(N = nm\). Soit \((v₁, \dots , v_N)\) une énumération de tous les produits \(x^iy^j\) avec \(0 ≤ i {\lt} n\) et \(0 ≤ j {\lt} m\) en commençant par \(v₁ = 1\). Pour tout \(k\) entre \(1\) et \(nm\), \(zvₖ\) s’écrit sous la forme \(∑_{l=1}^N c_{kl} v_l\) avec \(c_{kl} ∈ A\) pour tous \(k\) et \(l\). En effet la multiplication de \(v_k\) par \(x\) ou \(y\) fait au pire apparaître un \(x^n\) qu’on peut remplacer par \(P(x)\) qui a bien la forme attendue ou bien un \(y^m\) qu’on peut remplacer par \(Q(y)\).
On note \(C ∈ ℳ_N(A)\) la matrice de coefficients \(c_{kl}\). Par construction le vecteur \(v ∈ B^N\) de coordonnées \(v_k\) vérifie \(Cv = zv\). D’après le lemme 6.4.2, on a \({}^t{\operatorname{co}(C - z I_N)}(C - z I_N)= \det (C - z I_N)I_N\) donc \({}^t{\operatorname{co}(C - z I_N)}(Cv - zv) = \det (C - z I_N)v\) et donc \(\det (C - z I_N)v = 0\). Or \(v₁ = 1\) donc on en déduit \(\det (C - z I_N) = 0\). Ainsi le polynôme \((-1)^N\det (C - X I_N)\), qui est bien unitaire et à coefficients dans \(A\), convient.
La fin de la démonstration précédente nécessite un peu de précautions car le lien entre polynôme caractéristique et valeurs propre est plus subtile lorsque l’anneau des scalaires n’est pas intègre. Sous l’hypothèse que \(A\) est intègre, on aurait pu passer dans le corps des fractions de \(A\), conclure directement \(χ_C(z) = 0\) à partir de \(Cv = zv\) et \(v ≠ 0\) puis se souvenir que \(χ_C\) est à coefficients dans \(A\).
On notera aussi que la démonstration précédente est complètement effective. Si on connait un polynôme annulateur unitaire pour \(x\) et \(y\) on peut écrire la matrice \(C\) de façon complètement explicite et obtenir un polynôme annulateur explicite pour \(z\) en calculant un déterminant. Le résultat est difficile à imaginer même dans des cas très simples, par exemple si \(A = ℤ\) et \(B = ℝ\), \(x = \sqrt{2}\) et \(y = \sqrt{3}\) on trouve \(v = (1, \sqrt{2}, \sqrt{3}, \sqrt{6})\) et, pour \(z = \sqrt{2} + \sqrt{3}\),
qui donne \(X⁴ - 10X² + 1\) comme polynôme annulateur de \(z\). Ce résultat n’est pas complètement évident et on ne peut pas faire mieux en terme de degré.
Dans la proposition précédente, la commutativité de \(B\) est cruciale. Par exemple, si \(A = ℤ\) et \(B = ℳ_2 (ℚ)\), \(a = \left(\begin{smallmatrix}0 & 0\\ 1 & 0 \end{smallmatrix}\right)\) et \(b = \left(\begin{smallmatrix}0 & 1/2\\ 0 & 0 \end{smallmatrix}\right)\) sont entiers sur \(ℤ\) (car annulés par \(X²\)) mais \(ab = \left(\begin{smallmatrix}0 & 0\\ 0 & 1/2 \end{smallmatrix}\right)\) ne l’est pas car, pour tout polynôme unitaire \(P ∈ ℤ[X]\), \(P(ab) = \left(\begin{smallmatrix}0 & 0\\ 0 & P(1/2) \end{smallmatrix}\right)\) qui n’est jamais nul d’après l’exemple 7.1.2.
Voyons maintenant comment construire une \(A\)-algèbre à partir d’un anneau commutatif \(A\) en ajouter un élément ayant un polynôme annulateur prescrit. Il s’agit donc de généraliser la construction qui ajoute une racine de \(X² + 1\) à \(ℝ\) pour obtenir \(ℂ = ℝ[X]/(X² + 1)\).
adjonction d’une racine Soit \(A\) un anneau commutatif et \(P ∈ A[X]\). L’anneau \(A[X]/(P)\), muni du morphisme \(j \! :A → A[X]/(P)\) obtenu en composant \(A ↪ A[X]\) avec la projection canonique \(π \! :A[X] → A[X]/(P)\), est une \(A\)-algèbre dans laquelle \(P\) admet une racine, à savoir \(π(X)\). Si \(P\) est unitaire et de degré strictement positif alors \(j\) est injectif.
Cette algèbre vérifie la propriété universelle suivante : pour toute \(A\)-algèbre \(B\) et pour toute racine \(b\) de \(P\) dans \(B\), il existe un unique morphisme de \(A\)-algèbre \(ψ \! :A[X]/(P) → B\) qui envoie \(π(X)\) sur \(b\). Comme d’habitude, cette propriété caractérise \(A[X]/(P)\) modulo unique isomorphisme.
Avec les notations de la propriété universelle des algèbres de polynômes (proposition 6.3.2), il s’agit de montrer que l’évaluation \(\operatorname{ev}_{π(X)} \! :A[X] → A_P\) envoie \(P\) sur zéro. On remarque que le morphisme d’anneaux \(π \! :A[X] → A_P\) est aussi un morphisme de \(A\)-algèbres, par construction de la structure d’algèbre sur \(A_P\). Or l’unicité dans la propriété universelle des algèbres de polynômes assure que \(\operatorname{ev}_{π(X)}\) est l’unique morphisme de \(A\)-algèbres qui envoie \(X\) sur \(π(X)\). Donc \(\operatorname{ev}_{π(X)} = π\) et \(\operatorname{ev}_{π(X)}(P) = π(P) = 0\). Le critère d’injectivité sur \(j\) découle du lemme 4.3.14 qui assure que la projection de \(A[X]\) sur \(A_P\) est injective en restriction aux polynômes de degré strictement inférieur à celui de \(P\), donc en particulier en restriction à l’image de \(A\) dans \(A[X]\).
Soit \(B\) une \(A\)-algèbre et \(b\) une racine de \(P\) dans \(B\). La propriété universelle des algèbres de polynômes fournit un unique morphisme d’algèbres \(\operatorname{ev}_b \! :A[X] → B\) tel que \(\operatorname{ev}_b(X) = b\). Pour montrer que \(\operatorname{ev}_b\) descend, de façon unique, en morphisme d’anneaux \(ψ \! :A_P → B\), il suffit de montrer que \((P) ⊂ \ker \operatorname{ev}_b\). Pour cela il suffit de montrer que \(P ∈ \ker \operatorname{ev}_b\). Or \(\operatorname{ev}_b(P) = 0\) par définition de « \(b\) est racine de \(P\) ». Dans le diagramme
les deux petits triangles commutent donc le grand aussi, donc \(ψ\) est aussi un morphisme de \(A\)-algèbres. Comme d’habitude, l’unicité de \(ψ\) s’obtient en combinant les unicités dans les deux propriétés universelles invoquées.
7.2 Algèbres sur un corps
Dans cette section on suppose que l’anneau des scalaires est un corps. Le premier objectif est de généraliser la théorie du polynôme minimal rencontrée en algèbre linéaire. On étudiera ensuite dans quel cas une algèbre obtenue par adjonction d’une racine (au sens de la proposition 7.1.6) à une corps est elle-même un corps, comme c’est le cas quand on adjoint à \(ℝ\) une racine de \(X²+1\) pour obtenir \(ℂ\).
Soit \(𝕂\) un corps et \(A\) une \(𝕂\)-algèbre. Pour toute famille \(a₁, \dots , aₙ\) d’éléments de \(A\) qui commutent deux à deux, on note \(𝕂[a₁, \dots , aₙ]\) la sous-algèbre de \(A\) qu’ils engendrent. Il s’agit de l’image du morphisme d’algèbre \(\operatorname{ev}_a \! :𝕂[X₁, \dots , Xₙ] → A\) (en effet cette image une sous-algèbre qui vérifie clairement la propriété universelle de la sous-algèbre engendrée par les \(aᵢ\)).
La notation ci-dessus peut sembler ambigüe mais en pratique il y a peu de risque de confusion avec une algèbre de polynôme et on sait dans quoi vivent les \(aᵢ\) donc on retrouve le \(A\) implicite dans la notation.
Un élément \(a\) d’une \(𝕂\)-algèbre \(A\) est algébrique sur \(𝕂\) si et seulement si il est entier sur \(𝕂\) au sens de la section précédente. En effet tout polynôme unitaire est non nul et l’existence d’un polynôme annulateur non nul implique celle d’un polynôme annulateur unitaire en divisant par le coefficient dominant (qui est inversible car \(𝕂\) est un corps). Cette duplication de terminologie est un accident historique. En particulier la proposition 7.1.3 s’applique ici : si \(A\) est commutative, l’ensemble des éléments de \(A\) algébriques sur \(𝕂\) forme une sous-algèbre.
Soit \(𝕂\) un corps et \(A\) une \(𝕂\)-algèbre. Un élément \(a\) de \(A\) est algébrique sur \(𝕂\) si et seulement si \(\operatorname{ev}_a \! :𝕂[X] → A\) a un noyau non trivial. Dans ce cas il existe un unique polynôme unitaire \(μ_a ∈ 𝕂[X]\) tel que \(\ker \operatorname{ev}_a = (μ_a)\). On l’appelle le polynôme minimal de \(a\). L’entier \(n = \deg (μ_a)\) est appelé degré de \(a\). C’est le minimum des degrés des polynômes annulateurs de \(a\). La famille \((1, a, \dots , a^{n-1})\) est une \(𝕂\)-base de \(𝕂[a]\) (on rappelle que toute \(𝕂\)-algèbre est en particulier un \(𝕂\)-espace vectoriel). En particulier \(\dim _𝕂(𝕂[a]) = \deg (μ_a)\). L’anneau \(𝕂[a]\) est un corps si et seulement si \(μ_a\) est irréductible.
Si au contraire \(a\) est transcendent alors \(\operatorname{ev}_a\) est un isomorphisme de \(𝕂\)-algèbres entre \(𝕂[X]\) et \(𝕂[a]\). En particulier \(𝕂[a]\) est de dimension infinie.
Le fait qu’un élément \(a\) est algébrique si et seulement si \(\ker \operatorname{ev}_a ≠ 0\) est une transcription directe de la définition. Comme le noyau d’un morphisme d’anneau est un idéal, l’existence du polynôme minimal provient du fait que \(𝕂[X]\) est principal. Plus précisément, l’étude des idéaux de \(𝕂[X]\) assure qu’il existe un unique polynôme unitaire qui engendre \(\ker \operatorname{ev}_a\) et que son degré est minimal parmi les éléments de \(\ker \operatorname{ev}_a\).
Le théorème 4.2.7 assure que \(\operatorname{ev}_a\) induit un isomorphisme de \(𝕂[X]/(μ_a)\) sur \(\operatorname{im}\operatorname{ev}_a = 𝕂[a]\) qui envoie \(X\) sur \(a\). Le lemme 4.3.14 assure que, dans \(𝕂[X]/(μ_a)\), la famille \(1\), \(π(X)\), …, \(π(X)^{n-1}\) est libre et engendre donc elle forme bien une base et son image \(1\), \(a\), …, \(a^{n-1}\) dans \(𝕂[a]\) aussi. Enfin le lemme 4.2.26 assure que \(𝕂[a]\) est un corps si et seulement si \((μ_a)\) est un idéal maximal. D’après la proposition 4.3.10, cette condition est équivalente à l’irréductibilité de \(μ_a\).
Dans le cas où \(a\) est transcendant, le théorème 4.2.7 assure directement que \(\operatorname{ev}_a\) est un isomorphisme sur son image \(𝕂[a]\).
L’histoire du polynôme minimal ne se généralise pas bien aux cas des algèbres sur des anneaux qui ne sont pas des corps. D’abord il n’y a aucun raison que l’anneau de polynômes pertinent soit principal. Mais en plus il n’y a même pas unicité du polynôme unitaire de degré minimal annulant un élément entier. Par exemple \(ℤ/2ℤ\) est une \(ℤ\)-algèbre, \(1\) est entier et il est annulé par \(X - k ∈ ℤ[X]\) pour tout entier impair \(k\).
On peut aussi fabriquer des exemples où il existe un polynôme annulateur non unitaire de degré strictement plus petit que tous les polynômes annulateurs unitaires. Par exemple si l’anneau de base est \(R = ℤ/4ℤ\) et si \(A = R[Y]\) alors \(a = 2Y\) est entier sur \(R\) car annulé par \(X²\) mais il est aussi annulé par \(2X\) sans être annulé par aucun polynôme unitaire de degré \(1\).
Soit \(𝕂\) un corps et \(A\) une \(𝕂\)-algèbre. Pour tout élément algébrique \(a\) dans \(A\), \(a ∈ A^× ⇔ μ_a(0) ≠ 0\). De plus, si \(a\) est algébrique et inversible alors \(a⁻¹\) est dans \(𝕂[a]\).
Soit \(a\) un élément algébrique de \(A\). On écrit \(μ_a = XP + μ_a(0)\) pour un certain \(P ∈ 𝕂[X]\) de degré \(\deg (μ_a) - 1\). Par minimalité du degré de \(μ_a\), \(P(a) ≠ 0\). Comme \(μ_a(a) = 0\), on obtient \(aP(a) = -μ_a(0)\). Si \(μ_a(0) = 0\) alors, comme \(P(a) ≠ 0\), \(a\) ne peut pas être inversible. Si \(μ_a(0) ≠ 0\) alors on a \(a[(-μ_a(0)⁻¹P(a)] = 1\) et \([(-μ_a(0)⁻¹P(a)]a = 1\) donc \(a\) est inversible (notons que ces calculs utilisent que les éléments de \(𝕂\) tels que \(μ_a(0)\) commutent avec tous les éléments de \(A\) et que les puissances de \(a\) commutent entre elles). Dans ce dernier cas, \(a⁻¹ = -μ_a(0)⁻¹P(a)\) est bien dans \(𝕂[a]\).
Soit \(𝕂\) un corps et \(A\) une \(𝕂\)-algèbre. Si \(A\) est intègre alors, pour tout élément algébrique \(a\) dans \(A\), \(μ_a\) est irréductible et \(𝕂[a]\) est un corps.
Supposons \(A\) intègre et \(a\) algébrique. Par définition, \(μ_a\) est non nul. Supposons que \(μ_a = PQ\) avec \(P, Q ∈ 𝕂[X]\) (nécessairement non nuls). On a \(P(a)Q(a) = μ_a(a) = 0\) et \(A\) est intègre donc \(P(a) = 0\) ou \(Q(a) = 0\). Quitte à échanger \(P\) et \(Q\), on peut supposer \(P(a) = 0\). Comme \(𝕂\) est intègre, \(\deg (μ_a) = \deg (P) + \deg (Q)\). Donc la minimalité du degré de \(μ_a\) assure que \(\deg (Q) = 0\). Comme \(Q ≠ 0\), on en déduit que \(Q\) est inversible dans \(𝕂[X]\). Ainsi \(μ_a\) est irréductible et \(𝕂[a]\) est un corps d’après le lemme 7.2.5.
Dans le lemme précédent, l’intégrité est cruciale. Il s’agit d’un phénomène bien connu en algèbre linéaire. Par exemple dans \(A = ℳ_2(𝕂)\), \(a = \left(\begin{smallmatrix}0& 0\\ 0& 1\end{smallmatrix}\right)\) a pour polynôme minimal \(X(X-1)\) qui n’est pas irréductible. La non-commutativité de cette algèbre ne joue aucun rôle, tout se passe dans \(𝕂[a]\) qui est commutative.
7.3 Extensions de corps
Le corps des réels est une extension du corps des rationnels. Le corps des nombres complexes est une extension du corps des réels. Le corps \(𝕂(X)\) des fractions rationnelles à coefficients dans un corps \(𝕂\) est une extension de \(𝕂\).
Pour toute extension de corps \(𝕃/𝕂\) et toute famille \(α₁, \dots , αₙ\) d’éléments de \(𝕃\), on note \(𝕂(α₁, \dots , αₙ)\) le sous-corps de \(𝕃\) engendré par l’image de \(𝕂\) et \(\{ α₁, \dots , αₙ\} \). Il s’agit aussi d’une extension de \(𝕂\).
Dans une extension de corps \(ρ \! :𝕂 → 𝕃\), le morphisme \(ρ\) est automatiquement injectif. En effet son noyau est un idéal de \(𝕂\) donc \(0\) ou \(1\) d’après le lemme 4.2.19 et le cas \(\ker ρ = 1\) est exclus car on aurait alors \(1_𝕂 ∈ \ker ρ\) tandis que \(ρ(1_𝕂) = 1_𝕃\) et \(1_𝕃 ≠ 0_𝕃\) car \(𝕃\) est un corps.
Pour cette raison on écrit parfois qu’une extension \(𝕃\) d’un corps \(𝕂\) est un sur-corps de \(𝕂\), c’est à dire un corps tel que \(𝕂 ⊂ 𝕃\). Ce n’est ni plus ni moins abusif que d’écrire \(ℚ ⊂ ℝ\) ou \(ℝ ⊂ ℂ\).
Par ailleurs le fait de ne presque jamais expliciter \(ρ\) ne doit pas faire oublier que \(𝕂\) et \(𝕃\) ne déterminent pas uniquement \(ρ\). Par exemple \(ℚ[X]/(X² - 2)\) est un corps (car \(X² - 2\) est irréductible dans \(ℚ[X]\)) qui se plonge de deux façons dans \(ℝ\) par \(a + b \bar X ↦ a + b \sqrt2\) et par \(a + b \bar X ↦ a - b \sqrt2\). Ces deux plongements proviennent de la propriété universelle de l’adjonction de racines (proposition 7.1.6) appliquées aux deux racines de \(X² - 2\) dans \(ℝ\). Cet exemple conduit à la définition suivante.
Soit \(𝕂\) un corps. Un isomorphisme d’extensions de \(𝕂\) est un isomorphisme de \(𝕂\)-algèbres entre deux extensions de \(𝕂\). Autrement dit il s’agit d’un isomorphisme \(φ \! :𝕃 → 𝕃'\) tel que
commute. On y pense comme l’ensemble des isomorphismes entre \(𝕃\) et \(𝕃'\) qui « sont l’identité sur \(𝕂\) ». L’ensemble des automorphismes d’une extension \(𝕃\) de \(𝕂\) est appelé le groupe de Galois de \(𝕃\) sur \(𝕂\) et noté \(\operatorname{Gal}(𝕃/𝕂)\).
La conjugaison complexe est un automorphisme de \(ℂ/ℝ\) (encore une fois, cette notation signifie « \(ℂ\) vu comme extension de \(ℝ\) », cela n’indique pas un quotient).
La première partie du lemme suivant généralise le fait que les racines complexes d’un polynôme à coefficients réels viennent par paires complexes conjuguées. La deuxième partie est une sorte de réciproque partielle.
Soit \(𝕂\) un corps et \(𝕃\) et \(𝕃'\) deux extensions de \(𝕂\).
Pour tout isomorphisme \(φ \! :𝕃 → 𝕃'\), pour tout polynôme \(P ∈ 𝕂[X]\) et tout \(α ∈ 𝕃\), \(P(φ(α)) = φ(P(α))\). En particulier \(P(α) = 0 ⇔ P(φ(α)) = 0\).
Soit \(α ∈ 𝕃\) et \(β ∈ 𝕃'\) des éléments algébriques sur \(𝕂\). Il existe un isomorphisme d’extensions \(φ \! :𝕂(α) → 𝕂(β)\) qui envoie \(α\) sur \(β\) si et seulement si \(μ_α = μ_β\).
Soit \(φ \! :𝕃 → 𝕃'\) un isomorphisme d’extensions et \(α ∈ 𝕃\). La dernière partie de la proposition 6.3.2 assure que \(\operatorname{ev}_{φ(α)} = φ ∘ \operatorname{ev}_α\) donc, pour tout \(P\), \(P(φ(α)) = \operatorname{ev}_{φ(α)}(P) = φ ∘ \operatorname{ev}_α(P) = φ(P(α))\).
Il est instructif d’écrire un calcul plus explicite en prétendant que \(𝕂\) est vraiment inclus dans \(𝕃\) et \(𝕃'\) et que \(φ|_{𝕂} = \operatorname{Id}\) de sorte que les coefficients \(a_i\) de \(P\) vérifient \(φ(aᵢ) = aᵢ\) :
\begin{align*} P(φ(α)) & = ∑ᵢ aᵢφ(α)ⁱ \\ & = ∑ᵢ φ(aᵢ)φ(α)ⁱ \\ & = ∑ᵢ φ(aᵢαⁱ) \\ & = φ\left(∑ᵢ aᵢαⁱ\right) \\ & = φ(P(α)). \end{align*}Montrons maintenant le second point. Supposons que \(φ\) soit un isomorphisme d’extensions qui envoie \(α\) sur \(β\). D’après le premier point, pour tout \(P ∈ 𝕂[X]\), \(P(α) = 0 ⇔ P(β) = 0\) donc \(\operatorname{ev}_α\) et \(\operatorname{ev}_β\) ont même noyau et donc \(μ_α = μ_β\). Réciproquement supposons que \(μ_α = μ_β\). On a alors les isomorphismes de \(𝕂\)-algèbres
dont la composée envoie bien \(α\) sur \(β\).
Pour \(𝕂 = ℚ\) et \(𝕃 = 𝕃' = ℂ\), avec \(α = \sqrt[3]{2}\) et \(β = e^{2iπ/3}α\), on a \(μ_α = μ_β = X³ - 2\) donc il existe un isomorphisme de \(ℚ\)-algèbres qui envoie \(ℚ(α)\) sur \(ℚ(β)\) bien que le premier soit inclus dans \(ℝ\) et pas le second.
Le lemme suivant est immédiat mais très important.
Soit \(𝕃/𝕂\) une extension de corps. Pour tout automorphisme \(φ ∈ \operatorname{Gal}(𝕃/𝕂)\), l’ensemble \(\operatorname{Fix}(φ)\) des points fixes de \(φ\) est un sous-corps de \(𝕃\) qui contient (l’image de) \(𝕂\).
La conjugaison complexe est un automorphisme de \(ℂ/ℚ\) dont l’ensemble des points fixes est \(ℝ\). Dans \(ℚ[\sqrt2]\), l’application \(a + b\sqrt2 ↦ a - b\sqrt2\) est un automorphisme de \(ℚ[\sqrt2]/ℚ\) dont l’ensemble des points fixes est \(ℚ\).
Soit \(𝕃/𝕂\) une extension de corps. L’ensemble des éléments de \(𝕃\) qui sont algébriques sur \(𝕂\) est un sous-corps de \(𝕃\) (qui contient \(𝕂\)).
L’extension \(ℂ/ℝ\) est finie, de degré \(2\). Plus généralement, le lemme 7.2.5 assure que pour tout \(𝕃/𝕂\) et tout \(α ∈ 𝕃\) algébrique, \(𝕂(α)/𝕂\) est finie, de degré \(\deg (α) = \deg (μ_α)\) (c’est de cet exemple que provient la terminologie « degré d’une extension »).
Le même lemme 7.2.5 assure aussi que toute extension finie est algébrique puisqu’un élément transcendant engendre un sous-corps de dimension infinie. La réciproque de cette observation est fausse : on peut montrer que l’ensemble des réels algébriques sur \(ℚ\) est de degré infini (il s’agit bien d’un sous-corps de \(ℝ\) contenant \(ℚ\) d’après la proposition 7.3.10).
Soit \(𝔽/𝔼\) et \(𝔼/𝕂\) des extensions de corps. On a
En particulier si \(𝔽/𝔼\) et \(𝔼/𝕂\) sont finies alors \(𝔽/𝕂\) est finie.
Dans cette démonstration, les applications entre corps sont implicites. Soit \((e_i)_{i ∈ I}\) une \(𝕂\)-base de \(𝔼\) et \((f_j)_{j ∈ J}\) une \(𝔼\)-base de \(𝔽\). Montrons que \((e_i f_j)_{(i, j) ∈ I × J}\) est une \(𝕂\)-base de \(𝔽\). Soit \(x ∈ 𝔽\). On décompose \(x\) sur la base \(f\) en \(∑_j x_j f_j\) avec chaque \(x_j\) dans \(E\). Puis on décompose chaque \(x_j\) sur la base \(e\) en \(∑_i x_{j,i} e_i\). On a ainsi
donc la base promise engendre \(𝔽\). Montrons qu’elle est libre. Supposons
Comme la famille \(f\) est libre, on obtient \(∀ j, ∑_{i, j} λ_{j, i} e_i = 0\). Puis, pour chaque \(j\), on utilise que la famille \(e\) est libre pour obtenir \(∀ i, λ_{j, i} = 0\).
Si \(𝕃/𝕂\) est une extension finie alors, pour tout \(α ∈ 𝕃\), \(\deg (α) \mid [𝕃 : 𝕂]\) (on sait déjà que \(α\) est algébrique sur \(𝕂\)).
D’après la proposition précédente, \([𝕃 : 𝕂] = [𝕃 : 𝕂(α)] [𝕂(α) : 𝕂]\) et, d’après le lemme 7.2.5, \([𝕂(α) : 𝕂] = \deg (α)\).
Si \(𝔽/𝔼\) et \(𝔼/𝕂\) sont algébriques alors \(𝔽/𝕂\) est algébrique.
Soit \(α ∈ 𝔽\). Comme \(𝔽/𝔼\) est algébrique, on obtient \(n ∈ ℕ\) et \(a₀, \dots , a_{n-1} ∈ 𝔼\) tels que \(αⁿ = ∑ᵢ aᵢαⁱ\). Par hypothèse, chaque \(aᵢ\) est algébrique sur \(𝕂\). On considère la tour d’extensions
Comme chaque \(aᵢ\) est algébrique sur \(𝕂\), il est a fortiori algébrique sur \(𝕂(a₀, \dots , a_{i-1})\) donc chacune de ces extensions est finie d’après l’exemple 7.3.12. Par la proposition précédente, on en déduit par récurrence sur \(n\) que \(𝕂(a₀, \dots , a_{n-1})/𝕂\) est finie. Par ailleurs \(α\) est algébrique sur \(𝕂(a₀, \dots , a_{n-1})\) donc \(𝕂(a₀, \dots , a_{n-1}, α)\) est finie sur \(𝕂(a₀, \dots , a_{n-1})\) donc sur \(𝕂\). Ainsi \(α\) est dans une extension finie de \(𝕂\) donc est algébrique sur \(𝕂\).
Tout polynôme à coefficients dans un corps admet un corps de décomposition.
Dans le résultat précédent, le corps de décomposition est unique modulo isomorphisme d’extensions du corps de base, mais nous n’aurons pas besoin de ce fait.
Montrons par récurrence sur \(n ∈ ℕ\) que
On notera que \(𝕂\) n’est pas fixé. Si \(n = 0\) alors pour tout \(𝕂\) et tout \(P\), \(𝕂\) convient. Supposons maintenant le résultat prouvé jusqu’à \(n\). Soit \(𝕂\) un corps et \(P ∈ 𝕂[X]\) avec \(\deg (P) = n + 1\). Comme \(\deg (P) ≥ 1\), on obtient un facteur irréductible \(Q\) de \(P\) avec \(\deg (Q) ≥ 1\). Le corps \(𝕃₁ = 𝕂[X]/(Q)\) est une extension de \(𝕂\) dans laquelle \(Q\) a une racine \(α\) et \(𝕃₁ = 𝕂(α)\). Dans \(𝕃₁[X]\), \((X - α) \mid Q\) donc \((X - α) \mid P\). On obtient ainsi \(R ∈ 𝕃₁[X]\) tel que \(P = (X - α)R\) et \(\deg (R) = n\). Par hypothèse de récurrence appliquée à \(𝕃₁\) et \(R\), on obtient un corps de décomposition \(𝕃\) pour \(R\). Sur ce corps, \(R\) et donc \(P\) sont scindés et \(𝕃 = 𝕃₁(α₁, \dots , αₙ) = 𝕂(α₁, \dots , αₙ, α)\) donc \(𝕃\) est un corps de décomposition pour \(P\).
7.4 Corps finis
Soit \(A\) un anneau et \(ι \! :ℤ → A\) l’unique morphisme d’anneau de \(ℤ\) dans \(A\). La caractéristique de \(A\) est l’unique entier naturel \(\operatorname{car}(A)\) tel que
L’anneau \(ℤ\) est de caractéristique nulle. L’anneau \(ℤ/nℤ\) est de caractéristique \(n\). Un anneau est de caractéristique \(1\) si et seulement si il est trivial.
Si un anneau \(A\) est intègre alors sa caractéristique est nulle ou un nombre premier. En effet \(ι \! :ℤ → A\) induit un isomorphisme de \(ℤ/\operatorname{car}(A)ℤ\) vers un sous-anneau de \(A\). On réserve parfois le mot caractéristique à ce cas des anneaux intègres.
Le même argument montre que si \(\operatorname{car}(A) = 0\) alors \(A\) est infini. La réciproque est fausse, par exemple \(ℤ/2ℤ(X)\) est un corps infini de caractéristique \(2\).
Soit \(𝕂\) un corps. Pour toute \(𝕂\)-algèbre \(A\) non triviale, \(\operatorname{car}(A) = \operatorname{car}(𝕂)\). En particulier toute extension de \(𝕂\) a la même caractéristique que \(𝕂\).
Soit \(ρ \! :𝕂 → A\) le morphisme d’anneau qui donne la structure de \(𝕂\)-algèbre de \(A\). On note \(ι_𝕂\) et \(ι_A\) les uniques morphismes de \(ℤ\) dans \(𝕂\) et \(A\) respectivement. Par cette unicité, \(ι_A = ρ ∘ ι_𝕂\). Or \(ρ\) est nécessairement injectif car \(\ker ρ\) est un idéal de \(𝕂\) donc \(0\) ou \(1\) et \(ρ(1_𝕂) = 1_A\) et on a supposé \(A\) non trivial donc \(1_A ≠ 0_A\). On a donc \(\ker ι_A = \ker (ρ ∘ ι_𝕂) = \ker ι_𝕂\).
Un corps est de caractéristique nulle si et seulement si il contient une copie de \(ℚ\). Cette copie est alors unique, c’est le sous-corps engendré par \(1\).
Si \(ℚ\) s’injecte dans un corps \(𝕂\) alors on a \(\operatorname{car}(𝕂) = \operatorname{car}(ℚ) = 0\) par le lemme précédent. Réciproquement, supposons \(\operatorname{car}(𝕂) = 0\). Alors \(ι \! :ℤ → 𝕂\) est injective. La propriété universelle du corps des fractions (corollaire 4.4.13) assure alors que \(ι\) s’étend de façon unique en morphisme (nécessairement injectif) de \(ℚ\) dans \(𝕂\). Toute autre injection de \(ℚ\) étend nécessairement \(ι\) par unicité de \(ι\).
Un anneau \(A\) est de caractéristique \(p\) avec \(p\) premier si et seulement si il contient une copie de \(ℤ/pℤ\). Cette copie est alors unique, c’est le sous-anneau de \(A\) engendré par \(1\).
Si \(A\) contient une copie de \(ℤ/pℤ\) alors \(\operatorname{car}(A) = \operatorname{car}(ℤ/pℤ) = p\) d’après le lemme 7.4.4. Réciproquement supposons que \(\operatorname{car}(A) = p\). On a vu que \(ι \! :ℤ → A\) induit alors un morphisme injectif de \(ℤ/pℤ\) dans \(A\). Son image est le sous-anneau engendré par \(1\) car \(ℤ/pℤ\) est engendré par \(1\) (comme anneau). Il reste à montrer l’unicité. Toute copie de \(ℤ/pℤ\) dans \(A\) contient nécessairement \(1\) donc le sous-anneau qu’il engendre. Or ce sous-anneau est de cardinal \(p\) donc on conclut par inclusion et égalité des cardinaux (finis).
Dans toute la suite de ce chapitre, on notera \(𝔽_{\! p}\) le corps \(ℤ/pℤ\).
Soit \(p\) un nombre premier et \(A\) un anneau commutatif de caractéristique \(p\). L’application \(F \! :A → A\) qui envoie \(x\) sur \(x^p\) est un morphisme d’anneaux appelé morphisme de Frobenius de \(A\). Si \(A\) est intègre alors \(\operatorname{Fix}(F) = ℤ/pℤ\).
Le fait que \(F\) est un morphisme de monoïdes multiplicatifs est clair. C’est l’addition qui nécessite l’hypothèse de caractéristique. Soit \(x\) et \(y\) dans \(A\). Comme \(A\) est commutatif, on a la formule du binôme de Newton :
Il s’agit de voir que seuls les termes correspondant à \(k = 0\) et \(k = p\) sont non nuls. Par définition de \(\operatorname{car}(A)\), il suffit de montrer que, pour tous les autres \(k\), \(p \mid \binom {p}{k}\). Pour \(k {\gt} 0\), on a
donc \(\binom p k = \frac{p}k\binom {p-1}{k-1}\) et \(p\) divise \(k\binom p k\). Si on suppose en plus \(k {\lt} p\) alors \(p\) ne divise pas \(k\) et, comme \(p\) est premier, \(p\) divise \(\binom p k\).
Par définition, les points fixes de \(F\) dont les racines du polynôme \(X^p - X\). Si \(A\) est intègre alors ce polynôme a au plus \(p\) racines d’après le lemme 4.3.15. Or on sait, par le petit théorème de Fermat, que tous les éléments de \(ℤ/pℤ\) sont racines donc on conclut par inclusion et égalité de cardinaux (finis).
Pour tout \(q ∈ ℕ\), il existe un corps fini de cardinal \(q\) si et seulement si \(q\) est de la forme \(p^n\) avec \(p\) premier et \(n ≥ 1\). Soit \(p\) un nombre premier, \(n ≥ 1\) un entier et \(𝕂\) un corps de cardinal \(q = p^n\).
\(\operatorname{car}(𝕂) = p\)
Le groupe multiplicatif \((𝕂^×, ×)\) est cyclique
Dans \(𝕂[X]\), \(X^q - X = ∏_{a ∈ 𝕂}(X - a)\). En particulier tous les éléments \(a\) de \(𝕂\) vérifient \(a^q = a\).
Il existe \(α ∈ 𝕂\), \(𝕂 = 𝔽_{\! p}[α]\)
Les sous-corps de \(𝕂\) sont exactement les \(\operatorname{Fix}(F^k)\) pour \(k\) divisant \(n\). Il y en a donc \(φ(n)\). De plus \(♯\operatorname{Fix}(F^k) = p^k\).
Si \(𝕃\) est un corps fini à \(p^n\) élément alors il existe un isomorphisme entre \(𝕂\) et \(𝕃\) (mais il n’est pas unique en général).
Le dernier point du théorème affirme qu’un corps fini est déterminé modulo isomorphisme par son cardinal. Malgré l’absence d’unicité dans ce résultat, il est traditionnel de dire et d’écrire « soit \(𝔽_{\! q}\) le corps à \(q\) éléments ».
Le fait que le groupe multiplicatif d’un corps fini soit cyclique est non trivial, même dans le cas d’un cardinal premier. Par exemple \(3\) engendre \(𝔽₇^×\) et ses puissances énumèrent \(𝔽₇^×\) dans l’ordre \((3, 2, 6, 4, 5, 1)\).
Vu le quatrième point de l’énumération ci-dessus, l’existence d’un corps fini à \(p^n\) éléments est équivalente à l’existence d’un polynôme irréductible de degré \(n\) dans \(𝔽_{\! p}[X]\). Là encore cette existence n’a rien d’évident.
On verra dans la démonstration que les deux points les plus spectaculaires, l’information sur le groupe des inversibles et l’unicité modulo isomorphisme, sont très liés.
Soit \(𝕂\) un corps de cardinal fini \(q\). Vu la remarque 7.4.3 et le lemme 7.4.5, \(𝕂\) est de caractéristique \(p\) pour un nombre premier \(p\). Le lemme 7.4.6 assure alors que \(𝕂\) est une \(𝔽_{\! p}\)-algèbre. Cette algèbre est nécessairement de dimension finie car \(𝕂\) est fini. On note \(n\) cette dimension. La classification des espaces vectoriels assure que \(𝕂\) est isomorphe à \(𝔽_{\! p}^n\) (en temps que \(𝔽_{\! p}\)-espace vectoriel) donc il est de cardinal \(p^n\).
Réciproquement, soit \(q\) un entier de la forme \(p^n\) avec \(p\) premier et \(n ≥ 1\). La proposition 7.3.17 fournit un corps de décomposition \(𝕃\) pour \(P = X^q - X ∈ 𝔽_{\! p}[X]\). En particulier \(P\) est scindé sur \(𝕃\) : \(P = ∏_{i=1}^q(X - αᵢ)\). Montrons que les \(αᵢ\) sont deux à deux distincts. Supposons qu’il existe \(α\) tel que \(P = (X - α)²Q\) pour un \(Q ∈ 𝕃[X]\). D’après le lemme 6.3.11, on a alors \(P' = 2(X - α)Q + (X-α)²Q'\) donc \(P'(α) = 0\). Or \(P' = qX^{q-1} - 1 = -1\) car \(p \mid q\) et \(\operatorname{car}(𝕃) = p\) d’après le lemme 7.4.4. On obtient donc \(0 = 1\) qui absurde car \(𝕃\) est un corps. Ainsi l’ensemble des racines de \(P\) est de cardinal exactement \(q\). De plus cet ensemble est un sous-corps de \(𝕃\) d’après le lemme 7.3.8 car il s’agit de \(\operatorname{Fix}(F^n)\) où \(F\) est le morphisme de Frobenius de \(𝕃\) qui est un morphisme de corps d’après le lemme 7.4.8. On a bien trouvé un corps de cardinal \(q\). A posteriori on peut même affirmer qu’il s’agit exactement de \(𝕃\) puisque \(𝕃\) est engendré par les \(αᵢ\).
Dans toute la suite, \(𝕂\) désigne un corps de cardinal \(q = p^n\). Montrons que tous les éléments de \(𝕂\) sont racines de \(X^q - X\). Le théorème de Lagrange (corollaire 3.2.13) assure que, pour tout \(x ∈ 𝕂^×\), \(x^{♯𝕂^×} = 1\), c’est-à-dire \(x^{q-1} = 1\). Ainsi tous les éléments de \(𝕂^×\) sont racines de \(X^{q-1} - 1\) et donc tous les éléments de \(𝕂\) sont racines de \(X(X^{q-1} - 1)\), c’est-à-dire de \(X^q - X\). Comme ce polynôme a au plus \(q\) racines, on apprend qu’il est scindé à racines simples et on a bien la factorisation annoncée dans \(𝕂[X]\).
Pour montrer que \(𝕂^×\) est cyclique, on va montrer l’énoncé plus général suivant : pour tout corps \(𝕃\), tout sous-groupe fini de \(𝕃^×\) est cyclique. Soit \(𝕃\) un corps et \(G\) un sous-groupe fini de \(𝕃^×\). Pour tout \(x ∈ G\), \(x^{\exp (G)} = 1\) (cf. définition 5.6.11). Ainsi les éléments de \(G\) sont tous des racines de \(X^{\exp (G)} - 1\). Or ce polynôme a au plus \(\exp (G)\) racines donc \(♯G ≤ \exp (G)\). Par ailleurs, comme pour tout groupe fini, \(\exp (G) ≤ ♯G\). Donc \(♯G = \exp (G)\) et le corollaire 5.6.13 assure que \(G\) est cyclique. Remarque : de nombreuses sources déduisent ce résultat de la classification complète des groupes abéliens finis, mais ce n’est pas raisonnable, le lemme 5.6.12 est une étape importante mais complètement élémentaire et auto-contenue dans cette classification.
Le paragraphe précédent fourni un générateur \(α\) de \(𝕂^×\). On a alors \(𝕂 = 𝔽_{\! p}(α)\) car \(𝔽_{\! p}(α)\) contient à la fois zéro et le sous groupe multiplicatif engendré par \(α\), c’est à dire \(𝕂^×\).
Montrons maintenant la description des sous-corps de \(𝕂\). Soit \(𝕃\) un sous-corps de \(𝕂\). D’après le lemme 7.4.4, \(\operatorname{car}(𝕂) = \operatorname{car}(𝕃)\) donc \(\operatorname{car}(𝕃) = p\) et on a une tour d’extensions \(𝕂/𝕃/𝔽_{\! p}\). Posons \(k = [𝕃 : 𝔽_{\! p}]\). En particulier \(𝕃 = p^k\) d’après la première partie de ce théorème. On a aussi vu que tous les éléments de \(𝕃\) sont racines de \(X^{p^k} - X\). Comme ce polynôme a au plus \(p^k\) racines dans \(𝕂\), on obtient que \(𝕃\) est l’ensemble des racines de \(X^{p^k} - X\) dans \(𝕂\), c’est-à-dire l’ensemble des points fixe de \(F^k\) où \(F\) est le morphisme de Frobenius de \(𝕂\). La proposition 7.3.13 assure que \(n = [𝕂 : 𝔽_{\! p}] = [𝕂 : 𝕃] \cdot [𝕃 : 𝔽_{\! p}]\). Ainsi \(k \mid n\). Réciproquement, soit \(k\) un diviseur de \(n\). On sait que \(\operatorname{Fix}(F^k)\) est un sous-corps de \(𝕂\). Montrons qu’il est de cardinal \(p^k\). Le lemme arithmétique ci-dessous assure que \(X^{p^k} - X\) divise \(X^{p^n} - X\) dans \(ℤ[X]\) et donc dans \(𝔽_{\! p}[X]\) (car le morphisme d’anneaux de \(ℤ\) dans \(𝔽_{\! p}\) induit un morphisme d’anneaux de \(ℤ[X]\) dans \(Fₚ[X]\)). Comme on a vu que \(X^{p^n} - X\) est scindé à racines simples, c’est aussi le cas de son diviseur \(X^{p^k} - X\) qui a donc \(p^k\) racines.
Enfin montrons que si \(𝕃\) est un corps à \(p^n\) éléments alors \(𝕃\) est isomorphe à \(𝕂\). Soit \(α\) tel que \(𝕂 = 𝔽_{\! p}(α)\). On note \(μ_α\) le polynôme minimal de \(α\) sur \(𝔽_{\! p}\). On a vu que \(α\) est racine de \(X^q - X\) donc \(μ_α \mid X^q - X\) dans \(𝔽_{\! p}[X]\). Or on sait que \(X^q - X\) est scindé sur \(𝕃\) donc \(μ_α\) aussi. Ainsi \(μ_α\) a une racine \(β\) dans \(𝕃\). Comme \(μ_α\) est irréductible d’après le lemme 7.2.5 et unitaire, il s’agit du polynôme minimal de \(β\). Le lemme 7.3.6 fournit alors un isomorphisme entre \(𝔽_{\! p}(α) = 𝕂\) et \(𝔽_{\! p}(β) ⊂ 𝕃\). En particulier \(♯𝔽_{\! p}(β) = p^n\) et, comme \(♯𝕃 = p^n\), on a \(𝔽_{\! p}(β) = 𝕃\) et l’isomorphisme construit est un isomorphisme de \(𝕂\) vers \(𝕃\).
La démonstration précédente a laissé de côté le petit lemme arithmétique suivant.
Soit \(p\), \(n\) et \(m\) des entiers naturels. Si \(m \mid n\) alors \(X^{p^m} - X \mid X^{p^n} - X\) dans \(ℤ[X]\).
Posons \(k = p^n\) et \(l = p^m\). Supposons \(m \mid n\) et posons \(r = n/m\). On observe que, pour tout anneau commutatif intègre \(A\), pour tout \(a ∈ A\) et tout \(s ∈ ℕ^*\), \(a - 1 \mid a^s - 1\) car \(a^s - 1 = (a - 1)(a^{s-1} + \cdots + a + 1)\). En appliquant cette observation à \(A = ℤ\), \(a = l\) et \(s = r\), on obtient que \(l - 1 \mid l^r - 1\), c’est à dire \(l - 1 \mid k - 1\). Posons \(d = (k-1)/(l-1)\). On applique l’observation à \(A = ℤ[X]\), \(a = X^{l-1}\) et \(s = d\) pour obtenir \(X^{l-1} - 1 \mid X^{d(l-1)} - 1\), c’est à dire \(X^{l-1} - 1 \mid X^{k-1} - 1\) puis, en multipliant par \(X\), \(X^l - X \mid X^k - X\).
Cette classification et sa démonstration sont extrêmement concrètes, elles permettent en principe de tout de calculer dans les corps finis. Voyons par exemple comment construire un corps à \(2³ = 8\) éléments. Le théorème dit qu’on doit chercher un polynôme irréductible de degré \(2\) dans \(𝔽_{\! 2}[X]\). En degré trois l’irréductibilité est équivalente à l’absence de racine puisque toute décomposition en produits de facteurs de degrés strictement positifs ferait intervenir un facteur de degré un. On trouve comme polynômes possibles \(X³ + X² + 1\) et \(X³ + X + 1\). Explorons les deux possibilités en parallèle. On pose \(𝕂 = 𝔽_{\! 2}[X]/(X³ + X² + 1)\) et on note \(α\) l’image de \(X\). On pose \(𝕃 = 𝔽_{\! 2}[X]/(X³ + X + 1)\) et on note \(β\) l’image de \(X\). D’après le lemme 4.3.14, on a :
et une énumération similaire pour \(𝕃\) avec \(β\) à la place de \(α\). De plus on a \(α³ + α² + 1 = 0\) et \(β³ + β + 1 = 0\) d’après la proposition 7.1.6 donc \(α³ = α² + 1\) et \(β³ = β + 1\) (car ces corps sont de caractéristique \(2\) donc tous les signes moins disparaissent). Ces informations suffisent à décrire entièrement l’addition et la multiplication dans ces corps. Par exemple \((α + 1)α² = α³ + α² = α² + α² + 1 = 1\) et on voit en particulier que \(α + 1\) et \(α²\) sont bien inversibles.
Le fait que les groupes multiplicatifs de \(𝕂\) et \(𝕃\) soient cycliques est trivial car ils sont de cardinal \(8 - 1 = 7\) qui est premier donc tous les éléments sauf \(1\) engendrent le groupe. La démonstration du théorème de classification explique ensuite comment trouver un isomorphisme entre \(𝕂\) et \(𝕃\). Il suffit de choisir un générateur de \(𝕂^×\) et de trouver un élément de \(𝕃\) ayant le même polynôme minimal. On choisit \(α\) comme générateur de \(𝕂^×\). On a \(μ_α = X³ + X² + 1\) par construction. Ensuite, par recherche exhaustive, on voit que les racines de \(μ_α\) dans \(𝕃\) sont \(β + 1\), \(β² + β + 1\) et \(β² + 1\). Prenons la première. On obtient un unique isomorphisme de corps de \(𝕂\) sur \(𝕃\) qui envoie \(α\) sur \(β + 1\). Vérifions que \(α + 1\) et \(α²\) sont bien envoyés sur des éléments inverses l’un de l’autre. On a \(φ(α + 1) = β + 1 + 1 = β\), \(φ(α²) = (β + 1)² = β² + 1\) et \(β(β² + 1) = β³ + β = β + 1 + β = 1\).
7.5 Nombres constructibles
Dans cette section, on utilise la théorie des extensions de corps pour expliquer la solution de problèmes très célèbres qui ont résisté aux mathématiciens pendant plus de deux mille ans : en utilisant uniquement une règle non graduée et un compas, on ne peut pas construire un cube de volume double d’un cube donné (c’est le problème de la duplication du cube), ou bien couper en trois parts égales un angle de \(π/6\) (c’est le problème de la trisection de l’angle).
Étant donnés deux points distincts dans le plan, on définit par récurrence les points, droites et cercles constructibles à la règle et au compas par :
Le deux points donnés sont constructibles.
Si \(A\) et \(B\) sont constructibles et distincts alors la droite \((AB)\) est constructible et le cercle \(𝒞(A, B)\) de centre \(A\) passant par \(B\) est constructible.
Tout point d’intersection isolé entre droites ou cercles constructibles est constructible.
On dit qu’un nombre réel \(x\) est constructible si \(|x|\) est la distance entre deux points constructibles, pour l’unité de distance fournie par les deux points de départ.
Le but de cette section est de démontrer le théorème suivant et quelques uns de ses corollaires.
L’ensemble \(𝕂\) des nombres réels constructibles est un sous-corps de \(ℝ\) qui est stable par racine carré. Un nombre réel \(x\) est constructible si et seulement si il existe une tour d’extensions \(ℝ/K_N/\cdots /K₁/ℚ\) telle que \(x ∈ K_N\) et, pour tout \(i {\lt} N\), \(K_{i+1} = K_i(\sqrt{d_i})\) pour un certain \(d_i ∈ K_i ∩ ℝ_+\) tel que \(\sqrt{d_i} ∉ K_i\).
Tout réel constructible \(x\) est algébrique sur \(ℚ\) et \(\deg (x) = 2^n\) pour un entier \(n\). Le nombre \(\sqrt[3]{2}\) n’est pas constructible donc on ne peut pas réaliser la duplication du cube à la règle et au compas. Le nombre \(\cos (π/9)\) n’est pas constructible donc on ne peut pas réaliser la trisection d’un angle de \(π/3\) à la règle et au compas.
Soit \(x\) un réel constructible. Le théorème fournit une tour d’extensions \(ℝ/K_N/\cdots /K₁/ℚ\) telle que \(x ∈ K_N\) et, pour tout \(i {\lt} N\), \([K_{i+1} : K_i] = 2\). La proposition 7.3.13 assure que \([K_N : ℚ] = 2^N\). De plus le corollaire 7.3.14 assure que \(\deg (x) \mid [K_N : ℚ]\) donc \(\deg (x)\) est bien de la forme \(2^n\).
Ainsi, pour montrer que \(x₀ = \sqrt[3]{2}\) n’est pas constructible, il suffit de montrer qu’il n’est pas algébrique de degré une puissance de deux. Montrons qu’il est algébrique de degré \(3\). On sait que \(X³ - 2\) annule \(x₀\) donc \(x₀\) est algébrique et \(\deg (x₀) \mid 3\). Ainsi \(x₀\) est de degré \(1\) ou \(3\). La première possibilité signifierait que \(x₀\) est rationnel. Montrons que ce n’est pas le cas. Supposons que \(x₀ = p/q\) avec \(p\) et \(q\) des entiers strictement positifs premiers entre eux. On alors \(p³ = 2q³\). Donc, en notant \(v₂(n)\) la valuation \(2\)-adique d’un entier \(n\), on obtient \(3v₂(p) = 3v₂(q) + 1\) puis \(3(v₂(p) - v₂(q)) = 1\), ce qui est absurde car \(3\) n’est pas inversible dans \(ℤ\).
Montrons de même que \(x₁ = \cos (π/9)\) est algébrique de degré \(3\). Pour tout réel \(θ\), on a \(\cos (3θ) = 4\cos ³(θ) - 3\cos (θ)\). Comme \(\cos (π/3) = 1/2\), on en déduit que \(1/2 = 4x₁³ - 3x₁\) donc \(x₁\) est racine de \(8X³ - 6X - 1\). Ainsi \(x₁\) est algébrique et son degré divise \(3\) donc il suffit de montrer qu’il est irrationnel. Supposons que \(x₀ = p/q\) avec \(p\) et \(q\) des entiers strictement positifs premiers entre eux. On a alors \(8p³ - 6pq² - q³ = 0\) donc \(p(8p² - 6q²) = q³\) et \(p \mid q³\). Comme \(p\) et \(q\) sont premiers entre eux, on obtient \(p = 1\) et \(8 - 6q² = q³\). Ainsi \(q²(q + 6) = 8\). L’unicité de la décomposition en facteurs premiers d’un entier fournit \(k\) et \(l\) entiers naturels tels que \(q = 2^k\), \(q+6 = 2^l\) et \(2k + l = 3\). En particulier \(2^l - 6 = 2^k ≥ 1\) donc \(l ≥ 3\). Comme \(2k + l = 3\), la seule possibilité est \((k, l) = (0, 3)\). Or \(2⁰ + 6 ≠ 2³\) donc \(x₁\) n’est pas rationnel.
On commence par observer que si une droite \(Δ\) et un point \(P\) sont construits alors la perpendiculaire \(Δ'\) à \(Δ\) passant par \(P\) est constructible. La figure 1 présente cette construction, les numéros indique l’ordre des étapes. La droite \(Δ\) contient au moins deux points construits et l’un au moins de ces points n’est pas sur \(Δ'\). Appelons \(A\) un tel point. Le cercle \(𝒞(P, A)\) intersecte \(Δ\) aussi en \(B ≠ A\) (car \(A\) n’est pas sur \(Δ'\)). Le point \(B\) est donc constructible, puis les cercles \(𝒞(A, B)\) et \(𝒞(B, A)\) le sont et leur intersection \(\{ C, D\} \) l’est. On a \((CD) = Δ'\) qui est donc constructible.
En appliquant deux fois cette construction de perpendiculaire, on peut aussi construire la parallèle à une droite construite passant par un point construit.
Montrons que cela permet de reporter la distance entre deux points \(A\) et \(B\) construits sur une droite \(Δ\) construite à partir d’un point \(C\) construit (figure 7.2).
On commence par construire la parallèle \(Δ'\) à \((AB)\) passant par \(C\) puis la parallèle \(Δ''\) à \((AC)\) passant par \(B\). L’intersection de ces droites est un point \(D\) et \(ABDC\) est un parallélogramme donc \(CD = AB\). Les points d’intersection de \(𝒞(C, D)\) et de \(Δ\) réalisent le report de la longueur \(AB\) sur le droite \(Δ\) en partant de \(C\) (d’un côté ou de l’autre de \(C\)).
Muni de cette construction de report, on obtient facilement que les nombres constructibles forment un sous-groupe additif de \(ℝ\). On note au passage que la construction de perpendiculaire permet de construire un repère orthonormé dont deux des points sont les points de départ et de montrer qu’un point est constructible si et seulement si ses deux coordonnées dans ce repère sont des nombres constructibles.
Supposons que \(x\) et \(y\) sont des nombres constructibles et montrons que \(xy\) l’est aussi (figure 7.3). Puisque, par définition, un nombre est constructible si et seulement si sa valeur absolue l’est, on peut supposer que \(x\) et \(y\) sont positifs. Soit \(A\) et \(B\) des points construits tels que \(AB = x\).
On construit \(Δ\) perpendiculaire à \((AB)\) et passant par \(A\). Puis on reporte la longueur \(1\) sur \(Δ\) à partir de \(A\) pour obtenir un point \(C\) tel que \(CA = 1\). À partir de \(C\) on reporte la longueur \(y\) sur \(Δ\) du même côté de \(C\) que \(A\) (sur la figure \(y {\gt} 1\) mais cela n’a pas d’importance dans la suite). On obtient ainsi un point \(D\) tel que \(CD = y\). On construit ensuite la droite \((CB)\) puis la perpendiculaire à \(Δ\) passant par \(D\). On note \(E\) l’intersection de ces deux droites. Comme \((AB)\) et \((DE)\) sont toutes deux perpendiculaires à \(Δ\), elles sont parallèles entre elles. Le théorème de Thalès assure alors que \(DE/AB = DC/AC\), c’est à dire \(DE/x = y/1\) donc \(DE = xy\) et \(xy\) est bien construit. La construction de l’inverse d’un nombre constructible est une variante de cet argument, en utilisant encore le théorème de Thalès.
Montrons maintenant la stabilité par racine carré en utilisant le théorème de Pythagore (figure 7.4). Soit \(a\) un nombre constructible positif et \([AB]\) un segment de longueur \(a\).
On reporte sur la droite \((AB)\) la longueur \(1\) pour obtenir un point \(C\) tel que \(BC = 1\) et \(B ∈ [AC]\). On construit ensuite le cercle de diamètre \([AC]\) (pour cela on intersecte \(𝒞(A, C)\) et \(𝒞(C, A)\) pour construire la médiatrice de \([AC]\) puis le milieu \(I\) de \([AC]\) et enfin \(𝒞(I, A)\)). On construit la perpendiculaire \(Δ\) à \((AC)\) passant par \(B\) et \(D\) un des points d’intersection de \(Δ\) et du cercle de diamètre \([AC]\). Par le théorème de Pythagore dans \(ABD\), on obtient \(AB² + BD² = AD²\). Par le théorème de Pythagore dans \(CBD\), on obtient \(CB² + BD² = CD²\). Par le théorème de Pythagore dans \(ACD\), qui est rectangle en \(D\) car \(D\) est sur le cercle de diamètre \([AC]\), on obtient \(AD² + CD² = (AB + BC)²\). En combinant ces trois équations, on élimine \(AC\) et \(CB\) pour obtenir \(2BD² = (AB + BC)² - AB² - CB²\), c’est à dire \(2BD² = (a+1)² - a² - 1²\) donc \(BD² = a\) et \(BD = \sqrt{a}\). Ainsi \(\sqrt{a}\) est constructible.
Montrons maintenant la deuxième partie du théorème. La première partie montre que si \(x\) est dans une tour d’extensions obtenues par adjonctions de racines carrées alors \(x\) est constructible. Réciproquement, supposons que \(x\) est constructible. Montrons l’existence de la tour d’extensions par récurrence sur le nombre d’étapes de constructions, en appelant étape de construction l’intersection entre deux droites ou cercles construits.
Comme expliqué précédemment, on peut construire un repère orthonormé tel qu’un point un constructible si et seulement si ses coordonnées le sont. Après zéro étape, seul \(1\) est constructible. Montrons que chaque nouvelle étape préserve le corps engendré sur \(ℚ\) par les coordonnées des points construits (appelé « corps courant » dans la suite) ou l’étend en ajoutant une racine carré d’un élément du corps.
Si \(A\) et \(B\) sont construits et distincts, alors la droite \((AB)\) est d’équation \((x_B - x_A)(y - y_A) = (x - x_A)(y_B - y_A)\) (en effet il s’agit bien de l’équation d’une droite qui contient \(A\) et \(B\)). Les coefficients de cette droite appartiennent au corps engendré sur \(ℚ\) par les coordonnées de \(A\) et de \(B\). Les coordonnées de l’intersection de deux telles droites sont obtenues en résolvant un système d’équations linéaires. La formule de Cramer montre donc que le corps courant ne change pas (on notera que le déterminant associé n’est pas nul car les droites ne sont pas parallèles puisqu’on ne considère que des intersections isolées).
Si \(A\) et \(B\) sont construits, alors le cercle \(𝒞(A, B)\) est d’équation
qui est aussi à coefficient dans le corps courant. Si \(C\) et \(D\) sont construits alors on peut paramétrer la droite \((CD)\) par
qui est une fonction linéaire à coefficients dans le corps courant. Plus généralement toute droite admettant une équation à coefficients dans le corps courant admet un tel paramétrage. L’intersection entre \(𝒞(A, B)\) et \((CD)\) se calcule en injectant cette fonction de \(t\) dans l’équation du cercle et en cherchant les racines du polynôme de degré \(2\) en \(t\) ainsi obtenu. Ce polynôme est à coefficients dans le corps courant. Ainsi il suffit au pire d’ajouter une racine carrée.
L’intersection de deux cercles s’obtient par résolution d’un système de la forme
où \(R₁\) et \(R₂\) sont dans le corps courant. La différence entre ces deux équations est linéaire car la partie quadratique est \(x²+ y²\) dans les deux cas. De plus cette différence est non nulle car on ne considère que les intersections isolées donc les deux cercles sont distincts. Donc nous sommes de nouveau ramenés à un système formé d’une équation de cercle et d’une équation de droite, toutes deux à coefficients dans le corps courant. Notons que cet argument pour faire disparaître \(x² + y²\) ne fonctionnerait pas si on voulait intersecter des ellipses générales et de fait il peut y avoir exactement quatre points d’intersection entre deux ellipses donc l’espoir de se ramener à une équation de degré deux serait mince.
7.6 Clôtures algébriques
Le corps \(ℂ\) est un clôture algébrique de \(ℝ\), c’est le théorème de d’Alembert-Gauß. Cela sera démontré en cours d’analyse complexe, il n’y a pas de démonstration purement algébrique, bien que ce résultat soit souvent appelé le « théorème fondamental de l’algèbre ».
Un corps algébriquement clos est nécessairement infini. En effet, si \(𝕂 = \{ x₁, \dots , x_n\} \) alors \(P = ∏_i (X - xᵢ) + 1\) est de degré strictement positif et n’a aucune racine dans \(𝕂\).
Si un corps \(𝕂\) est algébriquement clos alors tout polynôme \(P\) est scindé dans \(𝕂[X]\), c’est à dire qu’on peut écrire \(P\) comme produit de polynômes de degrés au plus un.
Supposons que tout polynôme est scindé. Soit \(P\) un polynôme de degré strictement positif. Comme \(P\) a au moins un facteur de degré un, il a au moins une racine. La réciproque est une récurrence facile sur le degré en utilisant que si \(P(α) = 0\) alors \((X - α) \mid P\).
Soit \(𝕃/𝕂\) une clôture algébrique d’un corps \(𝕂\). Pour toute extension algébrique \(𝔼/𝕂\), il existe un morphisme de \(𝕂\)-algèbres de \(𝔼\) dans \(𝕃\).
Il s’agit d’une application du lemme de Zorn. On considère l’ensemble
muni de la relation d’ordre \((𝔽, φ) ≤ (𝔽', φ')\) si \(𝔽 ⊂ 𝔽'\) et \(φ'|_{𝔽} = φ\). Par hypothèse on a des morphismes de corps \(ρ \! :𝕂 → 𝔼\) et \(θ \! :𝕂 → 𝕃\). L’ensemble \(𝒵\) n’est donc pas vide car il contient \((ρ(𝕂), θ ∘ ρ⁻¹)\) où \(ρ⁻¹\) est bien définie sur \(ρ(𝕂)\) car \(ρ\) est injective. Soit \(((𝔽ᵢ, φᵢ))_{i ∈ I}\) une famille totalement ordonnée d’éléments de \(𝒵\). On pose \(𝔽 = ⋃ᵢ 𝔽ᵢ\). Comme la famille est totalement ordonnée, il s’agit d’un sous-corps de \(𝕃\). De plus la condition de restriction dans la définition de la relation d’ordre assure que les \(φᵢ\) se recollent en un morphisme de \(𝕂\)-algèbre \(φ \! :𝔽 → 𝕃\). La paire \((𝔽, φ)\) est alors un majorant de la famille. Ainsi le lemme de Zorn (lemme 4.2.28) fournit un élément \((𝔽, φ) ∈ 𝒵\) maximal.
Montrons que \(𝔽 = 𝔼\), de sorte que \(φ\) est le morphisme recherché. Comme \(𝔽 ⊂ 𝔼\) par définition de \(𝒵\), il suffit de montrer que \(𝔼 ⊂ 𝔽\). Soit \(α ∈ 𝔼\). Comme \(𝔼/𝕂\) est algébrique, \(α\) est algébrique sur \(𝕂\) donc sur \(𝔽\). Soit \(μ_α ∈ 𝔽[X]\) son polynôme minimal sur \(𝔽\). On utilise \(φ\) pour munir \(𝕃\) d’une structure de \(𝔽\)-algèbre. Comme \(𝕃\) est algébriquement clos, \(μ_α\) admet au moins une racine \(β\) dans \(𝕃\). Puisque \(μ_α\) est irréductible dans \(𝔽[X]\) d’après le lemme 7.2.5, \(μ_α\) est aussi le polynôme minimal de \(β\) et le lemme 7.3.6 fournit un isomorphisme de \(𝔽\)-algèbres \(ψ \! :𝔽(α) → 𝔽(β)\). En particulier \(ψ\) envoie \(𝔽(α)\) dans \(𝕃\) en étendant \(φ\) (puisque c’est un morphisme de \(𝔽\)-algèbres et que \(φ\) définit la structure de \(𝔽\)-algèbre sur \(𝕃\)). Ainsi \((𝔽(α), ψ)\) est dans \(𝒵\) et par maximalité de \((𝔽, φ)\), \(𝔽(α) = 𝔽\) et \(ψ = φ\). En particulier \(α ∈ 𝔽\) et on a montré \(𝔼 ⊂ 𝔽\).
Tout corps admet une clôture algébrique, unique à isomorphisme d’extensions près (mais un tel isomorphisme n’est pas unique en général).
Soit \(𝕂\) un corps. On note \(A = 𝕂[(X_P)_{P ∈ 𝕂[X]}]\) la \(𝕂\)-algèbre des polynômes d’indéterminées indexées par \(𝕂[X]\). On note \(I\) l’idéal de \(A\) engendré par les \(P(X_P)\) pour \(P ∈ 𝕂[X]\) de degré strictement positif (\(P(X_P) = \operatorname{ev}_{X_P}(P)\) a bien un sens puisque \(P ∈ 𝕂[X]\) et que \(A\) est une \(𝕂\)-algèbre). Concrètement, en écrivant \(P = ∑ᵢ cᵢ Xⁱ\), \(P(X_P) = ∑ᵢ cᵢ X_Pⁱ ∈ A\).
Montrons que \(I\) est strictement inclus dans \(A\). Supposons que \(1\) est dans \(I\). On obtient alors \(N ∈ ℕ\), \(a₁, \dots , a_N ∈ A\) et \(P₁, \dots , P_N ∈ 𝕂[X]\) tels que
Comme les \(Pᵢ\) sont de degré strictement positif, en utilisant \(N\) fois l’existence d’un corps de décomposition garantie par la proposition 7.3.17, on obtient une extension \(𝕃/𝕂\) telle que chaque \(Pᵢ\) admettent une racine \(αᵢ\) dans \(𝕃\). La propriété universelle de \(A\) fournit un morphisme de \(𝕂\)-algèbres \(φ \! :A → 𝕃\) tel que, pour tout \(i\), \(φ(X_{Pᵢ}) = αᵢ\) et, pour tout \(P\) qui n’est pas parmi les \(Pᵢ\), \(φ(P) = 0\) (cette dernière condition ne sera pas utile, on la mentionne juste pour spécifier \(φ\) entièrement). En appliquant \(φ\) à l’égalité 3, on obtient \(∑_i φ(aᵢ)φ(Pᵢ(X_{Pᵢ})) = 1\). La dernière partie de la proposition 6.3.2 assure que, pour tout \(i\), \(φ(Pᵢ(X_{Pᵢ})) = Pᵢ(φ(X_{Pᵢ})) = Pᵢ(αᵢ) = 0\) donc on obtient \(0 = 1\) dans \(𝕃\), ce qui est absurde car \(𝕃\) est un corps. Ainsi on a montré que \(I\) est un idéal propre.
Le théorème de Krull (proposition 4.2.29) fournit donc un idéal maximal \(J ⊲ A\) qui contient \(I\) et le lemme 4.2.26 assure que \(𝕂₁ = A/J\) est un corps. La composée de \(𝕂 → A → A/J\) fait de \(𝕂₁\) une extension de \(𝕂\). Par construction de \(I\), chaque \(P ∈ 𝕂[X]\) de degré strictement positif admet une racine dans la \(𝕂\)-algèbre \(A/I\) (à savoir \(X_P\)) donc a fortiori dans l’extension \(𝕂₁\).
Par contre on ne sait pas si les polynômes de degré strictement positif à coefficients dans \(𝕂₁\) ont tous une racine (en fait on peut montrer que c’est vrai, mais c’est plus compliqué que l’argument qui va suivre). On itère donc toute la construction pour obtenir une tour d’extension \(𝕂₁\), \(𝕂₂\), …. On pose \(𝕂₀ = 𝕂\) et on note \(ρᵢ\) le morphisme d’extension de \(𝕂ᵢ\) dans \(𝕂_{i+1}\) pour tout \(i ∈ ℕ\) et \(ρᵢ^j = ρ_{j-1} ∘ \cdots ∘ ρ_i \! :𝕂ᵢ → 𝕂ⱼ\). On note \(𝕃₀\) la « réunion » des \(𝕂ᵢ\), c’est à dire le quotient de \(\bigsqcup _i 𝕂ᵢ\) par la relation qui associe \(xᵢ ∈ 𝕂ᵢ\) et \(xⱼ ∈ 𝕂ⱼ\) s’il existe \(k ≥ \max (i, j)\) tel que \(ρᵢᵏ(xᵢ) = ρⱼᵏ(xⱼ)\). Construisons une structure de corps sur \(𝕃₀\). Pour \(xᵢ ∈ 𝕂ᵢ\) et \(xⱼ ∈ 𝕂ⱼ\), on pose \(k = \max (i, j)\) et \(xᵢ \hat+ xⱼ = ρᵢᵏ(xᵢ) + ρⱼᵏ(xⱼ)\). On vérifie que cette loi de composition interne descend à \(𝕃\). On définit de même une multiplication sur \(𝕃₀\) et on vérifie que \(𝕃₀\) est un corps.
Montrons que \(𝕃₀\) est algébriquement clos. Soit \(P\) un polynôme de degré strictement positif à coefficients dans \(𝕃₀\). Comme \(P\) n’a qu’un nombre fini de coefficient, il existe \(N\) tel que ces coefficients proviennent de \(𝕂_N\). Ainsi \(P\) a une racine dans \(𝕂_{N+1}\) donc dans \(𝕃₀\).
Enfin on note \(𝕃\) l’ensemble des éléments de \(𝕃₀\) qui sont algébriques sur \(𝕂\). Il s’agit d’un sous-corps de \(𝕃₀\) d’après la proposition 7.3.10 et l’extension \(𝕃/𝕂\) est algébrique par définition. Ce \(𝕃\) est algébriquement clos car tout polynôme à coefficients dans \(𝕃₀\) de degré strictement positif admet une racine dans \(𝕃₀\) et une telle racine est algébrique sur \(𝕃\) donc sur \(𝕂\) donc appartient à \(𝕃\). Ainsi \(𝕃\) est une clôture algébrique de \(𝕂\).
Montrons maintenant l’unicité modulo isomorphisme. Soit \(𝕃\) et \(𝕃'\) deux clôtures algébriques de \(𝕂\). Le lemme 7.6.5 appliqué à \(𝔼 = 𝕃'\) fournit un morphisme de \(𝕂\)-algèbres \(ρ \! :𝕃' → 𝕃\). On sait que \(ρ\) est automatiquement injective donc son image est un sous-corps algébriquement clos de \(𝕃\) qui contient (l’image de) \(𝕂\). Or \(𝕃\) est algébrique sur \(𝕂\) donc sur \(ρ(𝕃')\) donc \(𝕃 = ρ(𝕃')\) et \(ρ\) est un isomorphisme d’extensions de \(𝕂\).