17.1 Généralités sur les espaces affines

17.1.1 Notion d’espace affine

Définition 17.1.1 On appelle espace affine un triplet (E,\overrightarrow{E},+) d’un ensemble E (l’ensemble des points), d’un espace vectoriel \overrightarrow{E} (l’espace des vecteurs) et d’une application + : E ×\overrightarrow{ E} → E, (x,\overrightarrow{ξ})\mathrel{↦}x +\overrightarrow{ ξ} vérifiant les propriétés

Remarque 17.1.1 L’assertion (i) et la moitié ”” de l’assertion (iii) traduisent que l’application (x,\overrightarrow{ξ})\mathrel{↦}x +\overrightarrow{ ξ} est une loi de groupe opérant sur un ensemble du groupe additif de l’espace vectoriel \overrightarrow{E} sur l’ensemble E. La propriété (iii) traduit le fait que cette opération est transitive, c’est-à-dire qu’il y a une seule orbite pour cette opération. La moitié ”” de la propriété (ii) est appelée la fidélité de l’opération. Un espace affine est donc une opération transitive et fidèle du groupe additif d’un espace vectoriel sur un ensemble. L’espace vectoriel \overrightarrow{E} est appelé la direction de l’espace affine. Par la suite on confondra abusivement l’espace affine (E,\overrightarrow{E},+) avec l’ensemble E de ses points.

Proposition 17.1.1 Etant donné x,y ∈ E, il existe un unique vecteur noté \overrightarrow{xy} ∈\overrightarrow{ E} vérifiant x +\overrightarrow{ xy} = y. On a \overrightarrow{xy} = 0 \mathrel{⇔} x = y et on a la relation de Chasles

\mathop{∀}x,y,z ∈ E, \overrightarrow{xz} =\overrightarrow{ xy} +\overrightarrow{ yz}

Démonstration L’existence est garantie par la propriété (iii). Pour l’unicité, si on a à la fois y = x +\overrightarrow{ ξ} = x +\overrightarrow{ η}, on a x = x +\overrightarrow{ 0} = (x +\overrightarrow{ ξ}) + (−\overrightarrow{ξ}) = (x +\overrightarrow{ η}) + (−\overrightarrow{ξ}) = x + (\overrightarrow{η} −\overrightarrow{ ξ}) d’où \overrightarrow{ξ} −\overrightarrow{ η} =\overrightarrow{ 0} et donc \overrightarrow{ξ} =\overrightarrow{ η}. La propriété \overrightarrow{xy} = 0 \mathrel{⇔} x = y est une conséquence évidente de (ii). On a z = y +\overrightarrow{ yz} = (x +\overrightarrow{ xy}) +\overrightarrow{ yz} = x + (\overrightarrow{xy} +\overrightarrow{ yz}) d’où \overrightarrow{xz} =\overrightarrow{ xy} +\overrightarrow{ yz}.

Proposition 17.1.2 Soit a ∈ E. L’application {φ}_{a} : x\mathrel{↦}\overrightarrow{ax} est une bijection de l’espace affine E sur l’espace vectoriel \overrightarrow{E}.

Démonstration L’application réciproque est bien entendu l’application {ψ}_{a} :\overrightarrow{ ξ}\mathrel{↦}a +\overrightarrow{ ξ}. On vérifie immédiatement que {ψ}_{a} ∘ {φ}_{a} ={ \mathrm{Id}}_{E} et que {φ}_{a} ∘ {ψ}_{a} ={ \mathrm{Id}}_{\overrightarrow{E}}.

Remarque 17.1.2 Par transport des opérations algébriques de \overrightarrow{E} sur E, on munit ainsi E d’une structure d’espace vectoriel isomorphe à \overrightarrow{E}. On dira que l’espace vectoriel ainsi obtenu est le vectorialisé de E en l’origine a et on le notera par la suite {E}_{a}. On retiendra donc que le choix d’une origine dans l’espace affine transforme cet espace affine en un espace vectoriel.

Définition 17.1.2 On appelle dimension de l’espace affine E la dimension de sa direction \overrightarrow{E} comme espace vectoriel.

17.1.2 Repères affines, bases affines

Définition 17.1.3 On appelle repère affine de E tout couple (a,ℰ) d’un point a de E (l’origine du repère) et d’une base de \overrightarrow{E}. Si ℰ = {(\vec{{e}}_{i})}_{i∈I} tout point x ∈ E s’écrit de manière unique sous la forme x = a +{\mathop{ \mathop{∑ }} }_{i∈I}{x}_{i}\vec{{e}}_{i} ; on dit que les {x}_{i} sont les coordonnées du point x dans le repère affine ; ce sont également les coordonnées du vecteur \overrightarrow{ax} dans la base .

Soit (a,ℰ) et (b,ℱ) deux repères affines de E. Ecrivons alors (avec des notations évidentes) b = a +{\mathop{ \mathop{∑ }} }_{i∈I}{β}_{i}\vec{{e}}_{i} et \vec{{f}}_{j} ={\mathop{ \mathop{∑ }} }_{i∈I}{u}_{i,j}\vec{{e}}_{i}. On a alors, si les {x}_{i} désignent les coordonnées de x dans le repère (a,ℰ) et les {y}_{j} celles de x dans le repère (b,ℱ)

\begin{eqnarray*} x& =& b +{ \mathop{∑ }}_{j∈J}{y}_{j}\vec{{f}}_{j} = a +{ \mathop{∑ }}_{i∈I}{β}_{i}\vec{{e}}_{i} +{ \mathop{∑ }}_{j∈J}{y}_{j}{ \mathop{∑ }}_{i∈I}{u}_{i,j}\vec{{e}}_{i}%& \\ & =& a +{ \mathop{∑ }}_{i∈I}{β}_{i}\vec{{e}}_{i} +{ \mathop{∑ }}_{i∈I}\left ({\mathop{∑ }}_{j∈J}{u}_{i,j}{y}_{j}\right ){e}_{i} %& \\ & =& a +{ \mathop{∑ }}_{i∈I}\left ({β}_{i} +{ \mathop{∑ }}_{j∈J}{u}_{i,j}{y}_{j}\right ){e}_{i} %& \\ \end{eqnarray*}

si bien que \mathop{∀}i ∈ I,{x}_{i} = {β}_{i} +{\mathop{ \mathop{∑ }} }_{j∈J}{u}_{i,j}{y}_{j} ce qui fournit les formules de changement de repère.

Proposition 17.1.3 Soit {({a}_{i})}_{i∈I} une famille non vide de points de E. Alors les propriétés suivantes sont équivalentes

  • (i) il existe {i}_{0} ∈ I tel que la famille {(\overrightarrow{{a}_{{i}_{0}}{a}_{i}})}_{i∈I∖\{{i}_{0}\}} soit libre (resp. génératrice, resp. une base) dans \overrightarrow{E}
  • (ii) pour tout {i}_{0} ∈ I, la famille {(\overrightarrow{{a}_{{i}_{0}}{a}_{i}})}_{i∈I∖\{{i}_{0}\}} est libre (resp. génératrice, resp. une base) dans \overrightarrow{E}

On dit dans ce cas que la famille {({a}_{i})}_{i∈I} est affinement libre (resp. affinement génératrice, resp. une base affine) de E.

Démonstration Libre : Il est clair que (ii)(i). Supposons (i) vérifiée et soit {i}_{1} ∈ I. Soit {({λ}_{i})}_{i∈I∖\{{i}_{1}\}} une famille de scalaires (avec seulement un nombre fini de scalaires non nuls) tels que {\mathop{\mathop{∑ }} }_{i∈I∖\{{i}_{1}\}}{λ}_{i}\overrightarrow{{a}_{{i}_{1}}{a}_{i}} =\overrightarrow{ 0}. On a alors en notant que \overrightarrow{{a}_{{i}_{0}}{a}_{{i}_{0}}} =\overrightarrow{ 0})

\begin{eqnarray*} \overrightarrow{0}& =& {\mathop{∑ }}_{i∈I∖\{{i}_{1}\}}{λ}_{i}(\overrightarrow{{a}_{{i}_{1}}{a}_{{i}_{0}}} +\overrightarrow{ {a}_{{i}_{0}}{a}_{i}}) %& \\ & =& {\mathop{∑ }}_{i∈I∖\{{i}_{0},{i}_{1}\}}{λ}_{i}\overrightarrow{{a}_{{i}_{0}}{a}_{i}} −\left ({\mathop{∑ }}_{i∈I∖\{{i}_{1}\}}{λ}_{i}\right )\overrightarrow{{a}_{{i}_{0}}{a}_{{i}_{1}}}%& \\ \end{eqnarray*}

Comme la famille {(\overrightarrow{{a}_{{i}_{0}}{a}_{i}})}_{i∈I∖\{{i}_{0}\}} est libre, on doit donc avoir \mathop{∀}i ∈ I ∖\{{i}_{0},{i}_{1}\}, {λ}_{i} = 0 et également {\mathop{\mathop{∑ }} }_{i∈I∖\{{i}_{1}\}}{λ}_{i} = 0, ce qui nous donne évidemment que {λ}_{{i}_{0}} est également nul. D’où \mathop{∀}i ∈ I ∖\{{i}_{1}\}, {λ}_{i} = 0.

Génératrice Il est clair que (ii)(i). Supposons (i) vérifiée et soit {i}_{1} ∈ I. On peut alors écrire, si \overrightarrow{ξ} ∈\overrightarrow{ E},

\begin{eqnarray*} \overrightarrow{ξ}& =& {\mathop{∑ }}_{i∈I∖\{{i}_{0}\}}{λ}_{i}\overrightarrow{{a}_{{i}_{0}}{a}_{i}} ={ \mathop{∑ }}_{i∈I∖\{{i}_{0}\}}{λ}_{i}(\overrightarrow{{a}_{{i}_{0}}{a}_{{i}_{1}}} +\overrightarrow{ {a}_{{i}_{1}}{a}_{i}})%& \\ & =& {\mathop{∑ }}_{i∈I∖\{{i}_{0},{i}_{1}\}}{λ}_{i}\overrightarrow{{a}_{{i}_{1}}{a}_{i}} −\left ({\mathop{∑ }}_{i∈I∖\{{i}_{0}\}}{λ}_{i}\right )\overrightarrow{{a}_{{i}_{1}}{a}_{{i}_{0}}} %& \\ & =& {\mathop{∑ }}_{i∈I∖\{{i}_{1}\}}{μ}_{i}\overrightarrow{{a}_{{i}_{1}}{a}_{i}} %& \\ \end{eqnarray*}

avec {μ}_{i} = {λ}_{i} pour i ∈ I ∖\{{i}_{0},{i}_{1}\} et {μ}_{{i}_{0}} ={\mathop{ \mathop{∑ }} }_{i∈I∖\{{i}_{0}\}}{λ}_{i} ce qui montre que la famille {(\overrightarrow{{a}_{{i}_{1}}{a}_{i}})}_{i∈I∖\{{i}_{1}\}} est encore génératrice.

Le résultat pour les bases se déduit immédiatement de la combinaison des deux résultats précédents.

17.1.3 Sous-espace affine

Définition 17.1.4 Soit E un espace affine et F une partie de E. On dit que F est un sous espace affine de E si on a les propriétés équivalentes

  • (i) il existe a ∈ F tel que \{\overrightarrow{ax}\mathrel{∣}x ∈ F\} soit un sous-espace vectoriel de \overrightarrow{E}
  • (ii) F\mathrel{≠}∅ et pour tout a ∈ F, \{\overrightarrow{ax}\mathrel{∣}x ∈ F\} est un sous espace vectoriel de \overrightarrow{E}
  • (iii) il existe a ∈ F et un sous-espace vectoriel \overrightarrow{{F}_{a}} de \overrightarrow{E} tel que F = a +\overrightarrow{ {F}_{a}}
  • (iv) F\mathrel{≠}∅ et pour tout a ∈ F, il existe un sous-espace vectoriel \overrightarrow{{F}_{a}} de \overrightarrow{E} tel que F = a +\overrightarrow{ {F}_{a}}

Le sous-espace vectoriel \overrightarrow{{F}_{a}} est alors indépendant du choix de a ∈ F ; on l’appelle la direction de F et on le note \overrightarrow{F}

Démonstration Il est clair que (ii)(i) et que (iv)(iii). D’autre part

\begin{eqnarray*} F = a +\overrightarrow{ {F}_{a}}& \mathrel{⇔} & F = \{a +\overrightarrow{ ξ}\mathrel{∣}\overrightarrow{ξ} ∈\overrightarrow{ {F}_{a}}\}%& \\ & \mathrel{⇔} & F = a + \{\overrightarrow{ξ}\mathrel{∣}\overrightarrow{ξ} ∈\overrightarrow{ {F}_{a}}\}%& \\ & \mathrel{⇔} & \overrightarrow{{F}_{a}} = \{\overrightarrow{ax}\mathrel{∣}x ∈ F\} %& \\ \end{eqnarray*}

ce qui assure que (i)(iii) et que (ii)(iv). Il ne nous reste plus à montrer que (i)(iii) pour avoir les équivalences. Mais si b ∈ E, on a

\{\overrightarrow{bx}\mathrel{∣}x ∈ F\} = \{\overrightarrow{ba} +\overrightarrow{ ax}\mathrel{∣}x ∈ F\} = −\overrightarrow{ab} + \{\overrightarrow{ax}\mathrel{∣}x ∈ F\}

avec \overrightarrow{ab} ∈\{\overrightarrow{ax}\mathrel{∣}x ∈ F\} ; or un sous-espace vectoriel est stable par ses translations et donc −\overrightarrow{ ab} + \{\overrightarrow{ax}\mathrel{∣}x ∈ F\} = \{\overrightarrow{ax}\mathrel{∣}x ∈ F\} ce qui montre à la fois que \{\overrightarrow{bx}\mathrel{∣}x ∈ F\} = \{\overrightarrow{ax}\mathrel{∣}x ∈ F\} et que \{\overrightarrow{bx}\mathrel{∣}x ∈ F\} est un sous-espace vectoriel.

Comme on l’a vu, on a alors

\overrightarrow{{F}_{b}} = \{\overrightarrow{bx}\mathrel{∣}x ∈ F\} = \{\overrightarrow{ax}\mathrel{∣}x ∈ F\} =\overrightarrow{ {F}_{a}}

ce qui montre que \overrightarrow{{F}_{a}} est indépendant du choix de a ∈ F.

Remarque 17.1.3 On peut également traduire les propriétés (i) ou (ii) sous la forme : F est un sous-espace vectoriel de {E}_{a} (vectorialisé de E en l’origine a). Remarquons qu’un sous-espace affine est nécessairement non vide.

Définition 17.1.5 On appelle dimension du sous-espace affine F de E la dimension de \overrightarrow{F}.

Proposition 17.1.4 Soit {({F}_{i})}_{i∈I} une famille de sous-espaces affines de E. Alors {\mathop{\mathop{⋂ }} }_{i∈I}{F}_{i} est soit l’ensemble vide, soit un sous-espace affine de direction {\mathop{\mathop{⋂ }} }_{i∈I}\overrightarrow{{F}_{i}}.

Démonstration Supposons l’intersection non vide et soit a ∈{\mathop{\mathop{⋂ }} }_{i∈I}{F}_{i}. Alors

x ∈{\mathop{⋂ }}_{i∈I}{F}_{i} \mathrel{⇔} \mathop{∀}i ∈ I, \overrightarrow{ax} ∈\overrightarrow{ {F}_{i}} \mathrel{⇔} \overrightarrow{ax} ∈{\mathop{⋂ }}_{i∈I}\overrightarrow{{F}_{i}}

ce dernier étant un sous-espace vectoriel de \overrightarrow{E}. Ceci montre que {\mathop{\mathop{⋂ }} }_{i∈I}{F}_{i} est un sous-espace affine et que sa direction est {\mathop{\mathop{⋂ }} }_{i∈I}\overrightarrow{{F}_{i}}.

Remarque 17.1.4 Ceci permet ensuite de parler de sous-espace affine engendré par une partie non vide de E : c’est l’intersection de tous les sous-espaces affines contenant A. Cette intersection est un sous-espace affine contenant A et il est contenu dans tout espace affine contenant A. Comme dans les espaces vectoriels, ceci permet de définir le sous-espace affine \mathop{Aff}({a}_{i},i ∈ I) engendrée par une famille {({a}_{i})}_{i∈I} que l’on doit ici supposer non vide. Si {i}_{0} ∈ I, on vérifie immédiatement que

\begin{eqnarray*} \mathop{Aff}({a}_{i},i ∈ I)& =& {a}_{{i}_{0}} +\mathop{ \mathrm{Vect}}(\overrightarrow{{a}_{{i}_{0}}{a}_{i}}, i ∈ I ∖\{{i}_{0}\})%& \\ & =& {a}_{{i}_{0}} + \{{\mathop{∑ }}_{i∈I∖\{{i}_{0}\}}{λ}_{i}\overrightarrow{{a}_{{i}_{0}}{a}_{i}}\} %& \\ \end{eqnarray*}

On en déduit que \mathop{dim} \mathop{Aff}({a}_{i},i ∈ I) est inférieur ou égal au cardinal de I moins 1. Ceci permet également de parler de rang d’une famille de points.

17.1.4 Parallélisme, intersection

Définition 17.1.6 Soit deux sous-espaces affines F et G. On dit que

  • (i) F et G sont parallèles si \overrightarrow{F} =\overrightarrow{ G}
  • (ii) F est faiblement parallèle à G si \overrightarrow{F} ⊂\overrightarrow{ G}

Théorème 17.1.5

  • (i) Si a ∈ E, il existe un unique sous-espace affine passant par a et parallèle à un sous-espace affine donné F
  • (ii) Si F et G sont parallèles, on a soit F = G, soit F ∩ G = ∅
  • (iii) Si F est faiblement parallèle à G , on a soit F ⊂ G, soit F ∩ G = ∅

Démonstration (i) G = a +\overrightarrow{ F} est bien entendu le seul qui convient. (ii) et (iii) sont évidents.

Le théorème suivant va jouer un rôle important pour garantir que deux sous-espaces affines ont une intersection non vide

Théorème 17.1.6 Soit F et G deux sous-espaces affines de E, a ∈ F et b ∈ G. On a équivalence de

  • (i) F ∩ G\mathrel{≠}∅
  • (ii) \overrightarrow{ab} ∈\overrightarrow{ F} +\overrightarrow{ G}

Démonstration (i)(ii) Soit x ∈ F ∩ G. On a donc \overrightarrow{ax} ∈\overrightarrow{ F} et \overrightarrow{xb} ∈\overrightarrow{ G}, d’où \overrightarrow{ab} =\overrightarrow{ ax} +\overrightarrow{ bx} ∈\overrightarrow{ F} +\overrightarrow{ G}.

(ii)(i) Ecrivons \overrightarrow{ab} =\overrightarrow{ ξ} +\overrightarrow{ η} avec \overrightarrow{ξ} ∈\overrightarrow{ F} et \overrightarrow{η} ∈\overrightarrow{ G}. On a alors b −\overrightarrow{ η} = a +\overrightarrow{ ab} −\overrightarrow{ η} = a +\overrightarrow{ ξ}. Alors le point x = b −\overrightarrow{ η} = a +\overrightarrow{ ξ} appartient à la fois à F et à G.

Remarque 17.1.5 En dimension 3 et pour deux droites non parallèles {D}_{1} = a + K\vec{u} et {D}_{2} = b + K\vec{v}, on en déduit que

{D}_{1} ∩ {D}_{2}\mathrel{≠}∅\mathrel{⇔} \overrightarrow{ab} ∈ K\vec{u} + K\vec{v} \mathrel{⇔} (\overrightarrow{ab},\vec{u},\vec{v})\text{ est liée }

Corollaire 17.1.7 Soit F et G deux sous-espaces affines de E tels que \overrightarrow{F} et \overrightarrow{G} soient deux sous-espaces supplémentaires de \overrightarrow{E}. Alors F ∩ G est un point.

Démonstration Soit a ∈ F et b ∈ G ; on a \overrightarrow{ab} ∈\overrightarrow{ E} =\overrightarrow{ F} +\overrightarrow{ G} donc F ∩ G n’est pas vide ; mais alors \overrightarrow{F ∩ G} =\overrightarrow{ F} ∩\overrightarrow{ G} = \{\overrightarrow{0}\} et donc l’intersection est un point.

17.1.5 Applications affines

Définition 17.1.7 Soit E et F deux espaces affines et f : E → F. On dit que f est une application affine si elle vérifie

  • (i) il existe a ∈ E et une application linéaire \vec{f} de \overrightarrow{E} dans \overrightarrow{F} tels que \mathop{∀}x ∈ E, f(x) = f(a) +\vec{ f}(\overrightarrow{ax})
  • (ii) il existe une application linéaire \vec{f} de \overrightarrow{E} dans \overrightarrow{F} telle que \mathop{∀}x ∈ E, \mathop{∀}\overrightarrow{ξ} ∈\overrightarrow{ E}, f(x +\overrightarrow{ ξ}) = f(x) +\vec{ f}(\overrightarrow{ξ})

L’application linéaire \vec{f} est unique, on l’appelle l’application linéaire tangente à l’application affine f.

Démonstration Il est clair que (ii)(i). Montrons donc que (i)(ii). On a en effet

\begin{eqnarray*} f(x +\overrightarrow{ ξ})& =& f(a +\overrightarrow{ ax} +\overrightarrow{ ξ}) = f(a) +\vec{ f}(\overrightarrow{ax} +\overrightarrow{ ξ}) %& \\ & =& f(a) +\vec{ f}(\overrightarrow{ax}) +\vec{ f}(\overrightarrow{ξ}) = f(x) +\vec{ f}(\overrightarrow{ξ})%& \\ \end{eqnarray*}

La propriété (ii) montre que \vec{f}(\overrightarrow{ξ}) =\overrightarrow{ f(x)f(x +\overrightarrow{ ξ})} ce qui assure l’unicité de \vec{f}.

Proposition 17.1.8

  • (i) Si f : E → F et g : F → G sont deux applications affines, alors g ∘ f est affine et on a \overrightarrow{g ∘ f} =\vec{ g} ∘\vec{ f}
  • (ii) f est injective (resp. surjective, resp. bijective) si et seulement si \vec{f} est injective (resp. surjective, resp. bijective)

Démonstration Elémentaire.

Remarque 17.1.6 Soit f une application affine de E dans E ; supposons que f a un point fixe a. On a alors \mathop{∀}x ∈ E, \overrightarrow{af(x)} =\overrightarrow{ f(a)f(x)} =\vec{ f}(\overrightarrow{ax}) si bien qu’en identifiant E et \overrightarrow{E} par le choix de l’origine a (c’est-à-dire en identifiant x et \overrightarrow{ax}), f s’identifie à \vec{f}. Une application affine ayant un point fixe s’identifie, par le choix d’un tel point fixe comme origine, à son application linéaire tangente. Il est donc particulièrement important de savoir qu’une application affine a un point fixe.

Théorème 17.1.9 Soit E un espace affine de dimension finie, f : E → E une application affine. Si 1 n’est pas valeur propre de \vec{f}, alors f a un unique point fixe.

Démonstration Soit a ∈ E. On a

\begin{eqnarray*} \overrightarrow{xf(x)}& =& \overrightarrow{xa} +\overrightarrow{ af(a)} +\overrightarrow{ f(a)f(x)} = −\overrightarrow{ax} +\overrightarrow{ af(a)} +\vec{ f}(\overrightarrow{ax})%& \\ & =& (\vec{f} −\mathrm{Id})(\overrightarrow{ax}) +\overrightarrow{ af(a)} %& \\ \end{eqnarray*}

On en déduit que

\begin{eqnarray*} x = f(x)& \mathrel{⇔} & (\vec{f} −\mathrm{Id})(\overrightarrow{ax}) +\overrightarrow{ af(a)} =\overrightarrow{ 0}%& \\ & \mathrel{⇔} & (\vec{f} −\mathrm{Id})(\overrightarrow{ax}) =\overrightarrow{ f(a)a} %& \\ \end{eqnarray*}

Mais comme 1 n’est pas valeur propre de \vec{f}, \vec{f} −\mathrm{Id} est bijective et donc l’équation précédente définit un unique vecteur \overrightarrow{ax} et donc un unique point x.

Ceci nous amène à étudier certaines applications affines particulières.

Définition 17.1.8 Soit \overrightarrow{ξ} ∈\overrightarrow{ E}. On appelle translation de vecteur \overrightarrow{ξ} l’application {t}_{\overrightarrow{ξ}} : x\mathrel{↦}x +\overrightarrow{ ξ}.

Définition 17.1.9 Soit a ∈ E et λ ∈ {K}^{∗}. On appelle homothétie de centre a de rapport λ l’application {h}_{a,λ} : x\mathrel{↦}a + λ \overrightarrow{ax}.

Proposition 17.1.10 Soit f une application affine de E dans E. Alors

  • (i) f est une translation si et seulement si \vec{f} = \mathrm{Id}
  • (ii) f est une homothétie de rapport λ\mathrel{≠}1 si et seulement si \vec{f} = λ\mathrm{Id}.

Démonstration Si f est une translation de vecteur \overrightarrow{ξ}, on a f(x +\overrightarrow{ η}) = x +\overrightarrow{ η} +\overrightarrow{ ξ} = f(x) +\overrightarrow{ η} ce qui montre que \vec{f} = \mathrm{Id}. Inversement, si \vec{f} = \mathrm{Id}, soit a ∈ E et \overrightarrow{ξ} =\overrightarrow{ af(a)} ; alors f(x) = f(a) +\vec{ f}(\overrightarrow{ax}) = f(a) +\overrightarrow{ ax} = a +\overrightarrow{ ξ} +\overrightarrow{ ax} = x +\overrightarrow{ ξ} ce qui montre que f est la translation {t}_{\overrightarrow{ξ}}.

Si f = {h}_{a,λ}, la définition même montre que \vec{f} = λ\mathrm{Id}. Inversement, si \vec{f} = λ\mathrm{Id} avec λ\mathrel{≠}1, \vec{f} −\mathrm{Id} est bijective et le même raisonnement que ci dessus montre que f a un unique point fixe a. Mais alors f(x) = f(a) +\vec{ f}(\overrightarrow{ax}) = a + λ \overrightarrow{ax}, donc f = {h}_{a,λ}.

Remarque 17.1.7 Considérons le groupe GA(E) des applications affines bijectives de E dans E ; on dispose de l’application f\mathrel{↦}\vec{f} de GA(E) dans GL(E) qui est visiblement un morphisme de groupes. L’ensemble constitué des homothéties et des translations est l’image réciproque par cette application du sous-groupe {K}^{∗}\mathrm{Id} de GL(E). Il s’agit donc d’un sous-groupe de GA(E). On peut préciser ce résultat en utilisant \overrightarrow{g ∘ f} =\vec{ g} ∘\vec{ f} :la composée de deux translations est une translation, la composée d’une homothétie et d’une translation (dans n’importe quel ordre) est une homothétie, la composée de deux homothéties est en général une homothétie, à moins que le produit des deux rapports soit égal à 1 auquel cas la composée est une translation.

17.1.6 Utilisation de repères affines

Théorème 17.1.11 Soit (a,{(\vec{{e}}_{i})}_{i∈I}) un repère affine de l’espace affine E. Soit b un point de l’espace affine F et {(\vec{{u}}_{i})}_{i∈I} une famille de vecteurs de \overrightarrow{F}. Alors il existe une unique application affine f : E → F vérifiant f(a) = b et \mathop{∀}i ∈ I, \vec{f}(\vec{{e}}_{i}) =\vec{ {u}}_{i}.

Démonstration On a en effet nécessairement f(x) = f(a +\mathop{ \mathop{∑ }} {x}_{i}\vec{{e}}_{i}) = f(a) +\mathop{ \mathop{∑ }} {x}_{i}\vec{f}(\vec{{e}}_{i}) = b +{\mathop{ \mathop{∑ }} }_{i∈I}{x}_{i}\vec{{u}}_{i}. Inversement, il est clair que f ainsi définie convient.

Corollaire 17.1.12 Soit {({a}_{i})}_{i∈I} une base affine de E et {({b}_{i})}_{i∈I} une famille de points de F. Il existe une unique application affine f : E → F vérifiant \mathop{∀}i ∈ I,f({a}_{i}) = {b}_{i}.

Démonstration En effet, si {i}_{0} ∈ I, ({a}_{{i}_{0}},{(\overrightarrow{{a}_{{i}_{0}}{a}_{i}})}_{i∈I∖\{{i}_{0}\}}) est un repère de E et

\begin{eqnarray*} \mathop{∀}i ∈ I,f({a}_{i}) = {b}_{i}&& %& \\ & \mathrel{⇔} & f({a}_{{i}_{0}}) = {b}_{{i}_{0}}\text{ et }\mathop{∀}i ∈ I ∖\{{i}_{0}\}, \overrightarrow{f({a}_{{i}_{0}})f({a}_{i})} =\overrightarrow{ {b}_{{i}_{0}}{b}_{i}}%& \\ & \mathrel{⇔} & f({a}_{{i}_{0}}) = {b}_{{i}_{0}}\text{ et }\mathop{∀}i ∈ I ∖\{{i}_{0}\}, \vec{f}(\overrightarrow{{a}_{{i}_{0}}{a}_{i}}) =\overrightarrow{ {b}_{{i}_{0}}{b}_{i}} %& \\ \end{eqnarray*}

ce qui ramène au problème précédent.

Supposons E et F de dimensions finies. Soit (a,{(\vec{{e}}_{j})}_{1≤i≤n}) un repère affine de l’espace affine E et (b,{(\vec{{f}}_{i})}_{1≤i≤p}) un repère affine de F, soit u : E → F une application affine. Considérons A = {({a}_{i,j})}_{1≤i≤p,1≤j≤n} =\mathop{ \mathrm{Mat}} (\vec{u},{(\vec{{e}}_{j})}_{1≤j≤n},{(\vec{{f}}_{i})}_{1≤i≤p}) la matrice de l’ application linéaire \vec{u} dans les bases respectives de \overrightarrow{E} et \overrightarrow{F}. On a donc \vec{u}(\vec{{e}}_{j}) ={\mathop{ \mathop{∑ }} }_{i=1}^{p}{a}_{i,j}\vec{{f}}_{i}. Posons u(a) = b +{\mathop{ \mathop{∑ }} }_{i=1}^{p}{α}_{i}\vec{{f}}_{i}. Soit x = a +{\mathop{ \mathop{∑ }} }_{j=1}^{n}{x}_{j}\vec{{e}}_{j} ∈ E. On a alors

\begin{eqnarray*} u(x)& =& u(a) +{ \mathop{∑ }}_{j=1}^{n}{x}_{ j}\vec{u}(\vec{{e}}_{j}) = b +{ \mathop{∑ }}_{i=1}^{p}{α}_{ i}\vec{{f}}_{i} +{ \mathop{∑ }}_{j=1}^{n}{x}_{ j}{ \mathop{∑ }}_{i=1}^{p}{a}_{ i,j}\vec{{f}}_{i}%& \\ & =& b +{ \mathop{∑ }}_{i=1}^{p}\left ({α}_{ i} +{ \mathop{∑ }}_{j=1}^{n}{a}_{ i,j}{x}_{j}\right )\vec{{f}}_{i} %& \\ \end{eqnarray*}

Donc les coordonnées {y}_{1},\mathop{\mathop{…}},{y}_{p} de u(x) dans le repère (b,{(\vec{{f}}_{i})}_{1≤i≤p}) de F sont données par

\mathop{∀}i ∈ [1,p], {y}_{i} ={ \mathop{∑ }}_{j=1}^{n}{a}_{ i,j}{x}_{j} + {α}_{i}

Introduisons les vecteurs colonnes X = \left (\matrix{\,{x}_{1} \cr \mathop{\mathop{⋮}} \cr {x}_{n} \cr 1 }\right ), Y = \left (\matrix{\,{y}_{1} \cr \mathop{\mathop{⋮}} \cr {y}_{p} \cr 1 }\right ) et A' = \left (\matrix{\,A &\matrix{\,{α}_{1} \cr \mathop{\mathop{⋮}} \cr {α}_{p}} \cr \matrix{\,0&\mathop{\mathop{…}}&0}&1 }\right ). On a alors

y = u(x) \mathrel{⇔} Y = A'X

Définition 17.1.10 On dira que X = \left (\matrix{\,{x}_{1} \cr \mathop{\mathop{⋮}} \cr {x}_{n} \cr 1 }\right ) est le vecteur colonne des coordonnées du point x = a +{\mathop{ \mathop{∑ }} }_{j=1}^{n}{x}_{j}\vec{{e}}_{j} dans le repère affine (a,{(\vec{{e}}_{j})}_{1≤j≤n}) de E. La matrice A' = \left (\matrix{\,A &\matrix{\,{α}_{1} \cr \mathop{\mathop{⋮}} \cr {α}_{p}} \cr \matrix{\,0&\mathop{\mathop{…}}&0}&1 }\right ) (où A = {({a}_{i,j})}_{1≤i≤p,1≤j≤n} =\mathop{ \mathrm{Mat}} (\vec{u},{(\vec{{e}}_{j})}_{1≤j≤n},{(\vec{{f}}_{i})}_{1≤i≤p}) est la matrice de l’ application linéaire \vec{u} dans les bases respectives de \overrightarrow{E} et \overrightarrow{F} et u(a) = b +{\mathop{ \mathop{∑ }} }_{i=1}^{p}{α}_{i}\vec{{f}}_{i}) sera appelée la matrice de l’application affine u dans les repères (a,{(\vec{{e}}_{j})}_{1≤j≤n}) et (b,{(\vec{{f}}_{i})}_{1≤i≤p}).

17.1.7 Formes affines et sous-espaces affines

Définition 17.1.11 On appelle forme affine sur E toute application affine f de E dans K.

Remarque 17.1.8 Si E est de dimension finie n, soit (a,{(\vec{{e}}_{j})}_{1≤j≤n}) un repère affine de E. L’étude précédente sur la matrice d’une application affine montre que f : E → K est une forme affine si et seulement si elle est de la forme x = a +{\mathop{ \mathop{∑ }} }_{j=1}^{n}{x}_{j}\vec{{e}}_{j}\mathrel{↦}{\mathop{\mathop{∑ }} }_{j=1}^{n}{a}_{j}{x}_{j} + α.

Théorème 17.1.13 Soit E un espace affine de dimension n et F une partie de E. Alors on a équivalence de

  • (i) F est un sous-espace affine de E de dimension p
  • (ii) il existe des formes affines {f}_{1},\mathop{\mathop{…}},{f}_{n−p} telles que la famille (\vec{{f}}_{1},\mathop{\mathop{…}},\vec{{f}}_{n−p}) soit libre et F = \{x ∈ E\mathrel{∣}{f}_{1}(x) = \mathop{\mathop{…}} = {f}_{n−p}(x) = 0\}.

Démonstration Soit tout d’abord F un sous-espace affine de dimension p de direction \overrightarrow{F}. Soit (\vec{{f}}_{1},\mathop{\mathop{…}},\vec{{f}}_{n−p}) une base de l’orthogonal de \overrightarrow{F} dans le dual \overrightarrow{{E}}^{∗} de l’espace vectoriel \overrightarrow{E}. On a alors

\overrightarrow{ξ} ∈\overrightarrow{ F} \mathrel{⇔} \mathop{∀}i ∈ [1,n − p], \vec{{f}}_{i}(\overrightarrow{ξ}) = 0

Soit a ∈ F et soit {f}_{i} la forme affine qui vaut 0 au point a et d’application linéaire tangente \vec{{f}}_{i}, c’est-à-dire définie par {f}_{i}(x) =\vec{ {f}}_{i}(\overrightarrow{ax}). Alors

\begin{eqnarray*} x ∈ F& \mathrel{⇔} & \overrightarrow{ax} ∈\overrightarrow{ F} \mathrel{⇔} \mathop{∀}i ∈ [1,n − p], \vec{{f}}_{i}(\overrightarrow{ax}) =\overrightarrow{ 0}%& \\ & \mathrel{⇔} & \mathop{∀}i ∈ [1,n − p], {f}_{i}(x) = 0 %& \\ \end{eqnarray*}

ce qui montre que (i)(ii).

Inversement, soit a ∈ E. Nous allons tout d’abord démontrer que si (ii) est vérifiée alors F n’est pas vide. Pour cela, complétons (\vec{{f}}_{1},\mathop{\mathop{…}},\vec{{f}}_{n−p}) en une base (\vec{{f}}_{1},\mathop{\mathop{…}},\vec{{f}}_{n}) de \overrightarrow{{E}}^{∗}. Soit (\vec{{e}}_{1},\mathop{\mathop{…}},\vec{{e}}_{n}) une base dont c’est la duale, si bien que \vec{{f}}_{i}(\vec{{e}}_{j}) = {δ}_{i}^{j}. Posons b = a −{\mathop{\mathop{∑ }} }_{i=1}^{n−p}{f}_{i}(a)\vec{{e}}_{i}. On a alors {f}_{j}(b) = {f}_{j}(a) −{\mathop{\mathop{∑ }} }_{i=1}^{n−p}{f}_{i}(a)\vec{{f}}_{j}(\vec{{e}}_{i}) = {f}_{j}(a) −{\mathop{\mathop{∑ }} }_{i=1}^{p}{f}_{i}(a){δ}_{i}^{j} = {f}_{j}(a) − {f}_{j}(a) = 0 si bien que b appartient à F. On a alors

\begin{eqnarray*} x ∈ F& \mathrel{⇔} & \mathop{∀}i ∈ [1,n − p], {f}_{i}(x) = 0 %& \\ & \mathrel{⇔} & \mathop{∀}i ∈ [1,n − p], {f}_{i}(b) +\vec{ {f}}_{i}(\overrightarrow{bx}) = 0 %& \\ & \mathrel{⇔} & \mathop{∀}i ∈ [1,n − p], \vec{{f}}_{i}(\overrightarrow{bx}) = 0 %& \\ & \mathrel{⇔} & \mathop{∀}i ∈ [1,n − p], \overrightarrow{bx} ∈ {(\vec{{f}}_{1},\mathop{\mathop{…}},\vec{{f}}_{n−p})}^{⊥}%& \\ \end{eqnarray*}

On a donc F = b + {(\vec{{f}}_{1},\mathop{\mathop{…}},\vec{{f}}_{n−p})}^{⊥} qui est un sous-espace affine de dimension p.

De fa\c{c}on plus pratique, dans un repère de E, on en déduit que F est un sous-espace affine de dimension p si et seulement si F est l’ensemble des solutions d’un système de n − p équations linéaires de rang n − p

x ∈ F\quad \mathrel{⇔} \quad \left \{\array{ {α}_{1,1}{x}_{1} + \mathop{\mathop{…}} + {α}_{1,n}{x}_{n} & = {β}_{1} \cr &\mathop{\mathop{…}}\cr {α}_{ n−p,1}{x}_{1} + \mathop{\mathop{…}} + {α}_{n−p,n}{x}_{n}& = {β}_{n−p} } \right .

en posant {f}_{i}(x) = {α}_{i,1}{x}_{1} + \mathop{\mathop{…}} + {α}_{i,n}{x}_{n} − {β}_{i} (et donc \vec{{f}}_{i}(\overrightarrow{ξ}) = {α}_{i,1}{x}_{1} + \mathop{\mathop{…}} + {α}_{i,n}{x}_{n}).

Exemple 17.1.1 Un hyperplan affine (sous-espace affine de dimension n − 1) est toujours défini par F = \{x ∈ E\mathrel{∣}f(x) = 0\}f est une forme affine telle que \vec{f}\mathrel{≠}0 (soit f non constante). Autrement dit, avec des coordonnées dans un repère, un hyperplan est défini par une équation {u}_{1}{x}_{1} + \mathop{\mathop{…}} + {u}_{n}{x}_{n} + h = 0 avec ({u}_{1},\mathop{\mathop{…}},{u}_{n})\mathrel{≠}(0,\mathop{\mathop{…}},0).

De la même fa\c{c}on, dans un espace de dimension 3, une droite est définie par deux équations

\left \{\array{ ax + by + cz + h& = 0\cr a'x + b'y + c'z + h' & = 0 } \right .

où la matrice \left (\matrix{\,a&b&c\cr a' &b' &c'}\right ) est de rang 2.

Théorème 17.1.14 (faisceaux d’hyperplans). Soit E un espace affine de dimension finie, {H}_{1} et {H}_{2} deux hyperplans non parallèles d’équations {f}_{1}(x) = 0 et {f}_{2}(x) = 0. Alors les hyperplans contenant {H}_{1} ∩ {H}_{2} sont exactement les hyperplans d’équations {λ}_{1}{f}_{1}(x) + {λ}_{2}{f}_{2}(x) = 0 avec ({λ}_{1},{λ}_{2})\mathrel{≠}(0,0).

Démonstration Les hyperplans vectoriels \overrightarrow{{H}_{1}} et \overrightarrow{{H}_{2}} sont définis par les équations \vec{{f}}_{1}(\overrightarrow{ξ}) = 0 et \vec{{f}}_{2}(\overrightarrow{ξ}) = 0. Comme ils sont distincts, ces formes linéaires \vec{{f}}_{1} et \vec{{f}}_{2} ne sont pas proportionnelles, et donc (\vec{{f}}_{1},\vec{{f}}_{2}) est libre. On en déduit que F = {H}_{1} ∩ {H}_{2} = \{x ∈ E\mathrel{∣}{f}_{1}(x) = {f}_{2}(x) = 0\} est un sous-espace affine de dimension n − 2 de E, en particulier F\mathrel{≠}∅. Soit a ∈ F. Alors

x ∈ F \mathrel{⇔} \vec{{f}}_{1}(\overrightarrow{ax}) =\vec{ {f}}_{2}(\overrightarrow{ax}) = 0 \mathrel{⇔} \overrightarrow{ax} ∈\mathop{\mathrm{Vect}}{(\vec{{f}}_{1},\vec{{f}}_{2})}^{⊥}

si bien que \overrightarrow{F} =\mathop{ \mathrm{Vect}}{(\vec{{f}}_{1},\vec{{f}}_{2})}^{⊥} Soit H un hyperplan et f une équation de H. Alors

\begin{eqnarray*} F ⊂ H& \mathrel{⇔} & f(a) = 0\text{ et }\mathop{∀}\overrightarrow{ξ} ∈ F, \vec{f}(\overrightarrow{ξ}) = 0 %& \\ & \mathrel{⇔} & f(a) = 0\text{ et }\vec{f} ∈{\left (\mathop{\mathrm{Vect}}{(\vec{{f}}_{1},\vec{{f}}_{2})}^{⊥}\right )}^{⊥}%& \\ & \mathrel{⇔} & f(a) = 0\text{ et }\vec{f} ∈\mathop{\mathrm{Vect}}(\vec{{f}}_{1},\vec{{f}}_{2}) %& \\ \end{eqnarray*}

Mais comme {f}_{1}(a) = {f}_{2}(a) = 0, la condition f = {λ}_{1}{f}_{1} + {λ}_{2}{f}_{2} est manifestement équivalente à f(a) = 0 et \vec{f} = {λ}_{1}\vec{{f}}_{1} + {λ}_{2}\vec{{f}}_{2} ce qui nous donne le résultat souhaité.

Exemple 17.1.2 Dans un espace de dimension 3, soit D la droite d’équations

\left \{\array{ ax + by + cz + h& = 0\cr a'x + b'y + c'z + h' & = 0 } \right .

où la matrice \left (\matrix{\,a&b&c\cr a' &b' &c'}\right ) est de rang 2. Alors les plans contenant D sont exactement les plans d’équations {λ}_{1}(ax + by + cz + h) + {λ}_{2}(a'x + b'y + c'z + h') = 0 avec ({λ}_{1},{λ}_{2})\mathrel{≠}(0,0).

De même en dimension 2, si un point A est défini comme intersection de deux droites non parallèles d’équations ax + by + c = 0 et a'x + b'y + c' = 0, les droites contenant A sont exactement les droites admettant comme équations {λ}_{1}(ax + by + c) + {λ}_{2}(a'x + b'y + c') = 0 avec ({λ}_{1},{λ}_{2})\mathrel{≠}(0,0).