15.1 Dérivées partielles

15.1.1 Notion de dérivée partielle

Définition 15.1.1 Soit E et F deux espaces vectoriels normés. Soit U un ouvert de E, f : U → F, a ∈ U. Soit v ∈ E ∖\{0\}. On dit que f admet au point a une dérivée partielle suivant le vecteur v si l’application t\mathrel{↦}f(a + tv) (définie sur un voisinage de 0) est dérivable au point 0.

Remarque 15.1.1 L’existence de la dérivée partielle en a suivant le vecteur v est donc équivalente à l’existence de {\mathop{lim}}_{t→0}{ f(a+tv)−f(a) \over t} = {∂}_{v}f(a). Remarquons que si v' = λv, λ\mathrel{≠}0, alors { f(a+tv')−f(a) \over t} = λ{ f(a+uv)−f(a) \over u} avec u = λt ce qui montre que f admet en a une dérivée partielle selon v si et seulement si f admet une dérivée partielle suivant λv et qu’alors {∂}_{λv}f(a) = λ{∂}_{v}f(a).

Exemple 15.1.1 Soit f : {ℝ}^{2} → ℝ définie par f(x,y) ={ {x}^{2} \over y} si y\mathrel{≠}0 et f(x,0) = 0. Soit v = (a,b)\mathrel{≠}(0,0). On a { f((0,0)+tv)−f(0,0) \over t} = \left \{ \cases{ 0 &si b = 0 \cr { {a}^{2} \over b} &si b\mathrel{≠}0 } \right .. On en déduit que f admet une dérivée partielle suivant tout vecteur v et que {∂}_{v}f(0,0) = \left \{ \cases{ 0 &si b = 0 \cr { {a}^{2} \over b} &si b\mathrel{≠}0 } \right .. Remarquons que l’application v\mathrel{↦}{∂}_{v}f(0,0) n’est pas linéaire. Remarquons également que f n’est pas continue en (0,0) (puisque {\mathop{lim}}_{t→0}f(t,{t}^{2}) = 1\mathrel{≠}f(0,0)). L’existence de dérivée partielle suivant tout vecteur n’implique donc pas la continuité.

Proposition 15.1.1 On a les propriétés évidentes de la dérivation de t\mathrel{↦}f(a + tv) à savoir (i) si f et g admettent en a une dérivée partielle suivant le vecteur v, il en est de même de αf + βg et {∂}_{v}(αf + βg)(a) = α{∂}_{v}f(a) + β{∂}_{v}g(a). (ii) si f et g (à valeurs scalaires) admettent en a une dérivée partielle suivant le vecteur v, il en est de même de fg et {∂}_{v}(fg)(a) = g(a){∂}_{v}f(a) + f(a){∂}_{v}g(a).

Remarque 15.1.2 Par contre, on n’a pas de théorème général de composition des dérivées partielles. En reprenant l’exemple ci dessus, f : {ℝ}^{2} → ℝ définie par f(x,y) ={ {x}^{2} \over y} si y\mathrel{≠}0 et f(x,0) = 0, l’application f admet en (0,0) une dérivée partielle suivant tout vecteur, l’application t\mathrel{↦}(t,{t}^{2}) est dérivable en 0 et pourtant t\mathrel{↦}f(t,{t}^{2}) n’est pas dérivable en 0 (elle n’y est même pas continue).

Définition 15.1.2 Soit E un espace vectoriel normé de dimension finie, ℰ = ({e}_{1},\mathop{\mathop{…}},{e}_{n}) une base de E, F un espace vectoriel normé. Soit U un ouvert de E, f : U → F, a ∈ U. On dit que f admet au point a une dérivée partielle d’indice i (suivant la base ) si elle admet une dérivée partielle suivant le vecteur {e}_{i}. On note alors { ∂f \over ∂{x}_{i}} (a) = {∂}_{{e}_{i}}f(a).

Exemple 15.1.2 Si E = {ℝ}^{n} et si est la base canonique de {ℝ}^{n}, l’existence d’une dérivée partielle d’indice i au point a = ({a}_{1},\mathop{\mathop{…}},{a}_{n}) équivaut à la dérivabilité au point {a}_{i} de l’application partielle {x}_{i}\mathrel{↦}f({a}_{1},\mathop{\mathop{…}},{a}_{i−1},{x}_{i},{a}_{i+1},\mathop{\mathop{…}},{a}_{n}). On retrouve bien la notion habituelle de dérivée partielle : dérivée suivant la variable {x}_{i}, toutes les autres étant considérées comme constantes.

15.1.2 Composition des dérivées partielles

On a vu précédemment qu’on n’avait pas de théorème de composition des dérivées partielles en toute généralité. On va introduire une notion d’application de classe {C}^{1}.

Définition 15.1.3 Soit U un ouvert de {ℝ}^{n}, f : U → F. On dit que f est de classe {C}^{1} au point a si, sur un certain voisinage V de a, f admet des dérivées partielles de tout indice i ∈ [1,n] et si ces dérivées partielles x\mathrel{↦}{ ∂f \over ∂{x}_{i}} (x) sont continues au point a.

Lemme 15.1.2 Soit F un espace vectoriel de dimension finie, V un ouvert de {ℝ}^{n}, f : V → F. Soit I un intervalle de , t ∈ I et φ = ({φ}_{1},\mathop{\mathop{…}},{φ}_{n}) : I → V . On suppose que φ est dérivable au point t et que f est de classe {C}^{1} au point φ(t). Alors f ∘ φ est dérivable au point t et (f ∘ φ)'(t) ={\mathop{ \mathop{∑ }} }_{i=1}^{n}{ ∂f \over ∂{x}_{i}} (φ(t)){φ}_{i}'(t).

Démonstration Sans nuire à la généralité, en prenant une base (sur ) de F et en travaillant composante par composante, on peut supposer que f est à valeurs réelles. On écrit

\begin{eqnarray*} f(φ(t + h)) − f(φ(t))&& %& \\ & =& f({φ}_{1}(t + h),\mathop{\mathop{…}},{φ}_{n}(t + h)) − f({φ}_{1}(t),\mathop{\mathop{…}},{φ}_{n}(t)) %& \\ & =& {\mathop{∑ }}_{i=1}^{n}(f(\mathop{…},{φ}_{ i−1}(t),{φ}_{i}(t + h),{φ}_{i+1}(t + h),\mathop{…})%& \\ & & \qquad − f(\mathop{\mathop{…}},{φ}_{i−1}(t),{φ}_{i}(t),{φ}_{i+1}(t + h),\mathop{\mathop{…}})) %& \\ \end{eqnarray*}

Mais φ est continue au point t et donc pour h assez petit, tous les ({φ}_{1}(t),\mathop{\mathop{…}},{φ}_{i−1}(t),{φ}_{i}(t + h),{φ}_{i+1}(t + h),\mathop{\mathop{…}},{φ}_{n}(t + h)) se trouvent à l’intérieur d’une boule de centre a sur laquelle les dérivées partielles de f de tout indice existent. En particulier, l’application {x}_{i}\mathrel{↦}f({φ}_{1}(t),\mathop{\mathop{…}},{φ}_{i−1}(t),{x}_{i},{φ}_{i+1}(t + h),\mathop{\mathop{…}},{φ}_{n}(t + h)) est dérivable sur le segment [{φ}_{i}(t),{φ}_{i}(t + h)] et on peut appliquer le théorème des accroissements finis. On obtient l’existence d’un {ξ}_{i} ∈ [{φ}_{i}(t),{φ}_{i}(t + h)] tel que

\begin{eqnarray*} f({φ}_{1}(t),\mathop{\mathop{…}},{φ}_{i−1}(t),{φ}_{i}(t + h),{φ}_{i+1}(t + h),\mathop{\mathop{…}},{φ}_{n}(t + h))&& %& \\ & & −f({φ}_{1}(t),\mathop{\mathop{…}},{φ}_{i−1}(t),{φ}_{i}(t),{φ}_{i+1}(t + h),\mathop{\mathop{…}},{φ}_{n}(t + h))%& \\ & =& ({φ}_{i}(t + h) − {φ}_{i}(t)) %& \\ & & \quad { ∂f \over ∂{x}_{i}} ({φ}_{1}(t),\mathop{\mathop{…}},{φ}_{i−1}(t),{ξ}_{i},{φ}_{i+1}(t + h),\mathop{\mathop{…}},{φ}_{n}(t + h)) %& \\ \end{eqnarray*}

Comme φ est continue au point t et {ξ}_{i} ∈ [{φ}_{i}(t),{φ}_{i}(t + h)], on a

\begin{eqnarray*} {\mathop{lim}}_{h→0}({φ}_{1}(t),\mathop{\mathop{…}},{φ}_{i−1}(t),{ξ}_{i},{φ}_{i+1}(t + h),\mathop{\mathop{…}},{φ}_{n}(t + h))&&%& \\ & =& ({φ}_{1}(t),\mathop{\mathop{…}},{φ}_{i−1}(t),{φ}_{i}(t),{φ}_{i+1}(t),\mathop{\mathop{…}},{φ}_{n}(t))%& \\ & =& φ(t) %& \\ \end{eqnarray*}

et comme { ∂f \over ∂{x}_{i}} est continue au point φ(t), on a

\begin{eqnarray*}{ ∂f \over ∂{x}_{i}} (φ(t))&& %& \\ & =& {\mathop{lim}}_{h→0}{ ∂f \over ∂{x}_{i}} ({φ}_{1}(t),\mathop{\mathop{…}},{φ}_{i−1}(t),{ξ}_{i},{φ}_{i+1}(t + h),\mathop{\mathop{…}},{φ}_{n}(t + h))%& \\ \end{eqnarray*}

Il suffit alors de diviser par h et de faire tendre h vers 0 pour voir que

{\mathop{lim}}_{h→0}{ f(φ(t + h)) − f(φ(t)) \over h} ={ \mathop{∑ }}_{i=1}^{n}{ ∂f \over ∂{x}_{i}} (φ(t)){φ}_{i}'(t)

ce qui achève la démonstration.

Appliquant ce lemme à φ : t\mathrel{↦}g(a + tv) au point t = 0, on obtient le théorème suivant

Théorème 15.1.3 Soit F un espace vectoriel de dimension finie, U un ouvert de {ℝ}^{n}, f : U → F. Soit E un espace vectoriel normé, V un ouvert de E et g = ({g}_{1},\mathop{\mathop{…}},{g}_{n}) : V → U ⊂ {ℝ}^{n}. Soit a ∈ V et v ∈ E ∖\{0\}. Si g admet en a une dérivée partielle suivant le vecteur v et si f est de classe {C}^{1} au point a, alors f ∘ g admet en a une dérivée partielle suivant le vecteur v et on a

{∂}_{v}(f ∘ g)(a) ={ \mathop{∑ }}_{i=1}^{n}{ ∂f \over ∂{x}_{i}} (g(a)){∂}_{v}{g}_{i}(a)

Dans le cas particulier où E = {ℝ}^{p} et où on prend pour v le j-ième vecteur de la base canonique, on obtient la version suivante (on a changé le nom des variables pour les appeler {y}_{1},\mathop{\mathop{…}},{y}_{n} dans {ℝ}^{n}).

Corollaire 15.1.4 Soit F un espace vectoriel de dimension finie, U un ouvert de {ℝ}^{n}, f : U → F. Soit V un ouvert de {ℝ}^{p} et g = ({g}_{1},\mathop{\mathop{…}},{g}_{n}) : V → U ⊂ {ℝ}^{n}. Soit a ∈ V et j ∈ [1,p]. Si g admet en a une dérivée partielle d’indice j et si f est de classe {C}^{1} au point a, alors f ∘ g admet en a une dérivée partielle d’indice j et on a

{ ∂(f ∘ g) \over ∂{x}_{j}} (a) ={ \mathop{∑ }}_{i=1}^{n}{ ∂f \over ∂{y}_{i}} (g(a)){ ∂{g}_{i} \over ∂{x}_{j}} (a)

Remarque 15.1.3 On en déduit immédiatement que la composée de deux applications de classe {C}^{1} est encore de classe {C}^{1}.

Citons aussi le corollaire suivant du lemme, où l’on prend φ(t) = a + tv

Corollaire 15.1.5 Soit F un espace vectoriel de dimension finie, V un ouvert de {ℝ}^{n}, f : V → F. Soit a ∈ V . Si f est de classe {C}^{1} au point a, alors elle admet en a des dérivées partielles suivant tout vecteur et on a

{∂}_{v}f(a) ={ \mathop{∑ }}_{i=1}^{n}{v}_{ i}{ ∂f \over ∂{x}_{i}} (a)\qquad \text{ si }v = ({v}_{1},\mathop{…},{v}_{n})

Remarque 15.1.4 On voit que dans ce cas v\mathrel{↦}{∂}_{v}f(a) est linéaire. Cette remarque nous conduira à la définition de la différentielle dans la section suivante.

15.1.3 Théorème des accroissements finis et applications

Théorème 15.1.6 Soit U un ouvert de {ℝ}^{n}, f : U → ℝ de classe {C}^{1}. Soit a ∈ U et h ∈ {ℝ}^{n} tel que [a,a + h] ⊂ U. Alors, il existe θ ∈]0,1[ tel que

f(a + h) − f(a) ={ \mathop{∑ }}_{i=1}^{n}{h}_{ i}{ ∂f \over ∂{x}_{i}} (a + θh)

Démonstration Soit ψ : [0,1] → ℝ définie par ψ(t) = f(a + th). Le lemme du paragraphe précédent montre que ψ est dérivable sur [0,1] et que ψ'(t) ={\mathop{ \mathop{∑ }} }_{i=1}^{n}{h}_{i}{ ∂f \over ∂{x}_{i}} (a + th). Le théorème des accroissements finis assure qu’il existe θ ∈]0,1[ tel que ψ(1) − ψ(0) = (1 − 0)ψ'(θ), ce qui n’est autre que la formule ci dessus.

Corollaire 15.1.7 Soit U un ouvert de {ℝ}^{n}, F un espace vectoriel de dimension finie, f : U → F de classe {C}^{1}. Alors f est continue.

Démonstration En prenant une base (sur ) de F et en travaillant composante par composante, on peut supposer que f est à valeurs réelles. Puisque les dérivées partielles sont continues au point a, il existe η > 0 tel que B(a,η) ⊂ U et \mathop{∀}x ∈ B(0,η), |{ ∂f \over ∂{x}_{i}} (x) −{ ∂f \over ∂{x}_{i}} (a)|≤ 1, d’où |{ ∂f \over ∂{x}_{i}} (x)|≤ 1 + |{ ∂f \over ∂{x}_{i}} (a)|. Pour \|h\| < η, on a alors [a,a + h] ⊂ B(0,η) et donc |f(a + h) − f(a)|≤{\mathop{\mathop{∑ }} }_{i=1}^{n}|{h}_{i}|\,\left (\left |{ ∂f \over ∂{x}_{i}} (a)\right | + 1\right ), ce qui montre la continuité de f au point a.

Corollaire 15.1.8 Soit U un ouvert connexe de {ℝ}^{n}, F un espace vectoriel de dimension finie, f : U → F. Alors f est constante si et seulement si elle est de classe {C}^{1} et toutes ses dérivées partielles sont nulles.

Démonstration Si f est constante, il est clair qu’elle est de classe {C}^{1} et que toutes ses dérivées partielles sont nulles. Pour la réciproque, en prenant une base (sur ) de F et en travaillant composante par composante, on peut supposer que f est à valeurs réelles. Soit {x}_{0} ∈ U et soit X = \{x ∈ U\mathrel{∣}f(x) = f({x}_{0})\}. Puisque f est continue (d’après le corollaire précédent), X est un fermé de U, évidemment non vide. Montrons que X est également ouvert dans U ; soit en effet {x}_{1} dans X et soit η > 0 tel que B({x}_{1},η) ⊂ U. Pour \|h\| < η, on a [{x}_{1},{x}_{1} + h] ⊂ B({x}_{1},η) ⊂ U et le théorème des accroissements finis nous donne f({x}_{1} + h) = f({x}_{1}) = f({x}_{0}), les dérivées partielles étant supposées nulles. On a donc B({x}_{1},η) ⊂ X, et donc X est ouvert. Comme X est à la fois ouvert et fermé, non vide dans U connexe, on a X = U et donc f est constante.

15.1.4 Dérivées partielles successives

On définit la notion de dérivées partielles successives de manière récursive de la manière suivante

Définition 15.1.4 Soit U un ouvert de {ℝ}^{n}, a ∈ U et f : U → E. Soit ({i}_{1},\mathop{\mathop{…}},{i}_{k}) ∈ {[1,n]}^{k}. On dit que { {∂}^{k}f \over ∂{x}_{{i}_{1}}\mathop{\mathop{…}}∂{x}_{{i}_{k}}} (a) existe s’il existe un ouvert V tel que a ∈ V ⊂ U et sur lequel { {∂}^{k−1}f \over ∂{x}_{{i}_{2}}\mathop{\mathop{…}}∂{x}_{{i}_{k}}} (x) existe et si l’application x\mathrel{↦}{ {∂}^{k−1}f \over ∂{x}_{{i}_{2}}\mathop{\mathop{…}}∂{x}_{{i}_{k}}} (x) admet une dérivée partielle d’indice {i}_{1}. On pose alors

{ {∂}^{k}f \over ∂{x}_{{i}_{1}}\mathop{\mathop{…}}∂{x}_{{i}_{k}}} (a) ={ ∂ \over ∂{x}_{{i}_{1}}} \left ({ {∂}^{k−1}f \over ∂{x}_{{i}_{2}}\mathop{\mathop{…}}∂{x}_{{i}_{k}}} \right )(a)

Définition 15.1.5 Soit U un ouvert de {ℝ}^{n} et f : U → E. On dit que f est de classe {C}^{k} sur U si, \mathop{∀}({i}_{1},\mathop{\mathop{…}},{i}_{k}) ∈ {[1,n]}^{k}, l’application x\mathrel{↦}{ {∂}^{k}f \over ∂{x}_{{i}_{1}}\mathop{\mathop{…}}∂{x}_{{i}_{k}}} (x) est définie et continue sur U.

Remarque 15.1.5 Comme on a vu que toute application de classe {C}^{1} est continue, on en déduit immédiatement que toute application de classe {C}^{k} est aussi de classe {C}^{k−1}. On dira bien entendu que f est de classe {C}^{∞} si elle est de classe {C}^{k} pour tout k. Une récurrence évidente sur k montre que la composée de deux applications de classe {C}^{k} est encore de classe {C}^{k} et que donc la composée de deux applications de classe {C}^{∞} est encore de classe {C}^{∞}.

Lemme 15.1.9 Soit U un ouvert de {ℝ}^{2}, f : U → ℝ de classe {C}^{2}. Alors, { {∂}^{2}f \over ∂{x}_{1}∂{x}_{2}} ={ {∂}^{2}f \over ∂{x}_{2}∂{x}_{1}} .

Démonstration Soit ({a}_{1},{a}_{2}) ∈ U et soit

\begin{eqnarray*} φ({h}_{1},{h}_{2})& =&{ 1 \over {h}_{1}{h}_{2}} (f({a}_{1} + {h}_{1},{a}_{2} + {h}_{2}) − f({a}_{1} + {h}_{1},{a}_{2})%& \\ & & \quad \quad \quad − f({a}_{1},{a}_{2} + {h}_{2}) + f({a}_{1},{a}_{2})) %& \\ \end{eqnarray*}

définie pour {h}_{1} et {h}_{2} non nuls et assez petits. On a φ({h}_{1},{h}_{2}) ={ 1 \over {h}_{1}{h}_{2}} {ψ}_{1}({a}_{1} + {h}_{1}) − {ψ}_{1}({a}_{1}) avec {ψ}_{1}({x}_{1}) = f({x}_{1},{a}_{2} + {h}_{2}) − f({x}_{1},{a}_{2}). Or {ψ}_{1} est dérivable sur [{a}_{1},{a}_{1} + {h}_{1}] avec {ψ}_{1}'({x}_{1}) ={ ∂f \over ∂{x}_{1}} ({x}_{1},{a}_{2} + {h}_{2}) −{ ∂f \over ∂{x}_{1}} ({x}_{1},{a}_{2}). On peut donc appliquer le théorème des accroissements finis, et donc il existe {ξ}_{1} ∈ [{a}_{1},{a}_{1} + {h}_{1}] tel que

\begin{eqnarray*} φ({h}_{1},{h}_{2})& =&{ 1 \over {h}_{2}} {ψ}_{1}'({ξ}_{1}) %& \\ & =&{ 1 \over {h}_{2}} \left ({ ∂f \over ∂{x}_{1}} ({ξ}_{1},{a}_{2} + {h}_{2}) −{ ∂f \over ∂{x}_{1}} ({ξ}_{1},{a}_{2})\right )%& \\ & =&{ {∂}^{2}f \over ∂{x}_{2}∂{x}_{1}} ({ξ}_{1},{ξ}_{2}) %& \\ \end{eqnarray*}

avec {ξ}_{2} ∈ [{a}_{2},{a}_{2} + {h}_{2}] en appliquant le théorème des accroissements finis à {x}_{2}\mathrel{↦}{ ∂f \over ∂{x}_{1}} ({ξ}_{1},{x}_{2}) qui est dérivable sur [{a}_{2},{a}_{2} + {h}_{2}], de dérivée { {∂}^{2}f \over ∂{x}_{2}∂{x}_{1}} ({ξ}_{1},{x}_{2}). Quand {h}_{1} et {h}_{2} tendent vers 0, {ξ}_{1} et {ξ}_{2} tendent respectivement vers {a}_{1} et {a}_{2} et la continuité de { {∂}^{2}f \over ∂{x}_{2}∂{x}_{1}} montre que {\mathop{lim}}_{({h}_{1},{h}_{2})→(0,0)}φ({h}_{1},{h}_{2}) ={ {∂}^{2}f \over ∂{x}_{2}∂{x}_{1}} ({a}_{1},{a}_{2}). Comme les deux variables jouent un rôle symétrique dans la définition de φ, en posant {ψ}_{2}({x}_{2}) = f({a}_{1} + {h}_{1},{x}_{2}) − f({a}_{1},{x}_{2}) et en appliquant deux fois le théorème des accroissements finis, on obtient {\mathop{lim}}_{({h}_{1},{h}_{2})→(0,0)}φ({h}_{1},{h}_{2}) ={ {∂}^{2}f \over ∂{x}_{1}∂{x}_{2}} ({a}_{1},{a}_{2}), ce qui démontre que { {∂}^{2}f \over ∂{x}_{1}∂{x}_{2}} ({a}_{1},{a}_{2}) ={ {∂}^{2}f \over ∂{x}_{2}∂{x}_{1}} ({a}_{1},{a}_{2}).

Théorème 15.1.10 (Schwarz). Soit U un ouvert de {ℝ}^{n} et f : U → E (espace vectoriel normé de dimension finie) de classe {C}^{2}. Alors \mathop{∀}(i,j) ∈ {[1,n]}^{2},

{ {∂}^{2}f \over ∂{x}_{i}∂{x}_{j}} ={ {∂}^{2}f \over ∂{x}_{j}∂{x}_{i}}

Démonstration En prenant une base de E, on peut se contenter de montrer le résultat lorsque E = ℝ. Si i = j, le résultat est évident. Supposons i < j et soit ({a}_{1},\mathop{\mathop{…}},{a}_{n}) ∈ {ℝ}^{n}. On applique le lemme précédent à l’application de classe {C}^{2}, définie sur un ouvert contenant ({a}_{i},{a}_{j}),

g({x}_{i},{x}_{j}) = f({a}_{1},\mathop{\mathop{…}},{a}_{i−1},{x}_{i},{a}_{i+1},\mathop{\mathop{…}},{a}_{j−1},{x}_{j},{a}_{j+1},\mathop{\mathop{…}},{a}_{n})

qui est de classe {C}^{2} (composée d’applications de classe {C}^{2}). On a donc { {∂}^{2}g \over ∂{x}_{i}∂{x}_{j}} ({a}_{i},{a}_{j}) ={ {∂}^{2}g \over ∂{x}_{j}∂{x}_{i}} ({a}_{i},{a}_{j}), soit encore

{ {∂}^{2}f \over ∂{x}_{i}∂{x}_{j}} ({a}_{1},\mathop{\mathop{…}},{a}_{n}) ={ {∂}^{2}f \over ∂{x}_{j}∂{x}_{i}} ({a}_{1},\mathop{\mathop{…}},{a}_{n})

Corollaire 15.1.11 Soit U un ouvert de {ℝ}^{n} et f : U → E de classe {C}^{k}. Soit ({i}_{1},\mathop{\mathop{…}},{i}_{k}) ∈ {[1,n]}^{k}. Pour toute permutation σ de [1,k] on a

{ {∂}^{k}f \over ∂{x}_{{i}_{σ(1)}}\mathop{\mathop{…}}∂{x}_{{i}_{σ(k)}}} ={ {∂}^{k}f \over ∂{x}_{{i}_{1}}\mathop{\mathop{…}}∂{x}_{{i}_{k}}}

Démonstration D’après le théorème de Schwarz, le résultat est vrai lorsque σ = {τ}_{j,j+1} est la transposition qui échange j et j + 1. Mais toute permutation de [1,k] est un produit de telles transpositions (facile) ce qui démontre le corollaire.

Notation définitive Soit ({i}_{1},\mathop{\mathop{…}},{i}_{k}) ∈ {[1,n]}^{k}. Pour j ∈ [1,n], soit {k}_{j} le nombre de {i}_{q} qui sont égaux à j. On a donc à une permutation près, la famille ({i}_{1},\mathop{\mathop{…}},{i}_{k}) qui est égale à (\overbrace{1,\mathop{\mathop{…}},1}{k}_{1} fois,\mathop{\mathop{…}},\overbrace{j,\mathop{\mathop{…}},j} {k}_{j} fois,\mathop{\mathop{…}},\overbrace{n,\mathop{\mathop{…}},n}{k}_{n} fois), chaque j étant compté {k}_{j} fois. En notant ∂{x}_{j}^{{k}_{j}} à la place de \overbrace{∂{x}_{j}\mathop{\mathop{…}}∂{x}_{j}} {k}_{j} fois, on obtient

{ {∂}^{k}f \over ∂{x}_{{i}_{1}}\mathop{\mathop{…}}∂{x}_{{i}_{k}}} ={ {∂}^{k}f \over ∂{x}_{1}^{{k}_{1}}\mathop{\mathop{…}}∂{x}_{n}^{{k}_{n}}}

15.1.5 Formules de Taylor

Lemme 15.1.12 Soit U un ouvert de {ℝ}^{n} et f : U → E de classe {C}^{k}. Soit a ∈ U et h ∈ {ℝ}^{n} tel que [a,a + h] ⊂ U. Posons φ(t) = f(a + th), définie et de classe {C}^{k} sur [0,1]. Alors, pour tout t ∈ [0,1],

\begin{eqnarray*}{ φ}^{(k)}(t) ={ \mathop{∑ }}_{{k}_{1}+\mathop{…}+{k}_{n}=k}{ k! \over {k}_{1}!\mathop{…}{k}_{n}!} {h}_{1}^{{k}_{1} }\mathop{…}{h}_{n}^{{k}_{n} }{ {∂}^{k}f \over ∂{x}_{1}^{{k}_{1}}\mathop{…}∂{x}_{n}^{{k}_{n}}} (a + th)& & %& \\ \end{eqnarray*}

Démonstration Par récurrence sur k. Pour k = 1, ce n’est qu’une autre formulation du résultat

\begin{eqnarray*} φ'(t)& =& {\mathop{∑ }}_{i=1}^{n}{h}_{ i}{ ∂f \over ∂{x}_{i}} (a + th) %& \\ & =& {\mathop{∑ }}_{{k}_{1}+\mathop{…}+{k}_{n}=1}{h}_{1}^{{k}_{1} }\mathop{…}{h}_{n}^{{k}_{n} }{ ∂f \over ∂{x}_{1}^{{k}_{1}}\mathop{…}∂{x}_{n}^{{k}_{n}}} (a + th)%& \\ \end{eqnarray*}

en posant {k}_{i} = 1 et {k}_{j} = 0 pour i\mathrel{≠}j.

Supposons le résultat démontré pour k − 1. On a donc

\begin{eqnarray*}{ φ}^{(k−1)}(t) =&& %& \\ & & {\mathop{∑ }}_{{k}_{1}+\mathop{…}+{k}_{n}=k−1}{ (k − 1)! \over {k}_{1}!\mathop{…}{k}_{n}!} {h}_{1}^{{k}_{1} }\mathop{…}{h}_{n}^{{k}_{n} }{ {∂}^{k−1}f \over ∂{x}_{1}^{{k}_{1}}\mathop{…}∂{x}_{n}^{{k}_{n}}} (a + th)%& \\ \end{eqnarray*}

On en déduit que

\begin{eqnarray*}{ φ}^{(k)}(t) =&& %& \\ & & {\mathop{∑ }}_{{k}_{1}+\mathop{…}+{k}_{n}=k−1}{ (k − 1)! \over {k}_{1}!\mathop{…}{k}_{n}!} {h}_{1}^{{k}_{1} }\mathop{…}{h}_{n}^{{k}_{n} }{ d \over dt} \left ({ {∂}^{k−1}f \over ∂{x}_{1}^{{k}_{1}}\mathop{…}∂{x}_{n}^{{k}_{n}}} (a + th)\right )%& \\ \end{eqnarray*}

soit encore

\begin{eqnarray*}{ φ}^{(k)}(t)& =& {\mathop{∑ }}_{{k}_{1}+\mathop{…}+{k}_{n}=k−1}{ (k − 1)! \over {k}_{1}!\mathop{…}{k}_{n}!} {h}_{1}^{{k}_{1} }\mathop{…}{h}_{n}^{{k}_{n} } %& \\ & & \quad \quad { \mathop{∑ }}_{i=1}^{n}{h}_{ i}{ {∂}^{k}f \over ∂{x}_{1}^{{k}_{1}}\mathop{…}∂{x}_{i}^{{k}_{i}+1}\mathop{…}∂{x}_{n}^{{k}_{n}}} (a + th)%& \\ \end{eqnarray*}

En intervertissant les deux signes de somme on obtient

\begin{eqnarray*}{ φ}^{(k)}(t)& =& {\mathop{∑ }}_{i=1}^{n}{ \mathop{∑ }}_{{k}_{1}+\mathop{…}+{k}_{n}=k−1}{ (k − 1)!({k}_{i} + 1) \over {k}_{1}!\mathop{…}({k}_{i} + 1)!\mathop{…}{k}_{n}!} %& \\ & & \quad \quad {h}_{1}^{{k}_{1} }\mathop{\mathop{…}}{h}_{i}^{{k}_{i}+1}\mathop{\mathop{…}}{h}_{ n}^{{k}_{n} }{ {∂}^{k}f \over ∂{x}_{1}^{{k}_{1}}\mathop{\mathop{…}}∂{x}_{i}^{{k}_{i}+1}\mathop{\mathop{…}}∂{x}_{n}^{{k}_{n}}} (a + th)%& \\ \end{eqnarray*}

et en faisant un changement d’indice

\begin{eqnarray*}{ φ}^{(k)}(t)& =& {\mathop{∑ }}_{i=1}^{n}{ \mathop{∑ }}_{{ {k}_{1}+\mathop{…}+{k}_{n}=k \atop {k}_{i}≥1} }{ (k − 1)!{k}_{i} \over {k}_{1}!\mathop{…}{k}_{n}!} %& \\ & & \quad \quad {h}_{1}^{{k}_{1} }\mathop{\mathop{…}}{h}_{i}^{{k}_{i} }\mathop{\mathop{…}}{h}_{n}^{{k}_{n} }{ {∂}^{k}f \over ∂{x}_{1}^{{k}_{1}}\mathop{\mathop{…}}∂{x}_{i}^{{k}_{i}}\mathop{\mathop{…}}∂{x}_{n}^{{k}_{n}}} (a + th)%& \\ \end{eqnarray*}

Réintroduisons les termes pour {k}_{i} = 0 qui sont nuls puisqu’ils contiennent le facteur (k − 1)!{k}_{i}, on obtient

\begin{eqnarray*}{ φ}^{(k)}(t)& =& {\mathop{∑ }}_{i=1}^{n}{ \mathop{∑ }}_{{k}_{1}+\mathop{…}+{k}_{n}=k}{ (k − 1)!{k}_{i} \over {k}_{1}!\mathop{…}{k}_{n}!} {h}_{1}^{{k}_{1} }\mathop{…}{h}_{i}^{{k}_{i} }\mathop{…}{h}_{n}^{{k}_{n} }%& \\ & & \quad \quad \quad { {∂}^{k}f \over ∂{x}_{1}^{{k}_{1}}\mathop{\mathop{…}}∂{x}_{i}^{{k}_{i}}\mathop{\mathop{…}}∂{x}_{n}^{{k}_{n}}} (a + th) %& \\ \end{eqnarray*}

Ceci nous permet de réintervertir les deux sommations, soit encore, après mise en facteur

\begin{eqnarray*}{ φ}^{(k)}(t)& =& {\mathop{∑ }}_{{k}_{1}+\mathop{…}+{k}_{n}=k}{ (k − 1)!{\mathop{∑ }}_{i=1}^{n}{k}_{i} \over {k}_{1}!\mathop{…}{k}_{n}!} {h}_{1}^{{k}_{1} }\mathop{…}{h}_{i}^{{k}_{i} }\mathop{…}{h}_{n}^{{k}_{n} }%& \\ & & \quad \quad \quad { {∂}^{k}f \over ∂{x}_{1}^{{k}_{1}}\mathop{\mathop{…}}∂{x}_{i}^{{k}_{i}}\mathop{\mathop{…}}∂{x}_{n}^{{k}_{n}}} (a + th) %& \\ \end{eqnarray*}

soit encore

\begin{eqnarray*}{ φ}^{(k)}(t)& =& {\mathop{∑ }}_{{k}_{1}+\mathop{…}+{k}_{n}=k}{ k! \over {k}_{1}!\mathop{…}{k}_{n}!} {h}_{1}^{{k}_{1} }\mathop{…}{h}_{n}^{{k}_{n} }{ {∂}^{k}f \over ∂{x}_{1}^{{k}_{1}}\mathop{…}∂{x}_{n}^{{k}_{n}}} (a + th)%& \\ \end{eqnarray*}

ce qui achève la récurrence.

Remarque 15.1.6 Cette formule est tout à fait analogue à la formule du binôme généralisée

{({X}_{1} + \mathop{\mathop{…}} + {X}_{n})}^{k} ={ \mathop{∑ }}_{{k}_{1}+\mathop{…}+{k}_{n}=k}{ k! \over {k}_{1}!\mathop{…}{k}_{n}!} {X}_{1}^{{k}_{1} }\mathop{…}{X}_{n}^{{k}_{n} }

Cette remarque nous conduira à une notation plus compacte. Introduisons un produit symbolique sur les expressions du type {h}_{1}^{{k}_{1}}\mathop{\mathop{…}}{h}_{n}^{{k}_{n}}{ {∂}^{k} \over ∂{x}_{1}^{{k}_{1}}\mathop{\mathop{…}}∂{x}_{n}^{{k}_{n}}} en posant

\begin{eqnarray*} \left ({h}_{1}^{{k}_{1} }\mathop{\mathop{…}}{h}_{n}^{{k}_{n} }{ {∂}^{k} \over ∂{x}_{1}^{{k}_{1}}\mathop{\mathop{…}}∂{x}_{n}^{{k}_{n}}} \right ) ∗\left ({h}_{1}^{{l}_{1} }\mathop{\mathop{…}}{h}_{n}^{{l}_{n} }{ {∂}^{l} \over ∂{x}_{1}^{{l}_{1}}\mathop{\mathop{…}}∂{x}_{n}^{{l}_{n}}} \right ) =&&%& \\ & & {h}_{1}^{{k}_{1}+{l}_{1} }\mathop{\mathop{…}}{h}_{n}^{{k}_{n}+{l}_{n} }{ {∂}^{k+l} \over ∂{x}_{1}^{{k}_{1}+{l}_{1}}\mathop{\mathop{…}}∂{x}_{n}^{{k}_{n}+{l}_{n}}} \quad \quad \quad %& \\ \end{eqnarray*}

Ce produit est commutatif, et

\begin{eqnarray*} {\mathop{∑ }}_{{k}_{1}+\mathop{…}+{k}_{n}=k}{ k! \over {k}_{1}!\mathop{…}{k}_{n}!} {h}_{1}^{{k}_{1} }\mathop{…}{h}_{n}^{{k}_{n} }{ {∂}^{k} \over ∂{x}_{1}^{{k}_{1}}\mathop{…}∂{x}_{n}^{{k}_{n}}} &&%& \\ & & ={ \left ({h}_{1}{ ∂ \over ∂{x}_{1}} + \mathop{\mathop{…}} + {h}_{n}{ ∂ \over ∂{x}_{n}} \right )}^{k∗}\quad \quad \quad %& \\ \end{eqnarray*}

où la notation {}^{k∗} désigne la puissance k-ième pour ce produit commutatif. La formule s’écrit alors de manière plus agréable sous la forme

{φ}^{(k)}(t) ={ \left ({h}_{ 1}{ ∂ \over ∂{x}_{1}} + \mathop{\mathop{…}} + {h}_{n}{ ∂ \over ∂{x}_{n}} \right )}^{k∗}f(a + th)

Ces puissances se développent de la manière évidente en respectant la règle de calcul pour le produit .

Exemple 15.1.3 φ'(t) = \left ({h}_{1}{ ∂ \over ∂{x}_{1}} + \mathop{\mathop{…}} + {h}_{n}{ ∂ \over ∂{x}_{n}} \right )f(a + th)

\begin{eqnarray*} φ''(t)& =&{ \left ({h}_{1}{ ∂ \over ∂{x}_{1}} + \mathop{\mathop{…}} + {h}_{n}{ ∂ \over ∂{x}_{n}} \right )}^{2∗}f(a + th) %& \\ & =& {\mathop{∑ }}_{i=1}^{n}{h}_{ i}^{2}{ {∂}^{2}f \over ∂{x}_{i}^{2}} (a + th) + 2{\mathop{∑ }}_{i<j}{h}_{i}{h}_{j}{ {∂}^{2}f \over ∂{x}_{i}∂{x}_{j}} (a + th)%& \\ \end{eqnarray*}

et ainsi de suite.

Théorème 15.1.13 (formule de Taylor avec reste intégral). Soit U un ouvert de {ℝ}^{n} et f : U → E de classe {C}^{k+1}. Soit a ∈ U et h ∈ {ℝ}^{n} tel que [a,a + h] ⊂ U. Alors

\begin{eqnarray*} f(a + h)& =& f(a) +{ \mathop{∑ }}_{p=1}^{k}{ 1 \over p!} {\left ({h}_{1}{ ∂ \over ∂{x}_{1}} + \mathop{…} + {h}_{n}{ ∂ \over ∂{x}_{n}} \right )}^{p∗}f(a)%& \\ +{\mathop{∫ } }_{0}^{1}{ {(1 − t)}^{k} \over k!} { \left ({h}_{1}{ ∂ \over ∂{x}_{1}} + \mathop{\mathop{…}} + {h}_{n}{ ∂ \over ∂{x}_{n}} \right )}^{(k+1)∗}f(a + th) dt&&%& \\ \end{eqnarray*}

Démonstration C’est simplement la formule de Taylor avec reste intégral pour la fonction φ :

φ(1) = φ(0) +{ \mathop{∑ }}_{p=1}^{k}{ 1 \over p!} {φ}^{(p)}(0) +{ \mathop{\mathop{∫ } } }_{0}^{1}{ {(1 − t)}^{k} \over k!} {φ}^{(k+1)}(t) dt

Remarque 15.1.7 On utilisera le plus souvent cette formule pour k = 1 ; dans cas d’une fonction définie sur un ouvert de {ℝ}^{2} on obtiendra par exemple

\begin{eqnarray*} f(a + h)& =& f(a) + {h}_{1}{ ∂f \over ∂{x}_{1}} (a) + {h}_{2}{ ∂f \over ∂{x}_{2}} (a) %& \\ & & \quad + {h}_{1}^{2}{\mathop{∫ } }_{0}^{1}(1 − t){ {∂}^{2}f \over ∂{x}_{1}^{2}} (a + th) dt %& \\ & & \quad + {h}_{2}^{2}{\mathop{∫ } }_{0}^{1}(1 − t){ {∂}^{2}f \over ∂{x}_{2}^{2}} (a + th) dt %& \\ & & \quad + 2{h}_{1}{h}_{2}{\mathop{∫ } }_{0}^{1}(1 − t){ {∂}^{2}f \over ∂{x}_{1}∂{x}_{2}} (a + th) dt%& \\ \end{eqnarray*}

Théorème 15.1.14 (formule de Taylor-Lagrange). Soit U un ouvert de {ℝ}^{n} et f : U → ℝ de classe {C}^{k+1}. Soit a ∈ U et h ∈ {ℝ}^{n} tel que [a,a + h] ⊂ U. Alors, il existe θ ∈]0,1[ tel que

\begin{eqnarray*} f(a + h)& =& f(a) +{ \mathop{∑ }}_{p=1}^{k}{ 1 \over p!} {\left ({h}_{1}{ ∂ \over ∂{x}_{1}} + \mathop{…} + {h}_{n}{ ∂ \over ∂{x}_{n}} \right )}^{p∗}f(a) %& \\ & & +{ 1 \over (k + 1)!} {\left ({h}_{1}{ ∂ \over ∂{x}_{1}} + \mathop{\mathop{…}} + {h}_{n}{ ∂ \over ∂{x}_{n}} \right )}^{(k+1)∗}f(a + θh)%& \\ \end{eqnarray*}

Démonstration C’est simplement la formule de Taylor Lagrange pour la fonction φ :

φ(1) = φ(0) +{ \mathop{∑ }}_{p=1}^{k}{ 1 \over p!} {φ}^{(p)}(0) +{ 1 \over (k + 1)!} {φ}^{(k+1)}(θ)

Théorème 15.1.15 (formule de Taylor-Young). Soit U un ouvert de {ℝ}^{n} et f : U → E (espace vectoriel normé de dimension finie) de classe {C}^{k}. Soit a ∈ U. Alors, quand h tend vers 0 on a

f(a + h) = f(a) +{ \mathop{∑ }}_{p=1}^{k}{ 1 \over p!} {\left ({h}_{1}{ ∂ \over ∂{x}_{1}} + \mathop{…} + {h}_{n}{ ∂ \over ∂{x}_{n}} \right )}^{p∗}f(a) + o(\|{h\|}^{k})

Démonstration Quitte à prendre une base de E et à travailler composante par composante, on peut supposer que E = ℝ ; toutes les normes sur {ℝ}^{n} étant équivalentes, on peut supposer que \|h\| = |{h}_{1}| + \mathop{\mathop{…}} + |{h}_{n}|. Soit ρ > 0 tel que B(a,ρ) ⊂ U et soit h tel que \|h\| < ρ. On a alors [a,a + h] ⊂ B(a,ρ) ⊂ U ; on peut donc appliquer la formule de Taylor-Lagrange à l’ordre k − 1 qui nous donne

\begin{eqnarray*} f(a + h)& −& f(a) −{\mathop{∑ }}_{p=1}^{k}{ 1 \over p!} {\left ({h}_{1}{ ∂ \over ∂{x}_{1}} + \mathop{…} + {h}_{n}{ ∂ \over ∂{x}_{n}} \right )}^{p∗}f(a)%& \\ & =&{ 1 \over k!} {\left ({h}_{1}{ ∂ \over ∂{x}_{1}} + \mathop{\mathop{…}} + {h}_{n}{ ∂ \over ∂{x}_{n}} \right )}^{k∗}f(a + θh) %& \\ & −&{ 1 \over k!} {\left ({h}_{1}{ ∂ \over ∂{x}_{1}} + \mathop{\mathop{…}} + {h}_{n}{ ∂ \over ∂{x}_{n}} \right )}^{k∗}f(a) %& \\ \end{eqnarray*}

Mais les dérivées partielles de f sont continues. Soit ε > 0 ; il existe η > 0 tel que

\begin{eqnarray*} \|h\| < η& ⇒& \mathop{∀}({k}_{1},\mathop{\mathop{…}},{k}_{n})\text{ tel que }{k}_{1} + \mathop{\mathop{…}} + {k}_{n} = k, \mathop{∀}t ∈ [0,1] %& \\ & & \left |{ {∂}^{k}f \over ∂{x}_{1}^{{k}_{1}}\mathop{\mathop{…}}∂{x}_{n}^{{k}_{n}}} (a + th)\right . −\left .{ {∂}^{k}f \over ∂{x}_{1}^{{k}_{1}}\mathop{\mathop{…}}∂{x}_{n}^{{k}_{n}}} (a)\right | < ε%& \\ \end{eqnarray*}

Pour \|h\| < η, on a alors (en développant les deux puissances symboliques)

\begin{eqnarray*} \big |{\left (\mathop{∑ }{h}_{i}{ ∂ \over ∂{x}_{i}} \right )}^{k∗}f(a + θh) −{\left (\mathop{∑ }{h}_{i}{ ∂ \over ∂{x}_{i}} \right )}^{k∗}f(a)\big |&&%& \\ & <& ε{\mathop{∑ }}_{{k}_{1}+\mathop{…}+{k}_{n}=k}{ k! \over {k}_{1}!\mathop{…}{k}_{n}!} |{h}_{1}{|}^{{k}_{1} }\mathop{…}|{h}_{n}{|}^{{k}_{n} }%& \\ & =& ε{(|{h}_{1}| + \mathop{\mathop{…}} + |{h}_{n}|)}^{k} = ε\|{h\|}^{k} %& \\ \end{eqnarray*}

ce qui démontre le résultat.

15.1.6 Application aux extremums de fonctions de plusieurs variables

Soit U un ouvert de {ℝ}^{n} et f : U → ℝ. Nous allons rechercher les extremums de la fonction f à l’aide des résultats qui suivent.

Proposition 15.1.16 Soit U un ouvert de {ℝ}^{n} et f : U → ℝ de classe {C}^{1}. Soit a ∈ U. Si f admet en a un extremum local, on a \mathop{∀}i ∈ [1,n],{ ∂f \over ∂{x}_{i}} (a) = 0.

Démonstration Il suffit de remarquer que la fonction t\mathrel{↦}f(a + t{e}_{i}) (définie sur un voisinage de 0) admet en 0 un extremum local. On a donc

{ ∂f \over ∂{x}_{i}} (a) ={ d \over dt} {\left (f(a + t{e}_{i})\right )}_{t=0} = 0

Dans le cas des fonctions d’une variable, la condition ci dessus n’est déjà pas suffisante (considérer x\mathrel{↦}{x}^{3} au point 0). Il est clair qu’il en est de même a fortiori pour une fonction de plusieurs variables. Pour obtenir des résultats plus précis et en particulier des conditions suffisantes d’extremums, nous allons introduire une forme quadratique sur {ℝ}^{n}

Définition 15.1.6 Soit U un ouvert de {ℝ}^{n} et f : U → ℝ de classe {C}^{2}. Soit a ∈ U. On appelle différentielle seconde au point a la forme quadratique sur {ℝ}^{n},

\begin{eqnarray*} h& =& ({h}_{1},\mathop{\mathop{…}},{h}_{n})\mathrel{↦}{\left ({h}_{1}{ ∂ \over ∂{x}_{1}} + \mathop{\mathop{…}} + {h}_{n}{ ∂ \over ∂{x}_{n}} \right )}^{2∗}f(a) %& \\ & & ={ \mathop{∑ }}_{i=1}^{n}{h}_{ i}^{2}{ {∂}^{2}f \over ∂{x}_{i}^{2}} (a) + 2{\mathop{∑ }}_{i<j}{h}_{i}{h}_{j}{ {∂}^{2}f \over ∂{x}_{i}∂{x}_{j}} (a)%& \\ \end{eqnarray*}

Théorème 15.1.17 Soit U un ouvert de {ℝ}^{n} et f : U → ℝ de classe {C}^{2}. Soit a ∈ U tel que \mathop{∀}i ∈ [1,n],{ ∂f \over ∂{x}_{i}} (a) = 0 et soit Φ la forme quadratique différentielle seconde au point a. Alors (i) si Φ est définie positive, c’est-à-dire si h\mathrel{≠}0 ⇒ Φ(h) > 0, alors f admet en a un minimum local strict (ii) si Φ est définie négative, c’est-à-dire si h\mathrel{≠}0 ⇒ Φ(h) < 0, alors f admet en a un maximum local strict (iii) si Φ n’est ni positive ni négative, alors f n’admet pas d’extremum en a (on dit dans ce cas que a est un point selle ou point col de a, par analogie avec une selle de cheval ou un col de montagne).

Démonstration (i). Utilisons la formule de Taylor Young à l’ordre 2. On a donc, en tenant compte de { ∂f \over ∂{x}_{i}} (a) = 0, f(a + h) = f(a) +{ 1 \over 2} Φ(h) +\| {h\|}^{2}ε(h), avec {\mathop{lim}}_{h→0}ε(h) = 0. Pour démontrer (i), nous allons utiliser le lemme suivant

Lemme 15.1.18 Soit Φ une forme quadratique définie positive sur {ℝ}^{n} (ou tout espace vectoriel normé de dimension finie). Alors \mathop{∃}α > 0, \mathop{∀}h ∈ {ℝ}^{n}, Φ(h) ≥ α\|{h\|}^{2}.

Démonstration Soit S la sphère unité de {ℝ}^{n}. Comme Φ est continue sur S qui est compact, Φ atteint sur S sa borne inférieure α. Soit donc {x}_{0} ∈ S tel que Φ({x}_{0}) = α ={\mathop{ inf} }_{x∈S}Φ(x). Comme {x}_{0}\mathrel{≠}0, on a α > 0. De plus, si h\mathrel{≠}0, on a { h \over \|h\|} ∈ S, soit Φ({ h \over \|h\|} ) ≥ α soit { Φ(h) \over \|{h\|}^{2}} ≥ α, soit encore Φ(h) ≥ α\|{h\|}^{2}.

Puisque {\mathop{lim}}_{h→0}ε(h) = 0, il existe η > 0 tel que \|h\| < η ⇒|ε(h)|≤{ α \over 4} . Pour \|h\| < η, on a donc

\begin{eqnarray*} f(a + h) − f(a)& =&{ 1 \over 2} Φ(h) +\| {h\|}^{2}ε(h) %& \\ & ≥&{ α \over 2} \|{h\|}^{2} −{ α \over 4} \|{h\|}^{2} ={ α \over 4} \|{h\|}^{2} > 0%& \\ \end{eqnarray*}

pour h\mathrel{≠}0. Donc f admet en a un minimum local strict.

Pour démontrer (ii) à partir de (i), il suffit de changer f en − f.

(iii). Si Φ n’est ni positive, ni négative, il existe {v}_{1} ∈ {ℝ}^{n} tel que Φ({v}_{1}) < 0 et il existe {v}_{2} ∈ {ℝ}^{n} tel que Φ({v}_{2}) > 0. On a alors, d’après la même formule de Taylor, en posant h = t{v}_{i}, f(a + t{v}_{i}) = f(a) +{ 1 \over 2} Φ(t{v}_{i}) + {t}^{2}\|{v{}_{ i}\|}^{2}ε(t{v}_{ i}) = f(a) +{ {t}^{2} \over 2} Φ({v}_{i}) + {t}^{2}{ε}_{ i}(t) avec {\mathop{lim}}_{t→0}{ε}_{i}(t) = 0. On en déduit qu’il existe un η > 0 tel que |t| < η ⇒ f(a + t{v}_{1}) < f(a)\text{ et }f(a + t{v}_{2}) > f(a). Donc f n’a ni minimum, ni maximum en a.

Remarque 15.1.8 Dans le cas où Φ est soit positive, soit négative, mais non définie (c’est-à-dire que Φ(h) peut être nul sans que h soit nul), on ne peut pas conclure en général et il faut utiliser une formule de Taylor à un ordre supérieur.

Exemple 15.1.4 n = 2 ; soit U un ouvert de {ℝ}^{2} et f : U → ℝ, (x,y)\mathrel{↦}f(x,y). Soit (a,b) ∈ U. Une condition nécessaire pour que f admette en (a,b) un extremum est que { ∂f \over ∂x} (a,b) ={ ∂f \over ∂y} (a,b) = 0. Posons r ={ {∂}^{2}f \over ∂{x}^{2}} (a,b), s ={ {∂}^{2}f \over ∂x∂y} (a,b), t ={ {∂}^{2}f \over ∂{y}^{2}} (a,b) (notations de Monge). La forme quadratique Φ est (h,k)\mathrel{↦}r{h}^{2} + 2shk + t{k}^{2}. Considérons suivant le cas le rapport { h \over k} ou le rapport { k \over h} , on constate immédiatement à l’aide de l’étude du signe d’un trinome du second degré que si (i) rt − {s}^{2} > 0 et r > 0, alors Φ est définie positive et f a en a un minimum local strict (ii) rt − {s}^{2} > 0 et r < 0, alors Φ est définie négative et f a en a un maximum local strict (iii) rt − {s}^{2} < 0, alors f a en a un point selle (pas d’extremum local en a) (iv) rt − {s}^{2} = 0, alors on ne peut pas conclure.

Le lecteur comparera les surfaces z = f(x,y) ainsi que lignes de niveau de ces surfaces dans les trois exemples ci dessous (correspondant respectivement à un minimum local, un point selle et un point de type (iv))

PIC