Math'O Man : le Blog des Maths

Une application du théorème de la fonction implicite


Mieux comprendre la topologie des matrices singulières


Mon billet récent sur la dimension maximale d'un sous-espace affine contenu dans l'ensemble des matrices non-inversibles m'a inspiré les réflexions suivantes, une sorte de version différentiable de ce résultat.

On note {\mathcal M}_n(\mathbb{R}) l'espace des matrices n x n à coefficients réels et GL(n,\mathbb{R}) le sous-ensemble des matrices inversibles. On sait que GL(n,\mathbb{R}) est un ouvert dans {\mathcal M}_n(\mathbb{R}). En effet c'est l'image réciproque de l'ouvert \mathbb{R}^* par l'application continue déterminant

\det\;:\;\; {\mathcal M}_n(\mathbb{R}) \;\rightarrow\;\mathbb{R}.

On peut même dire un peu plus : le déterminant étant polynômial en x_{11},x_{12},\dots,x_{nn} le complémentaire des matrices inversibles, c'est-à-dire l'ensemble des matrices de déterminant nul,

\mathcal{A}\; =\; {\mathcal M}_n(\mathbb{R}) \:\backslash\:GL(n,\mathbb{R})

est une hypersurface algébrique. Géométriquement parlé \mathcal{A} est un fermé de {\mathcal M}_n(\mathbb{R}) qui ressemble localement à un hyperplan (c'est-à-dire à un sous-espace affine de dimension -1). Enfin, cela est vrai en presque tous les points, ceux où la différentielle du déterminant ne s'annulle pas (points réguliers). En revanche, en les points où la différentielle du déterminant est nulle (points singuliers), l'hypersurface \mathcal{A} ne ressemble plus à un sous-espace affine. Il peut y avoir un croisement comme par exemple

algebraische Fläche, surface algébrique

ou un rétrécissement comme par exemple

Algebraische Flächen

(Pour plus d'images de surfaces algébriques visitez le la galerie de Herwig Hauser.)

Il est évident que la différentielle du déterminant est nulle à l'origine. Donc notre hypersurface {\mathcal A} possède une singularité à l'origine. Le résultat suivant dit qu'il s'agit d'une singularité de type rétrécissement, car l'hypersurface de dimension n²-1 y perd quelques dimensions — il y reste juste assez de place pour n²-n dimensions...

Proposition :

Le nombre -n est la plus grande dimension possible d'une sous-variété différentiable F de \mathcal{M}_n(\mathbb{R}) telle que 0\in F\subset {\mathcal M}_n(\mathbb{R}) \backslash GL(n,\mathbb{R})\,.
Démonstration :
  • L'ensemble des matrices dont la première ligne est nulle est un sous-espace vectoriel (et donc en particulier une sous-variété différentielle) de dimension n²-n. Evidemment il contient l'origine 0 et est contenu dans \mathcal{A}.

  • Soit F une sous-variété de {\mathcal M}_n(K) de dimension -n+1 et telle que 0\in F. Nous allons prouver que F contient une matrice inversible.
    Au voisinage de l'origine la sous-variété F est décrite par un système de n-1 équations
    f_j(x_{11},x_{12},\ldots,x_{nn})=0\,,\;\;\;j=1,\,\ldots\,,n-1,
    tel que les différentielles df_j sont linéairement indépendantes à l'origine. On résoud ce système par le théorème des fonctions implicites, c'est-à-dire on peut isoler (théorétiquement) n-1 des coordonnées et les exprimer par les autres. On a ainsi, toujours au voisiange de l'origine, n²-n+1 coordonnées variables et n-1 coordonnées isolées (fonctions différentiables des coordonnées variables).
    Maintenant je peux poursuivre mon raisonnement de la preuve du cas affine : par des permutations de lignes et de colonnes je m'arrange à ce que les coordonnées isolées soient toutes au-dessus de la diagonale matricielle ; puis je prends les coordonnées sur la diagonale toutes égales à un nombre \epsilon non-nul et proche de 0 et les autres coordonnées variables égales à 0. Ainsi j'obtiens une matrice inversible qui est dans F.

Pourquoi ne pas lire aussi :


Multiplicateurs de Lagrange

En économie, physique, ingénierie, on enseigne la méthode des multiplicateurs de Lagrange : Si P est un extrémum d'une fonction f de n variables x1, ... ,xn sous m contraintes données par g1(x1,...,xn)=0, ... , gm(x1,...,xn)=0, alors il existe des réels λ1, ... ,λm tels que

grad f(P) = λ1 grad g1(P) + ··· + λm grad gm(P).

Généralement, lorsqu'on enseigne ce théorème à des non-matheux, il est préférable de ne pas faire la démonstration en toute généralité. D'habitude je me contente d'expliquer deux cas particuliers où on "voit" géométriquement ce qui se passe :

  • n=3 et m=1. Grâce à la règle de dérivation d'une fonction composée, on montre que les gradients de f et g en P sont orthogonaux au plan tangent à la surface décrite par g(x,y,z) = 0. Donc ces gradients sont colinéaires.

  • n=3 et m=2. De même, on montre que les gradients de f, g1 et g2 en P sont orthogonaux à la tangente à la courbe décrite par g1(x,y,z) = g2(x,y,z) = 0. Ils sont donc coplanaires.

Concernant une application de ce théorème j'ai une question à laquelle vous savez peut-être répondre.

Y a t-il un exemple élémentaire mais non trivial? L'exemple classique de minimisation de coût lorsqu'on construit une boîte rectangulaire dont le volume est fixé et dont le couvercle coûte, au cm2, le double des autres côtés n'est pas vraiment intéressant; en effet, on peut isoler l'une des variables dans l'équation de la contrainte et se ramener à une fonction de deux variables indépendantes.

Question autour d'une singularité essentielle et le théorème de Picard

A la fin de mon article Hyperelliptic action integral, Annales de l'institut Fourier 49(1), p. 303–331, j'ose la conjecture suivante:

Une conjecture autour d'une singularité.
Soit D le disque unité du plan complexe et U_1,U_2,\,\dots\,,U_n un recouvrement du disque épointé D*= D\{0} par des ouverts. Sur chaque ouvert U_j soit f_j une fonction holomorphe injective telle que df_j=df_k sur toutes les intersections U_j\cap U_k. Alors ces différentielles se recollent en une 1-forme méromorphe sur D.

Il est clair que la 1-forme est holomorphe sur D*. Si son résidu est nul, alors la conjecture découle facilement du grand théorème de Picard, cité ci-dessous. Mais si le résidu est non-nul, je ne sais pas la démontrer.
Toute preuve ou tout contre-exemple sont les bienvenus — à vrai dire les contre-exemples un peu moins car je crois (guidé par mon intuition géométrique des surfaces de Riemann) que cette conjecture est vraie...

En 1880 Charles Emile Picard (1856-1941) prouva le théorème suivant.

Grand théorème de Picard.
Une fonction holomorphe ayant une singularité essentielle prend, sur tout voisinage de cette singularité, tout nombre complexe une infinité de fois comme valeur, sauf peut-être un.

Exemple typique pour le théorème de Picard

La fonction définie par
\:f(z)=e^{1/z}=\sum_{k=0}^{\infty}\:\frac1{k!z^k}\;

est holomorphe sur \mathbb{C}\backslash0 et possède une singularité essentielle en 0. L'image de f épargne-t-il une valeur (Picard dit "sauf peut-être un")? Oui, et comme f(z)\neq0 pour tout z\in\mathbb{C}\backslash0, cette valeur épargnée est forcément zéro; le théorème affirme alors que pour tout nombre complexe w\neq0 et pour tout \epsilon>0 il existe une infinité de nombres complexes z tels que 0<|z|<\epsilon et f(z)=w.

Calcul direct avec cet exemple

Dans l'exemple ci-dessus on peut se debrouiller par un calcul direct sans invoquer le théorème de Picard. En effet, fixons un nombre complexe non-nul w et un \epsilon>0. Il existe alors deux réels r>0 et \varphi tels que
w=re^{i\varphi}.

Pour tout n \in \mathbb{N} posons u_n=\ln r+i(\varphi+2\pi n) et z_n=1/{u_n}. Alors \lim_{n\to\infty}z_n=0.
Ainsi on a on a
f(z_n)=e^{u_n}=e^{\ln r+i(\varphi+2\pi n)}=re^{i \varphi}=w.

Par conséquence, en prenant n assez grand, on voit que w possède une infinité d'antécédents dans le disque épointé 0<\,|z|\,<\epsilon.

Un exemple moins évident

Notons P l'ensemble des nombres premiers et considérons la fonction définie par
 
g(z)=\sum_{p \in P}^{}\frac{1}{p!z^p}.

On peut appliquer le théorème de Picard, car il y a une singularité essentielle à l'origine.
En revanche, il me semble impossible de faire un calcul explicite...

Utiliser un grand canon pour un moineau

Récemment en colle d'arithmétique j'ai posé la question suivante :

Soient x, y, z trois entiers vérifiant

x^3 + y^3 = z^3\,.

Montrer qu’au moins un parmi eux est divisible par 3.

La solution que j'attendais de l'élève n'est pas compliquée (faire une preuve par l'absurde en étudiant l'équation modulo 9) mais depuis 1994 cette question classique semble devenue obsolète — enfin, je ne sais pas vraiment car je ne comprends pas la preuve du théorème de Wiles-Fermat... Qui peut donc m'éclaircir et me dire si la preuve de Wiles utilise ou non le résultat de cette innocente question de colle ?

Explication pour les non-matheux

Dans le 17ème siècle Pierre de Fermat écrivit sur la marge d'un livre que si n est un nombre entier strictement plus grand que 2 alors il n'existe pas de nombres entier non-nuls x, y, z vérifiant

x^n + y^n = z^n\,.

Il ne donna pas de preuve et écrivit seulement J’ai trouvé une merveilleuse démonstration de cette proposition, mais la marge est trop étroite pour la contenir.
Pendant 300 ans les mathématiciens ont cherché une preuve de cette conjecture de Fermat, mais en vain. C'est seulement en 1994 qu'Andrew Wiles a réussi de la prouver ! Désormais la conjecture de Fermat est devenu le théorème de Fermat-Wiles. Sa preuve utilise des techniques très avancées. On est convaincu aujourd'hui que la preuve mentionnée par Fermat, celle qui était trop longue pour la marge, était eronnée.

Si on utilise le théorème de Fermat-Wiles la question de colle devient trivial. En effet, si trois entiers vérifient l'équation, alors au moins un parmi eux est nul et donc divisible par 3.

Pour revenir à l'histoire de ce théorème : à mon avis elle est typique à plusieurs titres pour la recherche en mathématiques :

  • D'abord l'équation de Fermat est une généralisation d'une autre que tout le monde connaît, à savoir l'équation de Pythagore a²+b²=c². Il existe des entiers non-nuls qui la vérifient, par exemple 3²+4²=5² ; c'est-à-dire on peut construire un triangle rectangle de côtés entiers.
  • L'énoncé du théorème de Fermat-Wiles est tellement simple que tout collégien peut le comprendre mais sa démonstration est tellement difficile que seulement quelques spécialistes la comprennent.
  • L'énoncé n'a aucune application dans les sciences et ne possède, à ma connaissance, même pas de conséquences importantes en mathématiques. Son seul intérêt est sa beauté.
  • Des générations de mathématiciens ont cherché à prouver cette conjecture. Ils l'ont fait pour l'honneur de l'esprit humain, sans penser à des applications, mais les outils mathématiques qu'ils ont développés ont fait avancer toute la science.
  • Les ordinateurs ne peuvent jamais démontrer une telle conjecture car il faudrait tester l'équation sur une infinité de nombres ; ils peuvent seulement la rendre plausible.

Conseils aux étudiants pour une bonne rédaction

Souvent les étudiants en première année ont une idée intuitive pour une preuve mais lorsqu'ils l'écrivent avec les termes de la logique mathématique leur rédaction est très maladroite, voire fausse ou illisible. Ces lignes leur sont destinées. Je vais montrer sur des exemples très simples ce qu'il faut faire et ce qu'il faut éviter.

Syntaxe d'une assertion

Une assertion (ou proposition) mathématique est une phrase contenant un verbe. Les verbes mathématiques sont par exemple

=\;\;\;<\;\;\;>\;\;\;\leq\;\;\;\geq\;\;\;\subset\;\;\;\supset\;\;\;\in\;\;\;\ni\;\;\;\Rightarrow\;\;\;\Leftarrow\;\;\;\Leftrightarrow\;\;\;\perp\;\;\;\parallel

et leurs négations. Par exemple

7 + 1 = 8

est une assertion (qui est vraie), et

1 < 0

est une assertion (qui est fausse). Mais

7+1

n'est pas une assertion car elle ne contient pas de verbe, donc on ne peut pas se demander si elle est vraie ou fausse. Entre deux assertions équivalentes on n'écrit pas = mais le symbole \Leftrightarrow. Ce symbole étant lui-même un verbe c'est donc un emboîtement d'assertions (pensez aux poupées russes).
Ecrire
1 \leq x \leq 5\;\;\Leftrightarrow\;\; [1,5]
n'a aucun sens car [1,5] n'est pas une assertion (c'est un intervalle). En revanche, on peut écrire
1 \leq x \leq 5\;\;\Leftrightarrow\;\; x\in [1,5].

Il ne suffit pas de mettre un verbe pour avoir une assertion, il faut aussi que la syntaxe soit correcte. Par exemple écrire \{7\}\in\mathbb{N} et 7\subset\mathbb{N} n'ont pas de sens. Mais \{7\}\subset\mathbb{N} et 7\in\mathbb{N} sont des assertions (qui sont vraies d'ailleurs).
Le langage mathématique suit les mêmes règles que notre langage habituel (phrase principale, phrase relative, conjonctions,...). Si quelqu'un vous disait
Nous ¤ camping # faisez ((à pluie sec
pouvez-vous dire qu'il dit la vérité ou non ? Non, vous ne pouvez pas ! Or c'est précisément ce que certains étudiants écrivent sur leurs copies de mathématiques : des juxtapositions de symboles qui ne donnent aucun sens. Et donc nous, les correcteurs, ne pouvons pas donner de point pour ce charabia.
Les symboles ne sont que des raccourcis d'écriture. Vous devriez être capables de rédiger sans eux. Si la traduction en langage français de ce que vous écrivez à l'aide de symboles n'a pas de sens, alors il y a un problème.

Introduire les objets avant leur utilisation

Ne faites jamais apparaître un objet sans l'introduire. Par exemple n'écrivez pas

x^2-6x+5=0\;\;\Leftrightarrow\;\; S=\{1,5\}.

Peut-être votre enseignant au lycée vous a donné cette mauvaise habitude, mais la lettre S n'est pas universellement reconnue pour désigner l'ensemble de solutions d'une équation. Il faut donc faire précéder par une petite phrase comme : Notant S l'ensemble de solutions de l'équation x²-6x+5=0 on obtient... Mais cela est bien lourd. Ecrivez donc plus simplement
x^2-6x+5=0\;\;\Leftrightarrow\;\; x\in\{1,5\}.

Exemples de bonne syntaxe

Les théorèmes 1, 2 et 3 ci-dessous sont des assertions. Les deux premiers sont équivalents ; et chacun d'entre eux implique le troisième.

Théorème 1.  Soit a\in \mathbb{R}. Alors la fonction f définie par f(x)=ax pour tout réel x est strictement croissante sur \mathbb{R} si et seulement si a > 0.
Théorème 2.  Pour tout réel a la fonction f définie par f(x)=ax pour tout réel x est strictement croissante sur \mathbb{R} si et seulement si a > 0.
Théorème 3.  Si a > 0 est un réel alors la fonction f définie par f(x)=ax pour tout réel x est strictement croissante sur \mathbb{R}.
La preuve du théorème 2 devrait commencer comme suit.
Preuve du théorème 2.  Soit a un réel. Blabla...
Evidemment on aurait pu écrire soit b un réel et continuer à travailler avec ce b. Ca serait tout à fait correct car dans le théorème 2 le réel a est une variable locale car précédé par le quantificateur \forall. Ecrire soit a un réel ou soit b un réel revient à fixer ce réel ce qui en fait une variable globale pour la suite du raisonnement.
C'est le moment de mentionner une subtilité. Le théorème 1 commence par soit a un réel. De ce fait a est déjà fixé (une variable globale) dans le théorème 1 et ça serait inutile et même faux de commencer la preuve par dire soit a un réel. Il est déjà donnée et nous devons travailler avec lui et pas avec un autre a ni un autre b.

Mauvaise rédaction de la preuve

Preuve du théorème 2 (version débutant).
Soit a un réel. Supposons a > 0. Il faut montrer que pour tous réels x, y tels que x < y on a f(x) < f(y). Or x < y et a > 0 entraînent ax < ay ou encore f(x) < f(y). Donc f est strictement croissante.
Réciproquement supposons que f est strictement croissante, c'est-à-dire pour tous réels x, y tels que x < y on a f(x) < f(y). On voit sur l'inégalité ax < ay que a doit être forcément positif, sinon l'inégalité devrait être dans l'autre sens.
Trois erreurs :
  • On voit sur l'inégalité ax < ay .... Or les symboles x et y n'ont pas été introduits précédemment. Il fallait écrire soit x et y....
  • La fin du raisonnement devrait être... n'est pas clair.
  • Le débutant écrit il faut montrer que... puis il donne la définition d'une fonction strictement croissante. Or redonner une définition tellement basique c'est presqu'un insulte vis-à-vis du correcteur ! Evitez de redonner des définitions que tout le monde connaît et n'écrivez pas ce que vous voulez démontrer si c'est déjà écrit clairement dans l'énoncé.
    En revanche, si ce que vous allez démontrer est une reformulation équivalente ou seulement une condition nécessaire pour la proposition que vous cherchez à prouver alors il est souhaitable que vous écrivez "je vais démontrer ceci...". Par exemple c'est une bonne idée d'écrire : Soit a > 0. Pour montrer que la fonction définie par f(x)=ax pour tout réel x est strictement croissante sur R je vais prouver que sa dérivée est strictement positive.

Bonne rédaction

Preuve du théorème 2 (version de l'étudiant expérimenté).
Soit a un réel.
Supposons a > 0. Soient x, y deux réels tels que x < y. Alors on a
f(x) = ax < ay = f(y). Cela prouve que f est strictement croissante.

Réciproquement supposons f strictement croissante. Alors l'inégalité 0 < 1 entraîne l'inégalité f(0) < f(1). Cela prouve que a = f(1) > f(0) = 0.

Structure d'une preuve

Exemple de structure d'une preuve bien rédigée :

Enoncé.  Soient A et B des ensembles et f une application de A dans B. Montrer que si on a l'hypothèse (H) ... alors f est injective.
Preuve.
Supposons (H). Soient x et y deux éléments de A tels que f(x) = f(y) ......
...... (je raisonne) ...... j'utilise la propriété (H) ...... (je raisonne) ...... j'obtiens x = y.
Cela prouve l'injectivité de f.
Autrement dit, vous introduisez deux éléments x et y qui vérifient l'égalité f(x) = f(y), puis vous gardez en tête que vous voulez arriver à l'égalité x = y. Si vous voulez vous pouvez l'écrire x = y en bas de votre page pour savoir où vous voulez arriver. Mais surtout ne l'écrivez pas plus tôt car c'est votre but et non votre point de départ ! Sur le chemin du raisonnement vous devez, très probablement, utiliser la propriété (H).
Preuve alternative (par contraposition).
Supposons (H). Soient x et y deux éléments distincts de A ......... (je raisonne) ........
........ j'utilise la propriété (H) ........ (je raisonne) ........ je trouve que f(x) est différent de f(y). Cela prouve l'injectivité de f.

Autre conseil

Mon collègue et ami Laurent Kaczmarek a écrit des conseils de rédaction utiles concernant la notation des fonctions en analyse.

Germe de fonction infiniment dérivable

Actuellement je traverse la Corse à vélo, et aujourd'hui lors d'une montée raide je pensais à un problème de souplesse. Comme nous le savons les fonctions infiniment dérivables sont beaucoup plus souples que les fonctions analytiques. Par exemple on peut se poser la question suivante sur la donnée des dérivées successives en un point :

Existe-t-il une fonction f de classe \mathcal{C}^\infty telle que pour tout naturel n,

f^{(n)}(0)=n^{n^n}\;\;?

Thalès ou non Thalès?

En France le théorème de Thalès désigne une version géométrique de la règle de trois ou règle de proportionnalité ; d'ailleurs en allemand on l'appelle Strahlensatz ce qui signifie théorème des rayons, et on réserve le nom Satz von Thales aux cercles de Thalès. Il y a déjà deux ans j'ai posé ici un petit problème de géométrie dont la solution utilise la géométrie projective (elle se trouve ici voir page 3).

Recemment un étudiant, spécialiste de Thalès, m'a donné la réponse suivante: Notons A le premier poteau, B le second et O le point sur la route qui se trouve à l'horizon. Alors le troisième poteau C est déterminé par l'équation OA/OB = OB/OC.
Voici une belle question de géométrie élémentaire : Cette réponse est-elle correcte?

Concevoir la notion d'application

Je me rappelle qu'au début de mes études de mathématiques, parfois une simple question de formalisme pouvait me poser des problèmes. Par exemple, j'avais du mal à jongler entre différents points de vue d'une notion a priori simple comme celle d'application. Voici quelques lignes qui pourraient sembler bêtes aux initiés, mais comme les livres expliquent rarement ce genre de choses en détail elles peuvent être utiles à ceux qui y sont confrontés pour la première fois — et notamment aux élèves et étudiants d'aujourd'hui qui, lors de leur parcours scolaire, ne rencontrent plus assez de théorie des ensembles.


Considérons une application (synonyme de fonction) d'un ensemble X dans un ensemble Y.

f\;:\; X \;\longrightarrow \;Y\,,\;\; x \; \longrightarrow\;f(x)\,.

(Désolé, la deuxième flèche devrait commencer par un pied mais mon plug-in LaTeX ne le permet pas.)

Si vous venez de passer le bac, vous avez déjà une notion intuitive de ce que c'est une application. Mais les mathématiciens possèdent plusieurs autres points de vue pour concevoir cet objet — et chacun a sa raison d'être.

  1. Point de vue y en fonction de x.
    C'est le point de vue habituellement enseigné au collège et au lycée. On conçoit x comme variable et y comme l'image qui change en fonction de x.
    Le schéma mental est le suivant.

    dessiner le graphe d'une fonction, comprendre les fonctions

    L'ensemble de départ X est représenté horizontalement, l'ensemble d'arrivée Y est représenté verticalement. La donnée de l'application f revient à la donnée de son graphe \Gamma \subset X\times Y constitué des couples (x,f(x)), où x parcourt X.
    En disant x parcourt X, on adopte donc bien l'idée que la variable est x.
     
  2. Point de vue collection d'éléments de Y.
    On peut aussi écrire l'application f en forme de famille (f(x))_{x\in X}. On oublie donc de spécifier l'ensemble d'arrivée Y.
    En général, une famille (y_j)_{j\in J} dans Y n'est rien d'autre qu'une application

    y\;:\; J \;\longrightarrow \;Y\,,\;\; j \; \longrightarrow\;y_j\,,

     
    où l'ensemble de départ J est appellé l'ensemble d'indices ; très souvent il n'a pas d'importance et peut être remplacé par un autre ensemble de même cardinal. Ce qui compte dans ce point de vue c'est simplement la collection des images de l'application.
    Dans certaines situations un bon choix de l'ensemble d'indices peut raccourcir les écritures. Par exemple, si (b_j)_{j\in J} est une base d'un K-espace vectoriel E, alors tout vecteur v de E se décompose comme combinaison linéaire

    v=\sum_{j\in J} \lambda_j\, b_j\:,

    (\lambda_j)_{j\in J} est une famille de scalaires presque tous nuls (c'est-à-dire l'application \lambda\;:\; J \;\longrightarrow \;K\, est nulle sauf en un nombre fini de points ; cela est nécessaire pour pouvoir prendre la somme). Mais si on conçoit la base non comme une famille de vecteurs mais comme un sous-ensemble B de l'espace E, alors on peut la prendre elle-même comme ensemble d'indices et écrire simplement

    v=\sum_{b\in B} \lambda_b\, b\:.


     
  3. Point de vue les fibres en fonction de y.
    Pour chaque y dans Y on appelle fibre de f en y (ou ensemble de niveau y) l'ensemble de tous les antécédents de y, noté
     
    f_y\;=\;f^{-1}(\{y\:\})\:=\:\{\:x\in X\; :\; f(x)=y\:\} \,.

     
    Connaître une application revient à connaître la collection de ses fibres. C'est donc y qu'on considére comme variable. On s'aide du schéma mental suivant.
     

    représenter une fonction graphiquement, comprendre une fonction


    L'espace de départ est projeté sur l'espace d'arrivée. L'application est injective (resp. surjective resp. bijective) si et seulement si chaque fibre possède au plus (resp. au moins resp. précisément) un élément.
     
Une conséquence naturelle du point de vue des fibres est la factorisation canonique, que nous allons expliquer ci-dessus et dont la quintessence se résume ainsi :
L'ensemble des fibres non-vides d'une application est une partition de l'ensemble de départ et a le même cardinal que l'image de l'application.

Factorisation canonique

Nous nous proposons de montrer que toute application est la composée d'une surjection, d'une bijection et d'une injection. Soit donc f une application de X vers Y. On considère son image

\tilde{Y} = f(X)\:\subset\:Y

et l'espace des fibres

\tilde{X} = \{\,f^{-1}(\{y\})\:|\: y\in \tilde{Y}\,\}\:\subset\:{\scr P}(X).

Ainsi l'espace des fibres est le quotient de X par la relation d'équivalence  ~  qui est définie par  x ~ x'  si et seulement si f(x) = f(x'). Il est clair que \tilde{X} et \tilde{Y} sont en bijection. Plus précisément il existe une surjection \pi, une bijection \tilde{f} et une injection j tel que le diagramme suivant commute.

Factorisation canonique d'une fonction, comment comprendre les applications

En effet, il suffit de prendre pour \pi la projection canonique sur le quotient X/~, c'est-à-dire l'application qui à chaque x dans X associe la fibre de f en f(x) ; puis pour j l'injection naturelle, et enfin pour \tilde{f} l'application qui envoie une fibre sur l'unique élément dans Y qui est son image par f. Il est alors évident que f est la composée

f= j\circ \tilde{f}\circ \pi.

Un avant-goût de la suite

Concevoir une application comme la collection de ses fibres est très fréquent en topologie, géométrie algébriques et théorie des singularités. On fait varier un point dans l'espace d'arrivée pour observer, dans l'espace de départ, la manière dont varie la fibre au-dessus de ce point. Un exemple très basique est l'application

f\;:\; \mathbb{R}^3 \;\longrightarrow \;\mathbb{R}\,,\;\; (x,y,z) \; \longrightarrow\;ax+by+cz\,,

 
a,b,c sont des réels fixés non tous nuls. La collection des fibres est constituée de plans parallèles. Il s'agit donc d'un feuilletage de l'espace \mathbb{R}^3 par plans (comme un feuilleté). Les fibres se ressemblent toutes ; on a même ce qu'on appelle une fibration globalement triviale.

Plus généralement, si f est une fonction différentiable et si on fait varier le point dans l'espace d'arrivée sans toucher les valeurs critiques, alors localement les fibres se ressemblent toutes (fibration localement triviale). En revanche, si on passe par une valeur critique alors la nature des fibres peut changer. Par exemple si on traverse la valeur critique 0 de l'application

g\;:\; \mathbb{R}^2 \;\longrightarrow \;\mathbb{R}\,,\;\; (x,y) \; \longrightarrow\;x^2+y^2\,,

dans le sens décroissant, alors la fibre est d'abord un cercle, puis dégénère en un point et, enfin, devient vide — une catastrophe a lieu au sens de la théorie des catastrophes de René Thom.

Tout ça devient plus intéressant dans le complexe. Les fibres de

g\;:\; \mathbb{C}^2 \;\longrightarrow \;\mathbb{C}\,,\;\; (x,y) \; \longrightarrow\;x^2+y^2\,,

sont des surfaces réelles (courbes complexes ou surfaces de Riemann). Et au lieu de traverser la valeur critique 0, on peut la contourner avec un petit lacet dans le plan complexe et observer la déformation de cette surface le long du lacet. Evidemment à la fin on retrouve la même surface qu'au début du lacet, mais lors du trajet certaines caractéristiques se sont déplacés continûment et ont échangés leurs places... (monodromie).

Multiples et diviseurs

Dans ce qui suit tous les nombres sont des nombres naturels :  0, 1, 2, 3, 4, ...

Multiples

Définition.  Les multiples d'un nombre n sont les nombres 0, n, 2n, 3n, 4n, ...

Exemples :

  • Les multiples de 2 sont 0, 2, 4, 6, 8, ...
  • Les multiples de 3 sont 0, 3, 6, 9, 12, ...
  • Les multiples de 4 sont 0, 4, 8, 12, 16, ...

On appelle les multiples de 2 aussi nombres pairs. Les non-multiples de 2 sont 1, 3, 5, 7, ... et sont appelés nombres impairs.

Notre définition donne les multiples en forme d'une liste. Mais qu'est-ce qui signifient vraiment les trois petits points dans la liste 0, n, 2n, 3n, 4n, ... ? En fait, on peut écrire les trois points car tout le monde comprend comment on doit continuer la liste : après 4n, il y a 5n, puis 6n, et de suite. Autrement dit, on a la règle suivante.

Règle 1.  Un nombre m est un multiple de n si et seulement s'il existe un k tel que m = kn.

Par exemple, le nombre m=24 est multiple du nombre n=4 car 24=k×4 avec k=6.

Il est important que ce k soit aussi un nombre naturel, comme m et n. En effet, on n'a pas le droit de dire la phrase suivante : Le nombre 3 est multiple 4 car 3=k×4 avec k=¾.

Règle 2.  Zéro est multiple de tout nombre. Tout nombre est multiple de soi-même.

Preuve : Soit n un nombre choisi. Le nombre 0 est le premier élément de la liste de multiples de n — on l'obtient en prenant k=0. Et n est le deuxième élément dans cette liste — on l'obtient en prenant k=1.

Cas particuliers :

  • Les multiples de 1 sont 0, 1, 2, 3, 4, ..., c'est-à-dire, tout nombre est multiple de 1.
  • Les multiples de 0 sont 0, 0, 0, 0, 0, ..., c'est-à-dire, zéro n'a que lui-même comme multiple.

Dans les exemples on voit que la liste des multiples de 4, à savoir 0, 4, 8, 12, ..., est contenue dans la liste des multiples de 2. Si on y réfléchit un peu ce n'est pas très étonnant et nous allons le formuler comme une règle général :

Règle 3.  Si m est multiple de n et si n est multiple de p alors m est aussi multiple de p.

Preuve :  Si m est multiple de n on peut l'écrire comme m = kn ;  et si n est multiple de p on peut l'écrire comme n = k'p. Alors on a m = kn = kk'p ce qui prouve que m est multiple de p.

Exemples :

  • 6 est multiple de 3, donc tout multiple de 6 est aussi multiple de 3.
    La réciproque n'est pas vraie, par exemple, 9 est multiple de 3 mais pas de 6.
  • Tout multiple de 12 est aussi un multiple de 3 et de 4 et de 2.
    C'est vrai car 12 est multiple de 3 et de 4 et de 2.

Diviseurs

Beaucoup d'affirmations que nous disons dans notre langage de tous les jours, dépendent de notre point de vu. Par exemple, les deux phrases

Zoé est la fille d'Alexandre  et  Alexandre est le père de Zoé
signifient la même chose, mais de points de vue différents. C'est cette diversité qui donne de la richesse à notre langue ! En mathématiques aussi il y a des manières différentes pour exprimer une même chose ; c'est utile, pas pour une question de style, mais car en maths le changement du point de vue est souvent un outil très puissant (voir un exemple dans cet article).

Définition.  Si m est un multiple de n on dit aussi que m est divisible par n ou que n divise m ou que n est un diviseur de m.

Autrement dit, n divise m si et seulement s'il existe k entier tel que m = kn.
L'équation m = kn équivaut à k = m/n. Ainsi n divise m si et seulement si la fraction m/n est un entier (si n est non-nul).

Notation.  Pour dire n divise m on écrit souvent n | m.

Exemples

  • 5 | 15.
    On dit 5 divise 15 ou 5 est un diviseur de 15 ou 15 est divisible par 5 ou 15 est un multiple de 5.
  • 3 | 15.

Les affirmations suivantes se déduisent directement de ce que nous avons déjà compris sur les multiples.

  • Tout nombre divise 0 car 0 est multiple de tout nombre.
    En écriture mathématique, n|0 car 0 = 0 × n.
  • Tout nombre divise soi-même car tout nombre est multiple de soi-même.
    Ou encore, n|n car n = 1 × n.
  • 1 divise tout nombre car tout nombre est multiple de 1.
    Ou encore, 1|n car n = n × 1.

Règle 4.  Si p|n et si n|m alors p|m. Par exemple, 15|30 et 30|3000 donc 15|3000.

Preuve :  C'est une traduction directe de la règle 3.

Question :  Qu'est-ce qui est plus grand, multiple ou diviseur ?

Réponse :  Mise à part le multiple 0, les multiples d'un nombre sont plus grands que ses diviseurs.
Par exemple, les multiples non-nuls de 12 sont 12, 24, 36, .... Les diviseurs de 12 sont 1, 2, 3, 4, 6, 12.

Question :  Qui sont plus nombreux, les multiples d'un nombre donné ou ses diviseurs ?

Réponse :  Un nombre non-nul possède une infinité des multiples mais seulement un nombre fini de diviseurs.
En effet, pour n non-nul, la liste des multiples de n est 0, n, 2n, 3n, ... C'est une liste infinie avec des nombres de plus en plus grands. En revanche, le plus grand diviseur de n est n lui-même, donc n possède un nombre fini de diviseurs qui se trouvent parmi les nombres 1, 2, 3, ..., n.

Trouver tous les diviseurs d'un nombre donnée n'est pas facile si ce nombre est grand. Donc il est pratique de disposer de quelques critères de divisibiltés. Ca sera l'objet du prochain billet. Finissons ce billet avec un énoncé simple et sa preuve. Ca sera l'occasion de voir le formalisme des multiples en action.

Théorème.  Un nombre entier est pair si et seulement si son carré est pair.

Preuve du théorème.  Fixons un nombre entier n au hasard et prouvons le théorème pour ce nombre. (Le mathématicien dit pour cela soit n un entier.) Alors il y a deux cas possibles : soit n est pair, soit n est impair.
Supposons d'abord que n est pair. Alors il existe un entier k tel que n=2k. Ainsi n2=4k2 ce qui prouve que n2 est un multiple de 4, et donc en particulier un nombre pair. On vient de prouver que si un nombre est pair alors son carré aussi.
Supposons maintenant que n est impair. Alors il existe un entier k tel que n=2k+1. Donc n2=(2k+1)2=4k2+4k+1, et comme les deux premiers termes de cette somme sont pairs on en déduit que n2 est impair. On vient de prouver que si un nombre est impair alors son carré aussi.
Or un nombre entier est soit pair soit impair ; donc en fait on a prouvé lé théorème.

Remarque.  Le théorème peut aussi s'énoncer comme suit : un entier est impair si et seulement si son carré est impair.

Exercices.  Les quatre exercices suivants sont faciles. Il faut simplement imiter la démonstration du théorème.

  1. Montrer qu'un entier est multiple de 3 si et seulement si son carré l'est.
  2. Montrer qu'un entier est pair si et seulement si son cube l'est.
  3. Est-il vrai qu'un entier est multiple de 4 si et seulement si son carré l'est ?
  4. Est-il vrai qu'un entier est multiple de 3 si et seulement si son cube l'est ?

Quelques blagues pour matheux

Ajourd'hui quelques lignes pour illustrer que le cerveau n'est pas le seul organe actif des matheux...

Comment "le font"-ils ?
  • Les topologistes le font discrètement.
  • Les topologistes le font de manière ouverte.
  • Les topologistes le font avec du caoutchouc.
  • Les couples de topologistes le font en se rendant connexes.
  • (les logiciens le font) ou NON (les logiciens le font).
  • Les algébristes le font en groupe ou en anneau.
  • Les algébristes le font avec leur corps.
  • Les algébristes le font associativement.
  • Les algébristes le font en s'inversant.
  • Les algébristes le font en se multipliant.
  • Les analystes le font continûment.
  • Les analystes le font sur un support compact.
  • Les experts en théorie de la mesure le font presque partout.
  • Les experts en équations différentielles le font suivant les conditions initiales.
  • Les experts en théorie des ensembles le font avec application.
  • Les experts en combinatoire le font de toutes les manières possibles.
  • Les mathématiciens le font une infinité de fois s'il peuvent le faire une fois et ensuite une fois de plus.
Comment "le faisaient" les grands ?
  • Cantor le faisait en diagonale.
  • Fermat essayait de le faire dans la marge mais n'avait pas assez de place.
  • Galois l'a fait la nuit juste avant.
  • Möbius le faisait toujours du même côté.
  • Klein l'avait simultanément dedans et dehors.
  • Cauchy le faisait avec un ami (Schwarz, Lipschitz, Riemann).
  • Markov le faisait à la chaîne.
  • Archimède le faisait dans sa baignoire.
  • Newton tomba dans les pommes.
  • Bourbaki le faisait dans un cas particulier du théorème 10.2.5 en utilisant subtilement le lemme 7.3.2.

Deux contrepèteries

  • Nul n'est jamais assez fort pour ce calcul !
  • Mon prof de maths a montré Bézout.

Une réciproque
The duchess: "Excuse me that I am late, but I was so fucking busy and vice versa."

Recommandation bibilographique : Ces blagues m'ont été envoyées par email au fil des années. Mais il existe même des livres sur ce sujet. Le lecteur qui souhaite s'y approfondir se plonger avec profit dans l'ouvrage de référence Je fais des maths comme un(e) cochon(ne) de Gérard-Olivier Maitry publié en 2008.

Fibres d'une application complexe

Hier Pierre Lecomte a posé dans son blog un exercice sur des angles et la cotangente qui m'a inspiré la généralisation complexe suivante.

Notons

A :=\left\{ (\alpha,\beta,\gamma)\in(\mathbb{C}\setminus\pi\mathbb{Z})^3\;|\; \alpha+\beta+\gamma\in\pi\mathbb{Z}\right\}.

Question:
Déterminer les fibres de l'application f\: :\; A\: \to \: \mathbb{C}^3 définie par

f(\alpha,\beta,\gamma)=(\cot\beta\cot\gamma,\,\cot\alpha\cot\gamma,\,\cot\alpha\cot\beta).

Réponse:
Soit H est l'hyperplan de C3 d'équation u+v+w=1 et Dk, k=1,2,3, les droites

D_1=(1,0,0)+\mathbb{C}(0,1,-1), \;\;D_2=(0,1,0)+\mathbb{C}(1,0,-1), \;\;D_3=(0,0,1)+\mathbb{C}(1,-1,0).

Notons D'1=D1\{(1,0,0)}, D'2=D2\{(0,1,0)}, D'3=D3\{(0,0,1)} les droites épointées. Alors l'image de f est

f(A)=H\setminus(D'_1\cup D'_2\cup D'_3).
Les fibres de f en les points (1,0,0),(0,1,0) et (0,0,1) sont une union dénombrable de plans complexes (desquels on a enlevé des points isolés), tandis que la fibre en tout point de H\setminus(D_1\cup D_2\cup D_3) est discrète. Plus précisément, la restriction de f à f^{-1}(H\setminus(D_1\cup D_2\cup D_3)) est un revêtement au-dessus H\setminus(D_1\cup D_2\cup D_3).

Preuve:
D'abord nous remarquons que la formule d'addition

\cot(\alpha+\beta)=\dfrac{\cot\alpha\cot\beta-1}{\cot\alpha+\cot\beta}

peut s’écrire aussi comme \cot\beta\cot(-\alpha-\beta)+\cot\alpha\cot(-\alpha-\beta)+\cot\alpha\cot\beta=1. Cela signifie que pour tout (\alpha,\beta,\gamma)\in(\mathbb{C}\setminus\pi\mathbb{Z})^3 on a

\cot\beta\cot\gamma+\cot\alpha\cot\gamma+\cot\alpha\cot\beta=1
\quad\Leftrightarrow\quad
\alpha+\beta+\gamma\in\pi\mathbb{Z}.
Par conséquence l'image de f est contenue dans l'hyperplan H.
Soit maintenant (\alpha,\beta,\gamma)\in A.
  • Premier cas: \alpha\in\frac\pi2+\pi\mathbb{Z}. Alors \beta+\gamma\in\frac\pi2+\pi\mathbb{Z} et par conséquence \cot\beta=\tan\gamma et on a f(\alpha,\beta,\gamma)=(1,0,0).
  • Second cas: \alpha\not\in\frac\pi2+\pi\mathbb{Z}. Supposons par l'absurde que la première coordonnée de f(\alpha,\beta,\gamma) est égale à 1. Ainsi \cot\beta\cot\gamma=1 et \cot\alpha\cot\gamma+\cot\alpha\cot\beta=0. Alors \cot\beta=-\cot\gamma. Par conséquence (\cot\beta)^2=-1, c'est-à-dire \cot\beta=\pm i. C'est une contradiction, car la cotangente est une application de \mathbb{C}\setminus\pi\mathbb{Z} sur \mathbb{C}\setminus\{\pm i\}.
On vient de prouver que l'image de f ne contient pas la droite épointée D'1, et par permutation des coordonnées elle ne contient ni D'2 ni D'3. Les seuls points de l'image de f ayant une coordonnée 0 ou 1 sont les trois points (1,0,0), (0,1,0) et (0,0,1). On vient aussi de voir que la fibre en (1,0,0) est

f^{-1}(1,0,0)=\left(\frac\pi2+\pi\mathbb{Z}\right)\times\left{(\beta,\,\gamma)\in(\mathbb{C}\setminus\pi\mathbb{Z})^2\,|\,\beta+\gamma\in\frac\pi2+\pi\mathbb{Z}\right}.
De même on obtient les fibres en (0,1,0) et (0,0,1) par permutation des coordonnées.

Montrons maintenant que la restriction de f réalise un revêtement au-dessus H\setminus(D_1\cup D_2\cup D_3). Notons arccot la fonction réciproque de la cotangente. C'est une fonction analytique multivaluée sur \mathbb{C}\setminus\{\pm i\}, primitive de s=-dz/(1+z2). On remarque que le résidu de s en i (resp. -i) vaut i/2 (resp. -i/2). Donc un petit tour dans le sens positif autour de +i (resp. -i) ajoute -\pi (resp. \pi) à la détermination de arccot.
Soit (u,v,w) dans H tels que u>0, v>0 et w>0. En résolvant l'équation f(\alpha,\beta,\gamma)=(u,v,w) on trouve:

(*)    (\alpha,\beta,\gamma)=\left(\rm{arccot}\left(\sqrt{\frac{vw}u}\right),\,\rm{arccot}\left(\sqrt{\frac{uw}v}\right),\, \rm{arccot}\left(\sqrt{\frac{uv}w}\right)\right),\;\;\;u,v,w>0.
Cette formule (*) se prolonge analytiquement sur tout H\setminus(D_1\cup D_2\cup D_3). Pour voir cela il suffit de vérifier que les valeurs des racines évitent les points ±i où arccot n'est pas défini. Supposons par l'absurde que (vw/u)½i. Alors vw/u=-1. Avec l'égalité u+v+w=1 cela implique v=1 ou w=1. Donc (u,v,w)=(0,1,0) ou (0,0,1), points qui ne sont pas dans H\setminus(D_1\cup D_2\cup D_3). Le prolongement analytique est donc possible, on obtient bien un revêtement, ce qui termine la preuve.

Si u fait un petit tour autour de 0 alors la détermination de la racine change de + en -. Vu que pour tout réel x on a \rm{arccot}(-x)=\pi - \rm{arccot}(x) on obtient alors l'autre solution

(**)    \left(\pi-\rm{arccot}\left(\sqrt{\frac{vw}u}\right),\,\pi-\rm{arccot}\left(\sqrt{\frac{uw}v}\right),\, \pi-\rm{arccot}\left(\sqrt{\frac{uv}w}\right)\right),\;\;\;u,v,w>0.

Regardons le cas particulier où on prolonge (*) d'un point (u,v,w) dans H avec u>0, v>0, w>0 vers un point (u',v',w') dans H avec u'<0, v'<0, w'>0. Essentiellement il y a à choisir entre deux types de chemins:

  • Dans le plan de la variable u on fait un petit demi-tour (sens positif) autour de l'origine et dans le plan des v on fait la même chose. (Le point w reste proche de 1.) Le prolongement de (*) le long de ce chemin aboutit à
    (I)    \left(\rm{arccot}\left(\sqrt{\frac{vw}u}\right),\,\rm{arccot}\left(\sqrt{\frac{uw}v}\right),\, \rm{arccot}\left(-\sqrt{\frac{uv}w}\right)\right),\;\;\;u,v<0,\:w>0.
  • La variable u fait un petit demi-tour autour de l'origine et v fait la même chose mais dans le sens opposé. Le prolongement de (*) le long de ce chemin aboutit à
    (II)    \left(\rm{arccot}\left(-\sqrt{\frac{vw}u}\right),\,\rm{arccot}\left(-\sqrt{\frac{uw}v}\right),\, \rm{arccot}\left(\sqrt{\frac{uv}w}\right)\right),\;\;\;u,v<0,\:w>0.
Evidemment ces deux formules n'ont pas besoin de prolongement analytique pour être démontrées. Si la formule (I) donne un triplet de somme k\pi alors la formule (II) donne un triplet de somme (3-k)\pi.