Math'O Man : le Blog des Maths

L'ensemble annulateur d'un polynôme


Racines des polynômes unitaires


Un polynôme est unitaire (ou normalisé) si le coefficient de son terme de plus haut degré est 1. Voici un exercice instructif sur les polynômes unitaires.

Soient a et b deux nombres complexes distincts et P et Q des polynômes unitaires dans \mathbb{C}[X].
  • Si l'ensemble des nombres complexes où P prend la valeur a est identique à celui où Q prend la valeur a et si P et Q sont de même degré, peut-on en déduire que P=Q ?
  • Si l'ensemble des nombres complexes où P prend la valeur a est identique à celui où Q prend la valeur a et si on a la propriété similaire pour b, peut-on en déduire que P=Q ?

Pourquoi ne pas lire aussi :


Forme générale d'une formule

Tout étudiant apprend les formules

\sum_{k=1}^nk=\frac{n(n+1)}2\,,  \qquad \qquad\sum_{k=1}^nk^2=\frac{n(n+1)(2n+1)}6\,,\qquad\qquad n\in\mathbb{N}\,.

Soit p un entier positif. Montrer que, plus généralement, la somme des premiers n termes de la suite k^p avec k\geq1 est un polynôme rationnel en n de degré p+1.

Lieu discriminant

Mon dernier billet où on parlait de racines multiples de polynômes m'a rappelé quelques souvenirs de notions que j'avais apprises pendant ma maîtrise.

Le résultant de deux polynômes

Considérons deux polynômes

P=a_0+a_1 X+a_2 X^2+\,\cdots\,+a_n X^n,\;Q=b_0+b_1 X+b_2 X^2+\,\cdots\,+b_m X^m.

Leur résultant R(P,Q) est le déterminant de la matrice de Sylvester, matrice carré d'ordre m+n dont on comprend la construction par l'exemple ci-dessous pour n=4 et m=3.

R(P,Q)=\begin{vmatrix} 
a_4 & a_3 & a_2 & a_1 & a_0 & 0 & 0 \\
0 & a_4 & a_3 & a_2 & a_1 & a_0 & 0 \\
0 & 0 & a_4 & a_3 & a_2 & a_1 & a_0 \\
b_3 & b_2 & b_1 & b_0 & 0 & 0 & 0 \\
0 & b_3 & b_2 & b_1 & b_0 & 0 & 0 \\
0 & 0 & b_3 & b_2 & b_1 & b_0 & 0 \\
0 & 0 & 0 & b_3 & b_2 & b_1 & b_0
\end{vmatrix}

La proposition suivante est la raison d'être du résultant.

Proposition. On a R(P,Q)=0 si et seulement si P et Q possèdent un diviseur commun non-constant.

Le discriminant d'un polynôme

Dans le cas où Q est la dérivée de P le résultant porte un nom particulier : on appelle R(P,P') le discriminant de P. La proposition ci-dessus implique le corollaire ci-dessous.

Corollaire. Un polynôme complexe admet une racine multiple si et seulement si son discriminant est nul.

Testons au moins la véracité de ce corollaire sur les polynômes de second degré (que les profs de lycée appellent trinômes) !

P=c+b X+aX^2,\;\;\;P'=b+2a X,\;\;\;a\neq0.
On calcule alors le discriminant de P comme déterminant d'une matrice 3x3 (règle de Sarrus),

R(P,P')=
\begin{vmatrix} 
c & b & a   \\
b & 2a &0  \\
0  & b & 2a   
\end{vmatrix} = 
c\begin{vmatrix} 
 2a &0  \\
b & 2a   
\end{vmatrix} 
-b \begin{vmatrix} 
b & a   \\
b & 2a   
\end{vmatrix} = -a(b^2-4ac).

Nous retrouvons ainsi le fait, connu par tout lycéen en classe première S, que le polynôme de second degré aX²+bX+c possède une racine double si et seulement si b²-4ac=0.

Groupe fondamental du complémentaire du lieu discriminant

Maintenant revenons au niveau maîtrise (des nos jours master ou encore magistère...) pour poser les deux questions suivantes. Dans l'espace \mathbb{C}^n on appelle lieu discriminant le sous-ensemble \Delta formé des (a_0,\,\ldots\,,a_{n-1}) tels que le polynôme

P = a_0+ a_1X  +\,\cdots\, + a_{n-1}X^{n-1} +  X^n

possède une racine multiple.

  1. Montrer que \mathbb{C}^n\setminus\Delta est connexe par arcs.
  2. Quel est le groupe fondamental de \mathbb{C}^n\setminus\Delta ? Le décrire par générateurs et relations.

Les réponses sont plutôt faciles ; pour la deuxième question, pas la peine de tout formaliser, le handwaving suffit car dans cet exemple le formalisme ne donne rien en valeur ajoutée...

Groupes et compagnie

Un magma est un ensemble G muni d'une loi de composition interne ¤.
Si en plus cette loi est associative, c'est-à-dire (x¤yz = x¤(y¤z) pour tous x,y,z dans G, alors on dit que (G,¤) est un demi-groupe.
Et si en plus il existe un élément neutre e dans G, c'est-à-dire e¤x = x¤e = x pour tout x dans G, alors on dit que (G,¤) est un monoïde.
Enfin, si chaque élément x de G possède un neutralisant x' dans G, c'est-à-dire x¤x' = x'¤x = e, alors on dit que (G,¤) est un groupe.

On dit aussi le symétrique de x pour l'élément neutralisant x' de x. Si la loi est notée par une addition on le note souvent -x (opposé) et si la loi est notée par une multiplication on le note souvent x-1 (inverse).

Exemples :

  • Considérons la loi de l'addition habituelle de nombres. Muni de cette loi l'ensemble des naturels strictements positifs N*={1,2,3,...} est un semi-groupe. Il manque l'élément neutre 0 ; on l'ajoute et on obtient le monoïde N={0,1,2,3,...}. Il manque les neutralisants (les opposés) -1, -2, -3, ... ; on les ajoute et on obtient le groupe des entiers Z={0,±1,±2,±3,...}.
  • Considérons la loi de la multiplication habituelle de nombres. Muni de cette loi l'ensemble des naturels N est un monoïde, son élément neutre étant 1. Que faut-il ajouter ou enlever pour en faire un groupe ? D'abord on remarque que 0 multiplié avec tout nombre donne 0, donc jamais 1, autrement dit on ne pourra jamais trouver un neutralisant de 0 (on ne peut pas diviser par zéro...). Il faut donc enlever le 0, on trouve N*. Ensuite il faut ajouter les inverses : l'union de N* et de l'ensemble des 1/nn parcourt N*, est-il un groupe ? Non, pas encore, car il faut aussi s'assurer que les produits restent dedans et donc on doit en fait ajouter toutes les fractions de la forme m/n avec m et n dans N*. On trouve le groupe multiplicatif Q*+ des rationnels strictement positifs.
    De même l'ensemble des nombres rationnels non nuls Q* est un groupe.
  • Il existe des loi internes non-associatifs. L'ensemble Z muni de la soustraction est un magma (mais pas un demi-groupe). L'ensemble R3 muni du produit vectoriel
    (x1, x2, x3) × (y1, y2, y3) = (x2y3-x3y2, x3y1-x1y3, x1y2-x2y1)
    en est un autre.

Pour résumer, un groupe est un ensemble muni d'une loi interne associative, possédant un élément neutre et tel que chaque élément a un neutralisant. Il s'agit alors de vérifier ces trois axiomes pour montrer qu'un objet proposé est un groupe. Beaucoup d'exercices sont de ce type et très souvent ce sont de simples vérifications mécaniques, permettant au débutant de se familiariser avec la notion de groupe. La rédaction de la réponse à la question suivante m'a pris un peu plus de temps, à savoir toute la durée d'un examen que j'ai surveillé hier — pas terrible de réussir un seul exo pendant que les étudiants doivent en faire cinq ;-) mais évidemment cet exo ne faisait pas partie de l'examen...

Exercice : On définit x¤y := x(y2+1)½+y(x2+1)½. L'ensemble des réels muni de cette loi est-il un groupe ?

Toutes les solutions sont acceptées... en particulier celles utilisant la force brute du logiciel de calcul formel Maple car j'aimerais bien savoir si Maple arrive à faire ça. J'ai essayé de forcer Maple mais il ne voulait pas ; soit ça dépasse ses capacités, soit ça dépasse mes compétences maple-istiques.

Se marier avec quelqu'un qu'on aime

Comment trouver l'amour de sa vie ? Comment se caser ? Comment former un bon couple ? Ce type de questions préoccupe beaucoup de gens. Voici une version matheux de ce problème fondamentale.

Le problème de mariage ou le problème de former les bons couples

Supposons que nous avons n femmes et n hommes, tous célibataires et prêts à se marier ; pour tout entier k dans [1,n] et tout choix de k femmes, l'ensemble des hommes qui sont aimés par au moins une de ces femmes contient au moins k éléments.
Démontrer qu'on peut organiser des mariages tels que chaque femme se marie avec un époux qu'elle aime.

Un arbre qui pousse

Dans ce temps de grand froid, je lance un appel au printemps! On fait pousser un arbre selon la règle suivante. De chaque nœud x partent deux branches, l'une vers le nœud x/(1+x) et l'autre vers le nœud (1+x)/x

.

axes des pédales bicyclette

On suppose que l'arbre repose sur une racine bien costaud, le nombre 1; et qu'on l'arrose si bien qu'il pousse vers le ciel infiniment haut. Quelle est alors son image, c'est-à-dire l'ensemble des nombres qu'il atteint? Y a-t-il des doublons?

Concevoir la notion d'application

Je me rappelle qu'au début de mes études de mathématiques, parfois une simple question de formalisme pouvait me poser des problèmes. Par exemple, j'avais du mal à jongler entre différents points de vue d'une notion a priori simple comme celle d'application. Voici quelques lignes qui pourraient sembler bêtes aux initiés, mais comme les livres expliquent rarement ce genre de choses en détail elles peuvent être utiles à ceux qui y sont confrontés pour la première fois — et notamment aux élèves et étudiants d'aujourd'hui qui, lors de leur parcours scolaire, ne rencontrent plus assez de théorie des ensembles.


Considérons une application (synonyme de fonction) d'un ensemble X dans un ensemble Y.

f\;:\; X \;\longrightarrow \;Y\,,\;\; x \; \longrightarrow\;f(x)\,.

(Désolé, la deuxième flèche devrait commencer par un pied mais mon plug-in LaTeX ne le permet pas.)

Si vous venez de passer le bac, vous avez déjà une notion intuitive de ce que c'est une application. Mais les mathématiciens possèdent plusieurs autres points de vue pour concevoir cet objet — et chacun a sa raison d'être.

  1. Point de vue y en fonction de x.
    C'est le point de vue habituellement enseigné au collège et au lycée. On conçoit x comme variable et y comme l'image qui change en fonction de x.
    Le schéma mental est le suivant.

    dessiner le graphe d'une fonction, comprendre les fonctions

    L'ensemble de départ X est représenté horizontalement, l'ensemble d'arrivée Y est représenté verticalement. La donnée de l'application f revient à la donnée de son graphe \Gamma \subset X\times Y constitué des couples (x,f(x)), où x parcourt X.
    En disant x parcourt X, on adopte donc bien l'idée que la variable est x.
     
  2. Point de vue collection d'éléments de Y.
    On peut aussi écrire l'application f en forme de famille (f(x))_{x\in X}. On oublie donc de spécifier l'ensemble d'arrivée Y.
    En général, une famille (y_j)_{j\in J} dans Y n'est rien d'autre qu'une application

    y\;:\; J \;\longrightarrow \;Y\,,\;\; j \; \longrightarrow\;y_j\,,

     
    où l'ensemble de départ J est appellé l'ensemble d'indices ; très souvent il n'a pas d'importance et peut être remplacé par un autre ensemble de même cardinal. Ce qui compte dans ce point de vue c'est simplement la collection des images de l'application.
    Dans certaines situations un bon choix de l'ensemble d'indices peut raccourcir les écritures. Par exemple, si (b_j)_{j\in J} est une base d'un K-espace vectoriel E, alors tout vecteur v de E se décompose comme combinaison linéaire

    v=\sum_{j\in J} \lambda_j\, b_j\:,

    (\lambda_j)_{j\in J} est une famille de scalaires presque tous nuls (c'est-à-dire l'application \lambda\;:\; J \;\longrightarrow \;K\, est nulle sauf en un nombre fini de points ; cela est nécessaire pour pouvoir prendre la somme). Mais si on conçoit la base non comme une famille de vecteurs mais comme un sous-ensemble B de l'espace E, alors on peut la prendre elle-même comme ensemble d'indices et écrire simplement

    v=\sum_{b\in B} \lambda_b\, b\:.


     
  3. Point de vue les fibres en fonction de y.
    Pour chaque y dans Y on appelle fibre de f en y (ou ensemble de niveau y) l'ensemble de tous les antécédents de y, noté
     
    f_y\;=\;f^{-1}(\{y\:\})\:=\:\{\:x\in X\; :\; f(x)=y\:\} \,.

     
    Connaître une application revient à connaître la collection de ses fibres. C'est donc y qu'on considére comme variable. On s'aide du schéma mental suivant.
     

    représenter une fonction graphiquement, comprendre une fonction


    L'espace de départ est projeté sur l'espace d'arrivée. L'application est injective (resp. surjective resp. bijective) si et seulement si chaque fibre possède au plus (resp. au moins resp. précisément) un élément.
     
Une conséquence naturelle du point de vue des fibres est la factorisation canonique, que nous allons expliquer ci-dessus et dont la quintessence se résume ainsi :
L'ensemble des fibres non-vides d'une application est une partition de l'ensemble de départ et a le même cardinal que l'image de l'application.

Factorisation canonique

Nous nous proposons de montrer que toute application est la composée d'une surjection, d'une bijection et d'une injection. Soit donc f une application de X vers Y. On considère son image

\tilde{Y} = f(X)\:\subset\:Y

et l'espace des fibres

\tilde{X} = \{\,f^{-1}(\{y\})\:|\: y\in \tilde{Y}\,\}\:\subset\:{\scr P}(X).

Ainsi l'espace des fibres est le quotient de X par la relation d'équivalence  ~  qui est définie par  x ~ x'  si et seulement si f(x) = f(x'). Il est clair que \tilde{X} et \tilde{Y} sont en bijection. Plus précisément il existe une surjection \pi, une bijection \tilde{f} et une injection j tel que le diagramme suivant commute.

Factorisation canonique d'une fonction, comment comprendre les applications

En effet, il suffit de prendre pour \pi la projection canonique sur le quotient X/~, c'est-à-dire l'application qui à chaque x dans X associe la fibre de f en f(x) ; puis pour j l'injection naturelle, et enfin pour \tilde{f} l'application qui envoie une fibre sur l'unique élément dans Y qui est son image par f. Il est alors évident que f est la composée

f= j\circ \tilde{f}\circ \pi.

Un avant-goût de la suite

Concevoir une application comme la collection de ses fibres est très fréquent en topologie, géométrie algébriques et théorie des singularités. On fait varier un point dans l'espace d'arrivée pour observer, dans l'espace de départ, la manière dont varie la fibre au-dessus de ce point. Un exemple très basique est l'application

f\;:\; \mathbb{R}^3 \;\longrightarrow \;\mathbb{R}\,,\;\; (x,y,z) \; \longrightarrow\;ax+by+cz\,,

 
a,b,c sont des réels fixés non tous nuls. La collection des fibres est constituée de plans parallèles. Il s'agit donc d'un feuilletage de l'espace \mathbb{R}^3 par plans (comme un feuilleté). Les fibres se ressemblent toutes ; on a même ce qu'on appelle une fibration globalement triviale.

Plus généralement, si f est une fonction différentiable et si on fait varier le point dans l'espace d'arrivée sans toucher les valeurs critiques, alors localement les fibres se ressemblent toutes (fibration localement triviale). En revanche, si on passe par une valeur critique alors la nature des fibres peut changer. Par exemple si on traverse la valeur critique 0 de l'application

g\;:\; \mathbb{R}^2 \;\longrightarrow \;\mathbb{R}\,,\;\; (x,y) \; \longrightarrow\;x^2+y^2\,,

dans le sens décroissant, alors la fibre est d'abord un cercle, puis dégénère en un point et, enfin, devient vide — une catastrophe a lieu au sens de la théorie des catastrophes de René Thom.

Tout ça devient plus intéressant dans le complexe. Les fibres de

g\;:\; \mathbb{C}^2 \;\longrightarrow \;\mathbb{C}\,,\;\; (x,y) \; \longrightarrow\;x^2+y^2\,,

sont des surfaces réelles (courbes complexes ou surfaces de Riemann). Et au lieu de traverser la valeur critique 0, on peut la contourner avec un petit lacet dans le plan complexe et observer la déformation de cette surface le long du lacet. Evidemment à la fin on retrouve la même surface qu'au début du lacet, mais lors du trajet certaines caractéristiques se sont déplacés continûment et ont échangés leurs places... (monodromie).

Mieux comprendre la topologie des matrices singulières

Mon billet récent sur la dimension maximale d'un sous-espace affine contenu dans l'ensemble des matrices non-inversibles m'a inspiré les réflexions suivantes, une sorte de version différentiable de ce résultat.

On note {\mathcal M}_n(\mathbb{R}) l'espace des matrices n x n à coefficients réels et GL(n,\mathbb{R}) le sous-ensemble des matrices inversibles. On sait que GL(n,\mathbb{R}) est un ouvert dans {\mathcal M}_n(\mathbb{R}). En effet c'est l'image réciproque de l'ouvert \mathbb{R}^* par l'application continue déterminant

\det\;:\;\; {\mathcal M}_n(\mathbb{R}) \;\rightarrow\;\mathbb{R}.

On peut même dire un peu plus : le déterminant étant polynômial en x_{11},x_{12},\dots,x_{nn} le complémentaire des matrices inversibles, c'est-à-dire l'ensemble des matrices de déterminant nul,

\mathcal{A}\; =\; {\mathcal M}_n(\mathbb{R}) \:\backslash\:GL(n,\mathbb{R})

est une hypersurface algébrique. Géométriquement parlé \mathcal{A} est un fermé de {\mathcal M}_n(\mathbb{R}) qui ressemble localement à un hyperplan (c'est-à-dire à un sous-espace affine de dimension -1). Enfin, cela est vrai en presque tous les points, ceux où la différentielle du déterminant ne s'annulle pas (points réguliers). En revanche, en les points où la différentielle du déterminant est nulle (points singuliers), l'hypersurface \mathcal{A} ne ressemble plus à un sous-espace affine. Il peut y avoir un croisement comme par exemple

algebraische Fläche, surface algébrique

ou un rétrécissement comme par exemple

Algebraische Flächen

(Pour plus d'images de surfaces algébriques visitez le la galerie de Herwig Hauser.)

Il est évident que la différentielle du déterminant est nulle à l'origine. Donc notre hypersurface {\mathcal A} possède une singularité à l'origine. Le résultat suivant dit qu'il s'agit d'une singularité de type rétrécissement, car l'hypersurface de dimension n²-1 y perd quelques dimensions — il y reste juste assez de place pour n²-n dimensions...

Proposition :

Le nombre -n est la plus grande dimension possible d'une sous-variété différentiable F de \mathcal{M}_n(\mathbb{R}) telle que 0\in F\subset {\mathcal M}_n(\mathbb{R}) \backslash GL(n,\mathbb{R})\,.
Démonstration :
  • L'ensemble des matrices dont la première ligne est nulle est un sous-espace vectoriel (et donc en particulier une sous-variété différentielle) de dimension n²-n. Evidemment il contient l'origine 0 et est contenu dans \mathcal{A}.

  • Soit F une sous-variété de {\mathcal M}_n(K) de dimension -n+1 et telle que 0\in F. Nous allons prouver que F contient une matrice inversible.
    Au voisinage de l'origine la sous-variété F est décrite par un système de n-1 équations
    f_j(x_{11},x_{12},\ldots,x_{nn})=0\,,\;\;\;j=1,\,\ldots\,,n-1,
    tel que les différentielles df_j sont linéairement indépendantes à l'origine. On résoud ce système par le théorème des fonctions implicites, c'est-à-dire on peut isoler (théorétiquement) n-1 des coordonnées et les exprimer par les autres. On a ainsi, toujours au voisiange de l'origine, n²-n+1 coordonnées variables et n-1 coordonnées isolées (fonctions différentiables des coordonnées variables).
    Maintenant je peux poursuivre mon raisonnement de la preuve du cas affine : par des permutations de lignes et de colonnes je m'arrange à ce que les coordonnées isolées soient toutes au-dessus de la diagonale matricielle ; puis je prends les coordonnées sur la diagonale toutes égales à un nombre \epsilon non-nul et proche de 0 et les autres coordonnées variables égales à 0. Ainsi j'obtiens une matrice inversible qui est dans F.

Les limites des logiciels de calcul formel?

Dans ce billet j'ai posé l'exercice de montrer que la loi binaire

x¤y := x(y2+1)½+y(x2+1)½

définit une structure de groupe sur l'ensemble des réels. Le seul obstacle est l'associativité; la preuve n'est pas très difficile (il s'agit d'un simple transport de la loi + par le sinus hyperbolique). Mais avec Maple je n'arrive pas à faire la preuve par force brute; en effet, je ne sais pas comment faire en sorte que le logiciel simplifie l'expression concernée (tandis que le logiciel Xcas y arrive, comme l'a remarqué Tukikun).

Dans le même esprit, je me demande si quelqu'un arrive à démontrer avec Maple que, sur les courbes elliptiques (réelles), l'addition par la méthode des sécantes est associative. Je n'y suis pas arrivé.

Peut-on relier deux points par un chemin injectif ?

Les commentaires du billet un exercice de topologie sur le blog de PB soulevait quelques questions intéressantes. Une parmi elles possède la réponse suivante :

Dans une variété topologique connexe on peut relier tout couple de points distincts par un chemin injectif.

Remarquons que ce résultat ne vaut plus sur des espaces non-séparés comme la droite avec un point dédoublé (une variété topologique est séparée par définition).

Démonstration :

Rappellons d'abord que sur une variété topologique les notions connexe et connexe par arcs sont équivalentes.
Quelques notations : B(r) désigne la boule ouverte de rayon r et de centre 0 dans \mathbb{R}^n pour la norme euclidienne. Pour noter la boule fermée, on mettra une barre dessus.

Soit M une variété topologique de dimension n et x un point de M. Notons E le sous-ensemble de M constitué de x et de tous les points qu'on peut relier injectivement à x. Notre but est de prouver que E=M. Vu que M est connexe et que E est non-vide, il suffit de montrer que E est ouvert et fermé.

  • Ouvert : Soit y un point arbitraire dans E. Dans l'atlas de la variété M il existe une carte \varphi\;:\; (U,y) \rightarrow (B(1),0).

    • Si x\in U alors U\subset E car dans une boule on peut toujours relier injectivement deux points distincts par un segment.

    • Dans l'autre cas où x n'est pas dans U nous posons r=1/2 et nous allons prouver que \varphi^{-1}(B(r))\subset E. On sait déjà qu'il existe un chemin injectif \lambda\::\:[0,1] \rightarrow M tel que \lambda(0)=x et \lambda(1)=y. L'ensemble \varphi^{-1}(\overline{B}(r)) est compact, et comme M est séparé, on déduit qu'il est fermé (voir aussi remarque 2 en bas).

      Par continuité l'image réciproque \lambda^{-1}(\varphi^{-1}(\overline{B}(r))) est fermé dans [0,1] et possède donc un plus petit élément t_0. On a l'inégalité t_0>0 car \lambda(0)=x\not\in U.

      Le point \varphi(\lambda(t_0)) ne peut pas être contenu dans la boule ouverte B(r), sinon \varphi(\lambda(t_0-\epsilon)) le serait également pour \epsilon>0 assez petit, contrairement à la définition de t_0. Donc \varphi(\lambda(t_0)) est sur le bord de la boule B(r). Par construction on peut relier injectivement \lambda(t_0) à tout point de \varphi^{-1}(B(r)) sans rencontrer \lambda([0,t_0[). En juxtaposant ces deux chemins, on relie donc injectivement x à n'importe quel point de \varphi^{-1}(B(r)). Donc \varphi^{-1}(B(r)) est un voisinage ouvert de y contenu dans E.

      Faire des dessins en maths, ça aide !


  • Fermé : Nous devons prouver que le complémentaire de E est ouvert. Soit donc y un point arbitraire dans M\E, autrement dit y est un point qui ne peut pas être relié injectivement à x. On prend une carte \varphi\;:\; (U,y) \rightarrow (B(1),0). Alors on sait déjà que x ne peut pas être dans U. De deux choses l'une :

    • Soit l'ouvert U est une partie de M\E — dans ce cas on a terminé.

    • Soit U n'est pas inclu dans M\E — dans ce cas il existe un point z dans l'intersection U\cap E. Pour r=||\varphi(z)|| on a 0<r<1. Il existe un chemin injectif \lambda\::\:[0,1] \rightarrow M allant de x à z. L'ensemble
      K=\lambda([0,1])\cap\varphi^{-1}(\overline{B}(r))
      est compact car c'est l'intersection d'un compact et d'un fermé. (Pour voir que \varphi^{-1}(\overline{B}(r)) est fermé on utilise, comme en haut, le fait que M est séparé.)
      Parmi tous les points du compact \varphi(K) il existe un ayant norme minimale. Nous notons w ce point et \lambda(t_0) son correspondant sur la variété (toujours via la carte \varphi). Clairement \lambda(t_0)\neq y. D'une part on a la restriction de \lambda à [0,t_0] et d'autre part le chemin correspondant au segment [w,0] ; en juxtaposant ces deux chemins injectifs on obtient un chemin de x à y qui, par construction, est injectif. Contradiction, ce cas ne peut pas avoir lieu.

      Les illustrations en mathématiques, ça facilite la compréhension

Remarque 1 :

L'idée de la preuve est de se ramener à l'intuition que nous avons de notre espace usuel. Quand une trajectoire passe de l'extérieur d'une boule à l'intérieur d'une boule, elle doit forcément traverser le bord de la boule, elle coule comme une rivière. Or cela n'est plus vrai dans les espaces non-séparés comme la droite à deux origines dédoublées, 0' et 0''. Quand je fais un chemin de 0' à 0'' alors je rentre directement dans l'intérieur de la boule [-1,1]'' sans passer par -1 ou par 1. Le chemin apparait miraculeusement de nul part, il jaillit comme une source...

Il est donc intéressant de voir où la preuve ne fonctionne plus dans cet exemple. Evidemment c'est au moment où on utilise le fait qu'un compact d'un espace séparé est toujours fermé. Sur la droite dédoublée l'ensemble [-1,1]'' est compact mais il n'est pas fermé, car son complémentaire \:]-\infty,-1[\,\cup\,]1,+\infty[\,\cup\,\{0'\}\: n'est pas ouvert.

Remarque 2 :

On est tenté de dire que \varphi^{-1}(\overline{B}(r)) est fermé comme image réciproque d'un fermé par une application continue. Mais cela serait faux ! En effet, \varphi est seulement définie sur U et pas sur toute la variété M. On peut donc dire que \varphi^{-1}(\overline{B}(r)) est un fermé de l'espace U (pour la topologie induite par M), mais de là on ne peut pas conclûre directement qu'il s'agit d'un fermé de M. C'est pourquoi nous devons faire ce détour :

\overline{B}(r) compact dans B(1),
donc \varphi^{-1}(\overline{B}(r)) compact dans U,
donc \varphi^{-1}(\overline{B}(r)) compact dans M,
donc \varphi^{-1}(\overline{B}(r)) fermé dans M (séparé).

Arbre généalogique de mathématiciens

Lorsque j'ai travaillé avec Gérald Calderon sur le film Origine Océan nous avons consacré une petite scène à un être unicellulaire nommé LUCA (Last Universal Common Ancestor), notre dernier ancêtre commun universel dont sont issues l'ensemble des espèces.

On peut se poser la question amusante s'il existe un LUMA (Last Universal Math Ancestor) — et pour répondre à cette question on peut s'aider d'une base de données de l'université américaine NDSU.

Il s'agit d'un arbre généalogique qui permet d'associer à chaque docteur en mathématiques du monde entier son directeur de thèse. Ainsi j'ai découvert que si je remonte six générations, je trouve parmi mes aïeux l'illustre Hermann von Helmholtz. Mais mon cousin Detlev qui a soutenu sa thèse en 2001 fait encore mieux : il est un descendant scientifique de Hilbert et donc du prince des maths Carl Friedrich Gauß !