Math'O Man : le Blog des Maths

Préscrire les valeurs d'une dérivée


Germe de fonction infiniment dérivable


Actuellement je traverse la Corse à vélo, et aujourd'hui lors d'une montée raide je pensais à un problème de souplesse. Comme nous le savons les fonctions infiniment dérivables sont beaucoup plus souples que les fonctions analytiques. Par exemple on peut se poser la question suivante sur la donnée des dérivées successives en un point :

Existe-t-il une fonction f de classe \mathcal{C}^\infty telle que pour tout naturel n,

f^{(n)}(0)=n^{n^n}\;\;?

Pourquoi ne pas lire aussi :


Pourquoi je demande à tracer des courbes à la main

Personnellement je pense que les calculatrices et TICE (Technologies de l'information et de la communication pour l'éducation) devraient être utilisées avec prudence dans les cours de mathématiques. La raison est simplement que ça va trop vite pour qu'un élève ou étudiant comprenne les nouvelles notions qu'il rencontre. C'est à nous, les enseignants, de choisir des exemples numériques où les calculs ne se compliquent pas trop et qui font dégager l'essentiel. Le danger des TICE c'est que souvent elles font primer la quantité sur la qualité. Or je pense qu'un élève qui trace lui-même sur sa feuille cinq paraboles bien choisis va comprendre plus de choses que s'il en voit vingt paraboles défiler sur un écran.

Le fait que beaucoup de bacheliers quittent l'école sans maîtriser les fondements en calcul a été (et est toujours) discuté amplement dans ce blog. Aujourd'hui je veux insister sur un autre point, la capacité de tracer à la main les courbes de fonction simples. Dans mes cours sur les fonctions trigonométriques j'insiste sur des dessins soignés des fonctions sinus, cosinus, tangente, arcsinus, arccosinus et arctangente dans une repère orthonormé. Je fais ces dessins au tableau et je passe dans les rangs pour vérifier si les étudiants les ont bien faits ; si ce n'est pas le cas je leur demande de les refaire chez eux.

Evidemment le dessin ne peut pas être aussi précis que celui qui sort d'un ordinateur. Mais en insistant sur deux choses on arrive quand même à un tracé correct :

  • Utiliser quelques valeurs particulières. Par exemple la courbe de la tangente passe par le point de coordonnées (\frac\pi4,\,1). Et afin de trouver pour l'abscisse la valeur approximative 0,8 un étudiant faible doit déjà réfléchir un peu...

  • La pente de la tangente à l'origine du sinus est sin'(0)=cos(0)=1. Placer des petits traits de pente 1 ou -1 aux points où le sinus s'annule est un bon réflexe qui permet d'augmenter sensiblement la précision du tracé de la courbe. En même temps cela rappelle la notion de la dérivée comme taux d'accroissement local...

D'ailleurs, j'ai un message à passer aux professeurs de math au collège et lycée : Travaillez moins ! Ne me comprenez pas mal ;-) Par cela je veux dire que les professeurs ne devraient plus faire le travail à la place de leurs élèves et donc ne plus fournir de repère prêt-à-utiliser sur la feuille d'énoncé. Déjà le choix d'une repère est un tâche intellectuelle importante à accomplir par l'élève : quelles échelles sur les deux axes sont adaptées à mon graphique ? quelle région veux-je représenter ?

Vu le nombre de bacheliers S qui ont du mal à dessiner correctement en moins d'une minute une parabole comme y=½(x-1)²+1 il serait souhaitable de revenir à ces concepts qui ont l'air vieux-jeu mais en réalité ne le sont pas car celui qui les a compris a compris bien plus que de faire un simple dessin.
Déjà au collège quand on trace la parabole standard y=x² à la main c'est l'occasion de comprendre plein de choses, comme par exemple que x<x² lorsque x est plus grand que 1, tandis que x>x² lorsque x est compris entre 0 et 1.

Le tracé d'une courbe doit si possible faire apparaître les propriétés essentielles, comme les intersections avec les axes, les pentes en ces intersections, les extréma, des éventuels asymptotes,...
Si l'on négligence ces choses-là ça donne des intersections fantaisistes entre la courbe de la fonction tangente et celle de sa réciproque, enseignées aux étudiants d'un établissement d'enseignement supérieur américain réputé d'être l'un des meilleurs du monde (rang 4 au classement de Shanghaï 2010) :

erreur dans le dessin
Cours filmé au MIT — Tracés complètement faux de tan et arctan !

Heureusement le reste de ce cours pris en vidéo semble de meilleure qualité.

Question pour mes étudiants : Cherchez l'erreur !

Cet enseignant a probablement vu trop d'images dans des repères à échelles distinctes sur l'abscisse et l'ordonnée, comme celle-ci au lieu de celle-là. C'est d'ailleurs la raison pour laquelle je demande toujours de tracer les fonctions trigonométriques dans un repère orthonormé.

Lieu discriminant

Mon dernier billet où on parlait de racines multiples de polynômes m'a rappelé quelques souvenirs de notions que j'avais apprises pendant ma maîtrise.

Le résultant de deux polynômes

Considérons deux polynômes

P=a_0+a_1 X+a_2 X^2+\,\cdots\,+a_n X^n,\;Q=b_0+b_1 X+b_2 X^2+\,\cdots\,+b_m X^m.

Leur résultant R(P,Q) est le déterminant de la matrice de Sylvester, matrice carré d'ordre m+n dont on comprend la construction par l'exemple ci-dessous pour n=4 et m=3.

R(P,Q)=\begin{vmatrix} 
a_4 & a_3 & a_2 & a_1 & a_0 & 0 & 0 \\
0 & a_4 & a_3 & a_2 & a_1 & a_0 & 0 \\
0 & 0 & a_4 & a_3 & a_2 & a_1 & a_0 \\
b_3 & b_2 & b_1 & b_0 & 0 & 0 & 0 \\
0 & b_3 & b_2 & b_1 & b_0 & 0 & 0 \\
0 & 0 & b_3 & b_2 & b_1 & b_0 & 0 \\
0 & 0 & 0 & b_3 & b_2 & b_1 & b_0
\end{vmatrix}

La proposition suivante est la raison d'être du résultant.

Proposition. On a R(P,Q)=0 si et seulement si P et Q possèdent un diviseur commun non-constant.

Le discriminant d'un polynôme

Dans le cas où Q est la dérivée de P le résultant porte un nom particulier : on appelle R(P,P') le discriminant de P. La proposition ci-dessus implique le corollaire ci-dessous.

Corollaire. Un polynôme complexe admet une racine multiple si et seulement si son discriminant est nul.

Testons au moins la véracité de ce corollaire sur les polynômes de second degré (que les profs de lycée appellent trinômes) !

P=c+b X+aX^2,\;\;\;P'=b+2a X,\;\;\;a\neq0.
On calcule alors le discriminant de P comme déterminant d'une matrice 3x3 (règle de Sarrus),

R(P,P')=
\begin{vmatrix} 
c & b & a   \\
b & 2a &0  \\
0  & b & 2a   
\end{vmatrix} = 
c\begin{vmatrix} 
 2a &0  \\
b & 2a   
\end{vmatrix} 
-b \begin{vmatrix} 
b & a   \\
b & 2a   
\end{vmatrix} = -a(b^2-4ac).

Nous retrouvons ainsi le fait, connu par tout lycéen en classe première S, que le polynôme de second degré aX²+bX+c possède une racine double si et seulement si b²-4ac=0.

Groupe fondamental du complémentaire du lieu discriminant

Maintenant revenons au niveau maîtrise (des nos jours master ou encore magistère...) pour poser les deux questions suivantes. Dans l'espace \mathbb{C}^n on appelle lieu discriminant le sous-ensemble \Delta formé des (a_0,\,\ldots\,,a_{n-1}) tels que le polynôme

P = a_0+ a_1X  +\,\cdots\, + a_{n-1}X^{n-1} +  X^n

possède une racine multiple.

  1. Montrer que \mathbb{C}^n\setminus\Delta est connexe par arcs.
  2. Quel est le groupe fondamental de \mathbb{C}^n\setminus\Delta ? Le décrire par générateurs et relations.

Les réponses sont plutôt faciles ; pour la deuxième question, pas la peine de tout formaliser, le handwaving suffit car dans cet exemple le formalisme ne donne rien en valeur ajoutée...

Oeuf de pâques

Je viens de recevoir le message suivant :

Je suis à la recherche de ce que serait l'équation d'une ovoïde ayant pour axe de symétrie l'axe des y. J'ai bien trouvé ceci :

a(1+ky)x² + by² = 1

Mais la figure associée semble avoir l'axe des x pour axe de symétrie. De plus, j'aimerais connaître l'incidence des divers coefficients sur le tracé de la courbe.
Pouvez-vous m'aider ?
Bien cordialement, Jean-Christian Dubau

Voici quelques éléments de réponse.

  • D'abord pour changer les axes il vous suffit de changer dans votre équation les rôles de x et y. Mais votre équation est bien celle d'une courbe symétrique par rapport à l'axe des y ; en effet, l'équation reste inchangée si on remplace (x,y) par (-x,y).
     
  • Le mieux pour connaître l'incidence des coefficients a, k et b est de les essayer, par exemple en entrant 2(1+3y)x² + 4y² = 1 sur WolphramAlpha. Vous pouvez aussi utiliser le logiciel gratuit Graphmatica ; attention, avec ce logiciel il faut entrer les multiplicatio ns et les exposants sous la forme a*(1+k*y)*x^2 + b*y^2 = 1.
     
  • D'où tenez-vous cette équation ? A mon avis le terme 1+ky devrait être au numérateur, comme ceci

    ax²/(1+ky)+ by² = 1.

    Le signe de k (positif ou négatif) devrait influencer si votre œuf est large en bas ou en haut. Les valeurs positives de a et b vont faire un ovale plus haut ou plus large en général.
     
  • Je vous propose l'équation sous une autre forme, 13x²=y(y-3)(y-4). (Si vous remplacez le x² par un simple x alors vous allez comprendre pourquoi on obtient un ovale par cette équation.) Jouez sur les nombres 13, 3 et 4 pour changer la forme de la courbe. Voici ce que ça donne avec Graphmatica :

    courbe en forme d'oeuf, courbe ovale, ovoide

     
  • Vous trouverez d'autres equations ici.

Etant en voyage, je ne peux pas répondre plus longuement, mais peut-être certains de mes lecteurs pourront vous aider davantage.

Les rectangles revisités une fois de plus

Apparemment la question sur un pavage de rectangles posée ici il y a quelques jours est stimulante. Après la solution par produit tensoriel, voici une autre qui repose sur une activité habituellement réservée aux enfants: le coloriage. (Les matheux ne sont que de grands enfants !) Merci à David Caisson qui m'a envoyé cette solution extraite du livre Solving Mathematical Problems de Terence Tao.

L'idée de T. Tao est aussi simple que belle: on colore en vert tous les rectangles ayant un côté horizontal entier, et en rouge tous les autres rectangles. Un argument topologique de connexité nous assure alors que dans le grand rectangle on peut relier les deux côtés verticaux par un chemin vert ou les deux côtés horizontaux par un chemin rouge. (Pour ceux qui ne connaissent pas encore la notion de connéxité : c'est une sorte de théorème des valeurs intermédiaires qui dit que deux lignes reliant les côtés opposés se coupent forcément). Or un chemin vert consiste en la juxtaposition de rectangles verts, donc sa longueur horizontale est entière; et de manière analogue pour un chemin rouge.

Vous pouvez lire la solution complète ici.

Cette "solution" m'a laissé perplexe car sur les trois premières pages l'auteur n'avance pas beaucoup, puis au tout dernier paragraphe il évoque, sans les traiter, quelques obstacles qui pourraient éventuellement se poser. Et avec un peu d'esprit critique on trouve que la démonstration est fausse! Voici un contre-exemple.

 
contre-exemple à une solution en géométrie

 
La largeur est 4 et la hauteur est 3,5. Pourtant il n'y a pas de chaîne verte mais seulement une chaîne rouge dont on ne peut rien déduire sur la hauteur (car elle possède des décalages) ni sur la largeur (car les rectangles rouges n'ont pas de largeurs entières).

Mais Terence Tao ne serait pas Terence Tao, porteur de la Médaille Fields 2006 (sorte de prix Nobel pour mathématiciens), si l'idée de sa preuve était entièrement fausse ! En effet, après une petite recherche sur internet, je me rends sur son blog personnel et j'y trouve une liste d'errata où il corrige, entre autres, cette preuve. Voici l'amélioration qu'il apporte:

On colore les rectangles comme avant, mais seulement leurs intérieurs. Ensuite on colore en vert les côtés verticaux ouverts, et le reste en rouge.

Maintenant mon contre-exemple ne résiste plus! On peut relier les deux côtés verticaux par un chemin vert.

dessin d'une exemple pour le problèmes des rectangles entiers

 
Pourquoi cette démonstration améliorée fonctionne-elle ? Et bien, lorsqu'on parcourt un chemin vert disons, alors chaque fois qu'on quitte un rectangle vert pour passer dans un autre, ça se fait sur un segment vertical dont l'abscisse est un entier.

Voilà donc une jolie solution purement topologique, sans analyse. Je ne pense pas qu'elle s'adapte aux dimensions supérieures.

Conseils aux étudiants pour une bonne rédaction

Souvent les étudiants en première année ont une idée intuitive pour une preuve mais lorsqu'ils l'écrivent avec les termes de la logique mathématique leur rédaction est très maladroite, voire fausse ou illisible. Ces lignes leur sont destinées. Je vais montrer sur des exemples très simples ce qu'il faut faire et ce qu'il faut éviter.

Syntaxe d'une assertion

Une assertion (ou proposition) mathématique est une phrase contenant un verbe. Les verbes mathématiques sont par exemple

=\;\;\;<\;\;\;>\;\;\;\leq\;\;\;\geq\;\;\;\subset\;\;\;\supset\;\;\;\in\;\;\;\ni\;\;\;\Rightarrow\;\;\;\Leftarrow\;\;\;\Leftrightarrow\;\;\;\perp\;\;\;\parallel

et leurs négations. Par exemple

7 + 1 = 8

est une assertion (qui est vraie), et

1 < 0

est une assertion (qui est fausse). Mais

7+1

n'est pas une assertion car elle ne contient pas de verbe, donc on ne peut pas se demander si elle est vraie ou fausse. Entre deux assertions équivalentes on n'écrit pas = mais le symbole \Leftrightarrow. Ce symbole étant lui-même un verbe c'est donc un emboîtement d'assertions (pensez aux poupées russes).
Ecrire
1 \leq x \leq 5\;\;\Leftrightarrow\;\; [1,5]
n'a aucun sens car [1,5] n'est pas une assertion (c'est un intervalle). En revanche, on peut écrire
1 \leq x \leq 5\;\;\Leftrightarrow\;\; x\in [1,5].

Il ne suffit pas de mettre un verbe pour avoir une assertion, il faut aussi que la syntaxe soit correcte. Par exemple écrire \{7\}\in\mathbb{N} et 7\subset\mathbb{N} n'ont pas de sens. Mais \{7\}\subset\mathbb{N} et 7\in\mathbb{N} sont des assertions (qui sont vraies d'ailleurs).
Le langage mathématique suit les mêmes règles que notre langage habituel (phrase principale, phrase relative, conjonctions,...). Si quelqu'un vous disait
Nous ¤ camping # faisez ((à pluie sec
pouvez-vous dire qu'il dit la vérité ou non ? Non, vous ne pouvez pas ! Or c'est précisément ce que certains étudiants écrivent sur leurs copies de mathématiques : des juxtapositions de symboles qui ne donnent aucun sens. Et donc nous, les correcteurs, ne pouvons pas donner de point pour ce charabia.
Les symboles ne sont que des raccourcis d'écriture. Vous devriez être capables de rédiger sans eux. Si la traduction en langage français de ce que vous écrivez à l'aide de symboles n'a pas de sens, alors il y a un problème.

Introduire les objets avant leur utilisation

Ne faites jamais apparaître un objet sans l'introduire. Par exemple n'écrivez pas

x^2-6x+5=0\;\;\Leftrightarrow\;\; S=\{1,5\}.

Peut-être votre enseignant au lycée vous a donné cette mauvaise habitude, mais la lettre S n'est pas universellement reconnue pour désigner l'ensemble de solutions d'une équation. Il faut donc faire précéder par une petite phrase comme : Notant S l'ensemble de solutions de l'équation x²-6x+5=0 on obtient... Mais cela est bien lourd. Ecrivez donc plus simplement
x^2-6x+5=0\;\;\Leftrightarrow\;\; x\in\{1,5\}.

Exemples de bonne syntaxe

Les théorèmes 1, 2 et 3 ci-dessous sont des assertions. Les deux premiers sont équivalents ; et chacun d'entre eux implique le troisième.

Théorème 1.  Soit a\in \mathbb{R}. Alors la fonction f définie par f(x)=ax pour tout réel x est strictement croissante sur \mathbb{R} si et seulement si a > 0.
Théorème 2.  Pour tout réel a la fonction f définie par f(x)=ax pour tout réel x est strictement croissante sur \mathbb{R} si et seulement si a > 0.
Théorème 3.  Si a > 0 est un réel alors la fonction f définie par f(x)=ax pour tout réel x est strictement croissante sur \mathbb{R}.
La preuve du théorème 2 devrait commencer comme suit.
Preuve du théorème 2.  Soit a un réel. Blabla...
Evidemment on aurait pu écrire soit b un réel et continuer à travailler avec ce b. Ca serait tout à fait correct car dans le théorème 2 le réel a est une variable locale car précédé par le quantificateur \forall. Ecrire soit a un réel ou soit b un réel revient à fixer ce réel ce qui en fait une variable globale pour la suite du raisonnement.
C'est le moment de mentionner une subtilité. Le théorème 1 commence par soit a un réel. De ce fait a est déjà fixé (une variable globale) dans le théorème 1 et ça serait inutile et même faux de commencer la preuve par dire soit a un réel. Il est déjà donnée et nous devons travailler avec lui et pas avec un autre a ni un autre b.

Mauvaise rédaction de la preuve

Preuve du théorème 2 (version débutant).
Soit a un réel. Supposons a > 0. Il faut montrer que pour tous réels x, y tels que x < y on a f(x) < f(y). Or x < y et a > 0 entraînent ax < ay ou encore f(x) < f(y). Donc f est strictement croissante.
Réciproquement supposons que f est strictement croissante, c'est-à-dire pour tous réels x, y tels que x < y on a f(x) < f(y). On voit sur l'inégalité ax < ay que a doit être forcément positif, sinon l'inégalité devrait être dans l'autre sens.
Trois erreurs :
  • On voit sur l'inégalité ax < ay .... Or les symboles x et y n'ont pas été introduits précédemment. Il fallait écrire soit x et y....
  • La fin du raisonnement devrait être... n'est pas clair.
  • Le débutant écrit il faut montrer que... puis il donne la définition d'une fonction strictement croissante. Or redonner une définition tellement basique c'est presqu'un insulte vis-à-vis du correcteur ! Evitez de redonner des définitions que tout le monde connaît et n'écrivez pas ce que vous voulez démontrer si c'est déjà écrit clairement dans l'énoncé.
    En revanche, si ce que vous allez démontrer est une reformulation équivalente ou seulement une condition nécessaire pour la proposition que vous cherchez à prouver alors il est souhaitable que vous écrivez "je vais démontrer ceci...". Par exemple c'est une bonne idée d'écrire : Soit a > 0. Pour montrer que la fonction définie par f(x)=ax pour tout réel x est strictement croissante sur R je vais prouver que sa dérivée est strictement positive.

Bonne rédaction

Preuve du théorème 2 (version de l'étudiant expérimenté).
Soit a un réel.
Supposons a > 0. Soient x, y deux réels tels que x < y. Alors on a
f(x) = ax < ay = f(y). Cela prouve que f est strictement croissante.

Réciproquement supposons f strictement croissante. Alors l'inégalité 0 < 1 entraîne l'inégalité f(0) < f(1). Cela prouve que a = f(1) > f(0) = 0.

Structure d'une preuve

Exemple de structure d'une preuve bien rédigée :

Enoncé.  Soient A et B des ensembles et f une application de A dans B. Montrer que si on a l'hypothèse (H) ... alors f est injective.
Preuve.
Supposons (H). Soient x et y deux éléments de A tels que f(x) = f(y) ......
...... (je raisonne) ...... j'utilise la propriété (H) ...... (je raisonne) ...... j'obtiens x = y.
Cela prouve l'injectivité de f.
Autrement dit, vous introduisez deux éléments x et y qui vérifient l'égalité f(x) = f(y), puis vous gardez en tête que vous voulez arriver à l'égalité x = y. Si vous voulez vous pouvez l'écrire x = y en bas de votre page pour savoir où vous voulez arriver. Mais surtout ne l'écrivez pas plus tôt car c'est votre but et non votre point de départ ! Sur le chemin du raisonnement vous devez, très probablement, utiliser la propriété (H).
Preuve alternative (par contraposition).
Supposons (H). Soient x et y deux éléments distincts de A ......... (je raisonne) ........
........ j'utilise la propriété (H) ........ (je raisonne) ........ je trouve que f(x) est différent de f(y). Cela prouve l'injectivité de f.

Autre conseil

Mon collègue et ami Laurent Kaczmarek a écrit des conseils de rédaction utiles concernant la notation des fonctions en analyse.

Fibres d'une application complexe

Hier Pierre Lecomte a posé dans son blog un exercice sur des angles et la cotangente qui m'a inspiré la généralisation complexe suivante.

Notons

A :=\left\{ (\alpha,\beta,\gamma)\in(\mathbb{C}\setminus\pi\mathbb{Z})^3\;|\; \alpha+\beta+\gamma\in\pi\mathbb{Z}\right\}.

Question:
Déterminer les fibres de l'application f\: :\; A\: \to \: \mathbb{C}^3 définie par

f(\alpha,\beta,\gamma)=(\cot\beta\cot\gamma,\,\cot\alpha\cot\gamma,\,\cot\alpha\cot\beta).

Réponse:
Soit H est l'hyperplan de C3 d'équation u+v+w=1 et Dk, k=1,2,3, les droites

D_1=(1,0,0)+\mathbb{C}(0,1,-1), \;\;D_2=(0,1,0)+\mathbb{C}(1,0,-1), \;\;D_3=(0,0,1)+\mathbb{C}(1,-1,0).

Notons D'1=D1\{(1,0,0)}, D'2=D2\{(0,1,0)}, D'3=D3\{(0,0,1)} les droites épointées. Alors l'image de f est

f(A)=H\setminus(D'_1\cup D'_2\cup D'_3).
Les fibres de f en les points (1,0,0),(0,1,0) et (0,0,1) sont une union dénombrable de plans complexes (desquels on a enlevé des points isolés), tandis que la fibre en tout point de H\setminus(D_1\cup D_2\cup D_3) est discrète. Plus précisément, la restriction de f à f^{-1}(H\setminus(D_1\cup D_2\cup D_3)) est un revêtement au-dessus H\setminus(D_1\cup D_2\cup D_3).

Preuve:
D'abord nous remarquons que la formule d'addition

\cot(\alpha+\beta)=\dfrac{\cot\alpha\cot\beta-1}{\cot\alpha+\cot\beta}

peut s’écrire aussi comme \cot\beta\cot(-\alpha-\beta)+\cot\alpha\cot(-\alpha-\beta)+\cot\alpha\cot\beta=1. Cela signifie que pour tout (\alpha,\beta,\gamma)\in(\mathbb{C}\setminus\pi\mathbb{Z})^3 on a

\cot\beta\cot\gamma+\cot\alpha\cot\gamma+\cot\alpha\cot\beta=1
\quad\Leftrightarrow\quad
\alpha+\beta+\gamma\in\pi\mathbb{Z}.
Par conséquence l'image de f est contenue dans l'hyperplan H.
Soit maintenant (\alpha,\beta,\gamma)\in A.
  • Premier cas: \alpha\in\frac\pi2+\pi\mathbb{Z}. Alors \beta+\gamma\in\frac\pi2+\pi\mathbb{Z} et par conséquence \cot\beta=\tan\gamma et on a f(\alpha,\beta,\gamma)=(1,0,0).
  • Second cas: \alpha\not\in\frac\pi2+\pi\mathbb{Z}. Supposons par l'absurde que la première coordonnée de f(\alpha,\beta,\gamma) est égale à 1. Ainsi \cot\beta\cot\gamma=1 et \cot\alpha\cot\gamma+\cot\alpha\cot\beta=0. Alors \cot\beta=-\cot\gamma. Par conséquence (\cot\beta)^2=-1, c'est-à-dire \cot\beta=\pm i. C'est une contradiction, car la cotangente est une application de \mathbb{C}\setminus\pi\mathbb{Z} sur \mathbb{C}\setminus\{\pm i\}.
On vient de prouver que l'image de f ne contient pas la droite épointée D'1, et par permutation des coordonnées elle ne contient ni D'2 ni D'3. Les seuls points de l'image de f ayant une coordonnée 0 ou 1 sont les trois points (1,0,0), (0,1,0) et (0,0,1). On vient aussi de voir que la fibre en (1,0,0) est

f^{-1}(1,0,0)=\left(\frac\pi2+\pi\mathbb{Z}\right)\times\left{(\beta,\,\gamma)\in(\mathbb{C}\setminus\pi\mathbb{Z})^2\,|\,\beta+\gamma\in\frac\pi2+\pi\mathbb{Z}\right}.
De même on obtient les fibres en (0,1,0) et (0,0,1) par permutation des coordonnées.

Montrons maintenant que la restriction de f réalise un revêtement au-dessus H\setminus(D_1\cup D_2\cup D_3). Notons arccot la fonction réciproque de la cotangente. C'est une fonction analytique multivaluée sur \mathbb{C}\setminus\{\pm i\}, primitive de s=-dz/(1+z2). On remarque que le résidu de s en i (resp. -i) vaut i/2 (resp. -i/2). Donc un petit tour dans le sens positif autour de +i (resp. -i) ajoute -\pi (resp. \pi) à la détermination de arccot.
Soit (u,v,w) dans H tels que u>0, v>0 et w>0. En résolvant l'équation f(\alpha,\beta,\gamma)=(u,v,w) on trouve:

(*)    (\alpha,\beta,\gamma)=\left(\rm{arccot}\left(\sqrt{\frac{vw}u}\right),\,\rm{arccot}\left(\sqrt{\frac{uw}v}\right),\, \rm{arccot}\left(\sqrt{\frac{uv}w}\right)\right),\;\;\;u,v,w>0.
Cette formule (*) se prolonge analytiquement sur tout H\setminus(D_1\cup D_2\cup D_3). Pour voir cela il suffit de vérifier que les valeurs des racines évitent les points ±i où arccot n'est pas défini. Supposons par l'absurde que (vw/u)½i. Alors vw/u=-1. Avec l'égalité u+v+w=1 cela implique v=1 ou w=1. Donc (u,v,w)=(0,1,0) ou (0,0,1), points qui ne sont pas dans H\setminus(D_1\cup D_2\cup D_3). Le prolongement analytique est donc possible, on obtient bien un revêtement, ce qui termine la preuve.

Si u fait un petit tour autour de 0 alors la détermination de la racine change de + en -. Vu que pour tout réel x on a \rm{arccot}(-x)=\pi - \rm{arccot}(x) on obtient alors l'autre solution

(**)    \left(\pi-\rm{arccot}\left(\sqrt{\frac{vw}u}\right),\,\pi-\rm{arccot}\left(\sqrt{\frac{uw}v}\right),\, \pi-\rm{arccot}\left(\sqrt{\frac{uv}w}\right)\right),\;\;\;u,v,w>0.

Regardons le cas particulier où on prolonge (*) d'un point (u,v,w) dans H avec u>0, v>0, w>0 vers un point (u',v',w') dans H avec u'<0, v'<0, w'>0. Essentiellement il y a à choisir entre deux types de chemins:

  • Dans le plan de la variable u on fait un petit demi-tour (sens positif) autour de l'origine et dans le plan des v on fait la même chose. (Le point w reste proche de 1.) Le prolongement de (*) le long de ce chemin aboutit à
    (I)    \left(\rm{arccot}\left(\sqrt{\frac{vw}u}\right),\,\rm{arccot}\left(\sqrt{\frac{uw}v}\right),\, \rm{arccot}\left(-\sqrt{\frac{uv}w}\right)\right),\;\;\;u,v<0,\:w>0.
  • La variable u fait un petit demi-tour autour de l'origine et v fait la même chose mais dans le sens opposé. Le prolongement de (*) le long de ce chemin aboutit à
    (II)    \left(\rm{arccot}\left(-\sqrt{\frac{vw}u}\right),\,\rm{arccot}\left(-\sqrt{\frac{uw}v}\right),\, \rm{arccot}\left(\sqrt{\frac{uv}w}\right)\right),\;\;\;u,v<0,\:w>0.
Evidemment ces deux formules n'ont pas besoin de prolongement analytique pour être démontrées. Si la formule (I) donne un triplet de somme k\pi alors la formule (II) donne un triplet de somme (3-k)\pi.

Une génération dyslexique en maths

Je me rappelle qu'une fois, en plein concert à la Philharmonie de Munich, le pianiste Alfred Brendel interrompit son jeu car le public qui toussait. Il se retournait vers la salle et disait : "Die Grundlage der Musik ist die Stille." Traduction : la base de la musique c'est le silence.

J'aimerais adapter cette phrase aux mathématiques : "La base des mathématiques c'est le calcul". Et je pense au calcul le plus simple, les opérations élémentaires qui devraient être maîtrisées par tous les citoyens d'un pays moderne (à l'exception de quelques rares personnes souffrant d'une sorte de dyslexie des nombres) : addition, soustraction, multiplication et division. Si les élèves ne savent plus calculer, le professeur devrait arrêter son cours, comme Alfred Brendel, et le reprendre plus tard...

Autrefois, grâce à la scolarisation, le savoir progressait d'une génération à l'autre
Dans cet extrait de film des années cinquante un représentant essaie en vain de dissuader Ma and Pa Kettle que 25 divisé par 5 donne 14.

Aujourd'hui c'est le récul: beaucoup de bachéliers ne savent plus calculer
Lorsque j'enseignais en deux classes de terminale ES dans un lycée en région parisienne, j'étais confronté à un problème majeur : le programme du baccalauréat porte sur les dérivées et les intégrales, les logarithmes et les exponentielles. Or la majorité de ces élèves en terminale ne connaissait pas les règles élémentaires de calcul, beaucoup confondaient l'addition avec la multiplication et la soustraction avec la division. Voici un florilège extraits de quelques copies de bacs blancs :

Confusion entre division et soustraction

Confusion entre multiplication et division

Grande confusion des opérations de base

Non-compréhension d'une égalité                Difficultés avec les fractions

Tout ça pourrait faire rire si ce n'étaient que quelques cas isolés. Mais ce type d'erreurs n'est plus exceptionnel, il est devenu la règle (voir mes statistiques). Il semble qu'aujourd'hui il est impossible de demander à un élève en terminale d'effectuer un calcul élémentaire sans faire d'erreur. Le nombre d'élèves acceptés en première (même en section S) et qui ne connaissent pas la table de multiplication est légion.

Le roi est nu
Certains diront que tout cela n'a pas d'importance car les mathématiques n'interviennent que peu dans notre vie quotidienne et que d'autres facilités sont plus déterminantes pour bien réussir dans la vie. Peut-être. Je serais le dernier à exiger que tous mes co-citoyens connaissent les logarithmes et les intégrales. Mais ce qui me gêne beaucoup c'est que le calcul élémentaire n'est pas acquis et qu'en même temps on habitue les élèves à utiliser un langage de bois mathématique qui prétend qu'il y a une compréhension des objets impliqués tandis qu'au fond rien n'est compris. Sous un splendide manteau de termes savants (intégrales, limites, théorème des valeurs intermédiaires, etc.), le roi est nu ! C'est digne des Impostures intellectuelles à la Sokal-Bricmont...
Evidemment il est impossible, en dernière année de lycée, de rattraper avec des cours de soutien toutes ces bases manquées. Soit on fait les choses correctement dès le départ, soit on ne les fait pas, c'est-à-dire on élimine des programmes scolaires le calcul supérieur avec les fonctions.

Ci-dessous un dernier exemple qui me rend heureux et triste à la fois — triste car cet élève ne maîtrise pas du tout le programme du collège (règles de calcul avec les fractions), et heureux car il a appris ce que je lui enseignais en terminale (règles de dérivation). Mais en fin de compte, quelle est la valeur de ses connaissances en calcul différentiel s'il ne sait pas simplifier correctement la fraction qu'il obtient ?

La question posée était de dériver la fonction f(x)=x-\ln(4x-2). Voici sa réponse :

Simplification d'une fraction

Concevoir la notion d'application

Je me rappelle qu'au début de mes études de mathématiques, parfois une simple question de formalisme pouvait me poser des problèmes. Par exemple, j'avais du mal à jongler entre différents points de vue d'une notion a priori simple comme celle d'application. Voici quelques lignes qui pourraient sembler bêtes aux initiés, mais comme les livres expliquent rarement ce genre de choses en détail elles peuvent être utiles à ceux qui y sont confrontés pour la première fois — et notamment aux élèves et étudiants d'aujourd'hui qui, lors de leur parcours scolaire, ne rencontrent plus assez de théorie des ensembles.


Considérons une application (synonyme de fonction) d'un ensemble X dans un ensemble Y.

f\;:\; X \;\longrightarrow \;Y\,,\;\; x \; \longrightarrow\;f(x)\,.

(Désolé, la deuxième flèche devrait commencer par un pied mais mon plug-in LaTeX ne le permet pas.)

Si vous venez de passer le bac, vous avez déjà une notion intuitive de ce que c'est une application. Mais les mathématiciens possèdent plusieurs autres points de vue pour concevoir cet objet — et chacun a sa raison d'être.

  1. Point de vue y en fonction de x.
    C'est le point de vue habituellement enseigné au collège et au lycée. On conçoit x comme variable et y comme l'image qui change en fonction de x.
    Le schéma mental est le suivant.

    dessiner le graphe d'une fonction, comprendre les fonctions

    L'ensemble de départ X est représenté horizontalement, l'ensemble d'arrivée Y est représenté verticalement. La donnée de l'application f revient à la donnée de son graphe \Gamma \subset X\times Y constitué des couples (x,f(x)), où x parcourt X.
    En disant x parcourt X, on adopte donc bien l'idée que la variable est x.
     
  2. Point de vue collection d'éléments de Y.
    On peut aussi écrire l'application f en forme de famille (f(x))_{x\in X}. On oublie donc de spécifier l'ensemble d'arrivée Y.
    En général, une famille (y_j)_{j\in J} dans Y n'est rien d'autre qu'une application

    y\;:\; J \;\longrightarrow \;Y\,,\;\; j \; \longrightarrow\;y_j\,,

     
    où l'ensemble de départ J est appellé l'ensemble d'indices ; très souvent il n'a pas d'importance et peut être remplacé par un autre ensemble de même cardinal. Ce qui compte dans ce point de vue c'est simplement la collection des images de l'application.
    Dans certaines situations un bon choix de l'ensemble d'indices peut raccourcir les écritures. Par exemple, si (b_j)_{j\in J} est une base d'un K-espace vectoriel E, alors tout vecteur v de E se décompose comme combinaison linéaire

    v=\sum_{j\in J} \lambda_j\, b_j\:,

    (\lambda_j)_{j\in J} est une famille de scalaires presque tous nuls (c'est-à-dire l'application \lambda\;:\; J \;\longrightarrow \;K\, est nulle sauf en un nombre fini de points ; cela est nécessaire pour pouvoir prendre la somme). Mais si on conçoit la base non comme une famille de vecteurs mais comme un sous-ensemble B de l'espace E, alors on peut la prendre elle-même comme ensemble d'indices et écrire simplement

    v=\sum_{b\in B} \lambda_b\, b\:.


     
  3. Point de vue les fibres en fonction de y.
    Pour chaque y dans Y on appelle fibre de f en y (ou ensemble de niveau y) l'ensemble de tous les antécédents de y, noté
     
    f_y\;=\;f^{-1}(\{y\:\})\:=\:\{\:x\in X\; :\; f(x)=y\:\} \,.

     
    Connaître une application revient à connaître la collection de ses fibres. C'est donc y qu'on considére comme variable. On s'aide du schéma mental suivant.
     

    représenter une fonction graphiquement, comprendre une fonction


    L'espace de départ est projeté sur l'espace d'arrivée. L'application est injective (resp. surjective resp. bijective) si et seulement si chaque fibre possède au plus (resp. au moins resp. précisément) un élément.
     
Une conséquence naturelle du point de vue des fibres est la factorisation canonique, que nous allons expliquer ci-dessus et dont la quintessence se résume ainsi :
L'ensemble des fibres non-vides d'une application est une partition de l'ensemble de départ et a le même cardinal que l'image de l'application.

Factorisation canonique

Nous nous proposons de montrer que toute application est la composée d'une surjection, d'une bijection et d'une injection. Soit donc f une application de X vers Y. On considère son image

\tilde{Y} = f(X)\:\subset\:Y

et l'espace des fibres

\tilde{X} = \{\,f^{-1}(\{y\})\:|\: y\in \tilde{Y}\,\}\:\subset\:{\scr P}(X).

Ainsi l'espace des fibres est le quotient de X par la relation d'équivalence  ~  qui est définie par  x ~ x'  si et seulement si f(x) = f(x'). Il est clair que \tilde{X} et \tilde{Y} sont en bijection. Plus précisément il existe une surjection \pi, une bijection \tilde{f} et une injection j tel que le diagramme suivant commute.

Factorisation canonique d'une fonction, comment comprendre les applications

En effet, il suffit de prendre pour \pi la projection canonique sur le quotient X/~, c'est-à-dire l'application qui à chaque x dans X associe la fibre de f en f(x) ; puis pour j l'injection naturelle, et enfin pour \tilde{f} l'application qui envoie une fibre sur l'unique élément dans Y qui est son image par f. Il est alors évident que f est la composée

f= j\circ \tilde{f}\circ \pi.

Un avant-goût de la suite

Concevoir une application comme la collection de ses fibres est très fréquent en topologie, géométrie algébriques et théorie des singularités. On fait varier un point dans l'espace d'arrivée pour observer, dans l'espace de départ, la manière dont varie la fibre au-dessus de ce point. Un exemple très basique est l'application

f\;:\; \mathbb{R}^3 \;\longrightarrow \;\mathbb{R}\,,\;\; (x,y,z) \; \longrightarrow\;ax+by+cz\,,

 
a,b,c sont des réels fixés non tous nuls. La collection des fibres est constituée de plans parallèles. Il s'agit donc d'un feuilletage de l'espace \mathbb{R}^3 par plans (comme un feuilleté). Les fibres se ressemblent toutes ; on a même ce qu'on appelle une fibration globalement triviale.

Plus généralement, si f est une fonction différentiable et si on fait varier le point dans l'espace d'arrivée sans toucher les valeurs critiques, alors localement les fibres se ressemblent toutes (fibration localement triviale). En revanche, si on passe par une valeur critique alors la nature des fibres peut changer. Par exemple si on traverse la valeur critique 0 de l'application

g\;:\; \mathbb{R}^2 \;\longrightarrow \;\mathbb{R}\,,\;\; (x,y) \; \longrightarrow\;x^2+y^2\,,

dans le sens décroissant, alors la fibre est d'abord un cercle, puis dégénère en un point et, enfin, devient vide — une catastrophe a lieu au sens de la théorie des catastrophes de René Thom.

Tout ça devient plus intéressant dans le complexe. Les fibres de

g\;:\; \mathbb{C}^2 \;\longrightarrow \;\mathbb{C}\,,\;\; (x,y) \; \longrightarrow\;x^2+y^2\,,

sont des surfaces réelles (courbes complexes ou surfaces de Riemann). Et au lieu de traverser la valeur critique 0, on peut la contourner avec un petit lacet dans le plan complexe et observer la déformation de cette surface le long du lacet. Evidemment à la fin on retrouve la même surface qu'au début du lacet, mais lors du trajet certaines caractéristiques se sont déplacés continûment et ont échangés leurs places... (monodromie).

Remarques sur l'enseignement des math au collège

Constat : Lacunes dans le post-bac

Il y a quelques semaines, lors d'une colle en prépa MPSI (math sup) sur les développements limités, une étudiante était amenée à calculer la somme de trois fractions,

\frac3{40}\;+\;\frac1{12}\;+\;\frac3{8}\;.

Voici comment elle s'y prenait (avec mon téléphone portable j'ai pris la photo du tableau) :

réduire au même dénominateur
A éviter : dénominateur inutilement grand

Ce qui est gênant dans cette histoire c'est que cette étudiante n'est pas une mauvaise élève, mais apparemment au collège on ne lui a pas enseigné qu'il faut toujours privilégier le plus petit dénominateur commun pour additionner des fractions. En effet, cela évite des grands nombres difficiles à gérer ; le plus petit dénominateur commun n'est pas le produit 40x12x8 des trois dénominateurs ! Il fallait procéder comme suit :

\begin{array}{rcl}
\frac3{40}\;+\;\frac1{12}\;+\;\frac3{8} \;&=&\;\frac3{2^3\times5}\;+\;\frac1{2^2\times3}\;+\;\frac3{2^3} \\
\;&=&\;\frac{3\times3}{2^3\times3\times5}\;+\;\frac{2\times5}{2^3\times3\times5}\;+\;\frac{3\times3\times5}{2^3\times3\times5}
\\&&\phantom{\frac{\frac AA}{\frac AA}}\\
\;&=&\;\frac{9+10+45}{2^3\times3\times5}\;=\;\frac{64}{2^3\times3\times5}\;=\;\frac{8}{3\times5}\;=\;\frac{8}{15}
\end{array}

On voit sur la première ligne ci-dessus que le plus petit dénominateur commun est 2^3\times3\times5 car c'est le plus petit nombre qui contient les facteurs premiers qu'on obtient en décomposant chaque dénominateur. Autrement dit, c'est le plus petit commun multiple (PPCM) des trois dénominateurs.
On remarque d'ailleurs que je n'ai pas vraiment calculé ce dénominateur, je l'ai laissé sous forme de produit car à la fin cela permet de simplifier plus facilement...

Les nombres premiers ont disparu du collège

Comment se fait-il que certains élèves arrivent aujourd'hui en classes préparatoires de sciences et ne savent pas manipuler correctement des fractions ? La réponse est que la décomposition en produit de facteurs premiers est enseignée beaucoup trop tard et seulement à une partie des bacheliers scientifiques ; en effet, elle n'est plus au programme du collège mais seulement au programme de l'option mathématiques en terminale S.

Il fut une époque en France (pas lointaine et dans autres pays on y est toujours) où tout les enfants apprenaient à l'âge de dix ou onze ans de décomposer un nombre entier en facteurs premiers.

Valeurs pédagogiques et conceptuelles de cette décomposition :

  • On apprend à décomposer un grand problème en petits problèmes, certaines composantes, les nombres premiers, étant irréductibles comme des atomes — ou les briques d'un jeu de légo.
  • On trouve facilement le PGCD et le PPCM de deux, trois, quatre nombres ou plus à partir de leurs décompositions en nombres premiers. (En revanche, l'algorithme d'Euclid s'applique seulement à deux nombres à la fois.)
  • Avec le PPCM on rencontre le concept de la réunion d'ensembles et la signification exacte du mot ou.
  • Avec le PGCD on rencontre le concept de l'intersection et la signification exacte du mot et. Ce sont d'ailleurs des notions importantes en probabilités.
  • On apprend sa table de multiplication...

On se demande vraiment pour quelle raison mystérieuse l'Inspection Générale a-t-elle ôté des programmes le concept simple et fondamental de la décomposition en nombres premiers ? Pour trouver le PGCD de deux nombres elle préconise l'algorithme d'Euclide ! Or cet algorithme est moins intuitif et son fonctionnement plus délicat à comprendre que la décomposition en nombres premiers. Son seul avantage est qu'il marche bien avec les très grands nombres — autrement dit, il n'a aucun intérêt pédagogique... Un jeune esprit a besoin d'apprendre des idées, des concepts et pas quelques recettes pour manipuler de nombres élevés, nombres qui n'ont aucun intérêt, ni pour lui ni pour nous autres mathématiciens (sauf quelques spécialistes en cryptographie, informatique ou théorie des nombres) ! D'abord un enfant doit maîtriser la manipulation des petits nombres, se faire une idée de leurs multiples, de leur diviseurs, et ce défi n'est point gagné à l'époque de la calculatrice...
Supprimer l'enseignement de la décomposition en facteurs premiers était donc une grave erreur et qui plus tard devient source de lacunes ; en plus c'était une occasion manquée de réviser les tables de multiplication.

Plus de vraies constructions géométriques au collège ?

Pour finir, voici deux exemples de l'enseignement actuel de la géométrie, extraits du manuel scolaire Transmath 6e (Nathan 2005). Dans les deux cas l'approximatif remplace une idée de construction simple et précis :

Bissection d'un angle.  On ne fait plus appel à la symétrie !

construire la bisectrice
Bissectrice — méthode approximative avec pauvre valeur pédagogique

Encore une fois, une belle idée conceptuelle est remplacée par un procédé rapide qui n'a pas de valeur pédagogique, comme s'il s'agissait de faire croire aux enfants que plus tard dans la vie ils seraient amenés quotidiennement à diviser des angles ! Or ce qui est intéressant dans la division d'un angle par deux, ce n'est pas le résultat lui-même mais la manière dont on l'obtient, à savoir par un simple concept, la symétrie : si je fais la même construction des deux côtés d'un angle alors j'obtiens une figure symétrique.
Voici donc la vraie construction avec règle et compas telle qu'elle devrait être enseignée :

construire la bissectrice
Bissectrice — la vraie construction intéressante

Parallèle à une droite.  En appliquant la bissection d'un angle au cas particulier de 180° on obtient une perpendiculaire ; et en faisant la même chose à cette perpendiculaire on trouve une parallèle. C'est une idée simple et facile à retenir. Mais qu'est-ce qu'on enseigne à la place ? La construction approximative que voici :

construire une parallèle
Parallèle passant par un point — méthode avec peu d'intérêt

La promenade

Trois femmes se promènent sur une allée de 100 m de long, d'un bout à l'autre. Lorsqu'une femme atteint la fin de l'allée elle fait demi-tour. Les vitesses respectives des trois femmes sont constantes et valent 1 km/h, 2 km/h et 3 km/h. Montrer qu'il existe un intervalle de temps d'une durée au moins d'une minute durant lequel toutes les trois marchent dans la même direction.
(On peut supposer qu'il n'y pas d'hommes qui les dérangent.)