Math 'O Man : le Blog des Maths

L'application comatrice




Le cofacteur d'indice (j,k) d'une matrice carrée A est (-1)^{k+j}\det(A_{kj})A_{kj} désigne la matrice qu'on obtient en enlevant de A la k-ième ligne et la j-ième colonne. Autrement dit, si A est de format nxn alors A_{kj} est la matrice suivante de format (n-1)x(n-1)

A_{kj}=
\begin{pmatrix}a_{1,1} & \dots & a_{1,j-1}& a_{1,j+1}& \dots & a_{1,n} \\\vdots & & \vdots &  \vdots& &\vdots\\
a_{k-1,1} & \dots & a_{k-1,j-1}& a_{k-1,j+1}& \dots & a_{k-1,n} \\
a_{k+1,1} & \dots & a_{k+1,j-1}& a_{k+1,j+1}& \dots & a_{k+1,n} \\
\vdots & & \vdots & \vdots &&\vdots\\
a_{n,1} & \dots & a_{n,j-1}& a_{n,j+1}& \dots & a_{n,n}\end{pmatrix}\;.

La matrice des cofacteurs de A, s'appelle la comatrice de A, notée com(A). En résumé,

\text{com}(A) = \left((-1)^{k+j}\det(A_{kj})\right)_{1\leq k,j\leq n}

Petit exercice :  la fonction qui à une matrice associe sa comatrice est-elle un difféomorphisme du groupe linéaire GL(n,\mathbb{R}) sur lui-même ? Et de GL(n,\mathbb{C}) sur lui-même ?



Partagez-le sur Facebook Tweetez-le ! S'abonner à ce blog ? Envoyer cet article à un ami ? Le soumettre à Netvibes Ajoutez-le à Google Bookmarks

Commentaires


1. Le mardi 23 mars 2010 à 21:33, par PB

Bonjour,
Sauf erreur A=\det\left({\rm com}(A)\right)^{\frac{1}{n-1}}\;\; {}^{t}{\rm com}(A)^{-1}
a un sens et est vrai si on est sur \mathbb R et si n est pair.
Donc, dans ce cas, je pense que l'application "com" est bien un "automorphisme de groupe de Lie" (?). Dans les autres cas, je dirais bien que c'est non, mais sans justifier pour l'instant :)


2. Le mardi 23 mars 2010 à 22:39, par PB

Pardon pour l'erreur de vocabulaire : je ne devais pas dire automorphisme de groupe mais simplement difféomorphisme.


3. Le mardi 23 mars 2010 à 22:46, par JLT

Regarder les matrices diagonales...


4. Le mardi 23 mars 2010 à 23:51, par MathOMan

PB a bien vu, il faut utiliser la relation entre l'inverse et la comatrice. Et en plus, la comatrice conserve la multiplication, donc il s'agit bien d'un morphisme de groupes (PB semble avoir oublié sa propre preuve). On a

f(A) = {\rm com}(A)= \det(A) \;{}^{t}\!A^{-1}.

Donc \det(f(A)) = \det(A)^{n-1}. Si la fonction réciproque f^{-1} existe elle doit être de la forme

f^{-1}(B) = (\det(B))^{\frac1{n-1}} \;{}^{t}\!B^{-1}.

Toutes ces expressions sont analytiques — donc j'en tirerais les conclusions suivantes :

  • Dans le cas complexe f est un revêtement à n-1 feuillets de GL(n,C) sur lui-même.
    \,
  • Dans le cas réel et n pair f est un difféo (et automorphisme de groupes) de GL(n,R) sur lui-même et conserve le signe du déterminant.
    \,
  • Dans le cas réel et n impair f n'est pas surjective (les images sont de déterminant positif), mais réalise un difféomorphisme de GL_+(n,\mathbb{R}) sur lui-même. Et en plus f est un revêtement trivial à deux feuillets de GL(n,R) sur GL_+(n,\mathbb{R}).

5. Le jeudi 1 avril 2010 à 17:46, par MathOMan

Comme le remarque très bien Pierre Lecomte ici, pour montrer que l'application co-matrice est un difféo local, il suffit de le vérifier en un point quelconque (car c'est un homomorphisme de groupes). La formule ci-dessus pour l'application réciproque a l'avantage de dire plus de choses sur la globalité de ce difféo local.


Ajouter un commentaire

Pourquoi ne pas lire aussi :


La comatrice conserve la multiplication


La comatrice com(M) d'une matrice carré M d'ordre n est la matrice des cofacteurs, c'est-à-dire sa composante en (l,k) est \small{(-1)^{l+k}} fois le déterminant de la matrice qui s'obtient lorsqu'on ôte à M sa l-ème ligne et sa k-ème colonne.
Mais c'est surtout la transposée de la comatrice qui nous intéresse ; elle s'appele matrice complémentaire (en allemand Adjunkte, en anglais adjugate matrix) et on démontre dans tout cours d'algèbre linéaire qu'elle vérifie la propriété fondamentale :

^t\text{com}(M)\:M\;=\;M\:^t\text{com}(M)\;=\;\det(M)\:I\:.

Par conséquence si on travaille avec des coefficients dans un anneau A, alors la matrice M est inversible dans l'anneau matriciel à coefficients dans A si et seulement si le scalaire det(M) est inversible dans l'anneau A. Par exemple les matrices inversibles sur \small\mathbb{Z} sont précisément celles dont le déterminant est 1 ou -1.

Exercice :  Démontrer que  com  est compatible avec la multiplication matricielle,

com(I) = I      et      com(MN) = com(M) com(N).

Faut-il un corps pour la méthode du pivot ?


A l'occasion de la solution d'un joli exercice de type colle sur les matrices (voir le blog de Pierre Lecomte), je suis naturellement amené à poser la question suivante.

Soit A une matrice inversible à coefficient dans un corps. Alors par des opérations élémentaires sur les lignes on peut transformer A en la matrice unité. En fait c'est la méthode du pivot de Gauss qui permet cela. On en déduit que A est un produit de matrices correspondantes aux trois types d’opérations élémentaires (permutation de lignes, multiplication d’une ligne par un scalaire non-nul, ajout d’une ligne à une autre).
Cette écriture en produit est pratique car elle permet de prouver plein de choses. Par exemple, pour montrer que le déterminant conserve les produits il suffit de le vérifier pour la multiplication entre une matrice de ce type et une matrice quelconque — et c'est tout facile.

Or comment ça se passe-t-il sur un anneau ? Plus précisément :

Soit R un anneau commutatif et A une matrice carrée avec coefficients dans R telle que det(A) est une unité de R. On sait que A est une matrice inversible (c’est du classique, voir par exemple ici pour la formule qui donne l'inverse en fonction de (det A)-1 et de la comatrice).
Question : Peut-on ramener A à la matrice unité par des opérations élémentaires ?

Peut-être avez-vous déjà réfléchi là-dessus et connaissez la réponse...

Concevoir la notion d'application


Je me rappelle qu'au début de mes études de mathématiques, parfois une simple question de formalisme pouvait me poser des problèmes. Par exemple, j'avais du mal à jongler entre différents points de vue d'une notion a priori simple comme celle d'application. Voici quelques lignes qui pourraient sembler bêtes aux initiés, mais comme les livres expliquent rarement ce genre de choses en détail elles peuvent être utiles à ceux qui y sont confrontés pour la première fois — et notamment aux élèves et étudiants d'aujourd'hui qui, lors de leur parcours scolaire, ne rencontrent plus assez de théorie des ensembles.


Considérons une application (synonyme de fonction) d'un ensemble X dans un ensemble Y.

f\;:\; X \;\longrightarrow \;Y\,,\;\; x \; \longrightarrow\;f(x)\,.

(Désolé, la deuxième flèche devrait commencer par un pied mais mon plug-in LaTeX ne le permet pas.)

Si vous venez de passer le bac, vous avez déjà une notion intuitive de ce que c'est une application. Mais les mathématiciens possèdent plusieurs autres points de vue pour concevoir cet objet — et chacun a sa raison d'être.

  1. Point de vue y en fonction de x.
    C'est le point de vue habituellement enseigné au collège et au lycée. On conçoit x comme variable et y comme l'image qui change en fonction de x.
    Le schéma mental est le suivant.

    dessiner le graphe d'une fonction, comprendre les fonctions

    L'ensemble de départ X est représenté horizontalement, l'ensemble d'arrivée Y est représenté verticalement. La donnée de l'application f revient à la donnée de son graphe \Gamma \subset X\times Y constitué des couples (x,f(x)), où x parcourt X.
    En disant x parcourt X, on adopte donc bien l'idée que la variable est x.
     
  2. Point de vue collection d'éléments de Y.
    On peut aussi écrire l'application f en forme de famille (f(x))_{x\in X}. On oublie donc de spécifier l'ensemble d'arrivée Y.
    En général, une famille (y_j)_{j\in J} dans Y n'est rien d'autre qu'une application

    y\;:\; J \;\longrightarrow \;Y\,,\;\; j \; \longrightarrow\;y_j\,,

     
    où l'ensemble de départ J est appellé l'ensemble d'indices ; très souvent il n'a pas d'importance et peut être remplacé par un autre ensemble de même cardinal. Ce qui compte dans ce point de vue c'est simplement la collection des images de l'application.
    Dans certaines situations un bon choix de l'ensemble d'indices peut raccourcir les écritures. Par exemple, si (b_j)_{j\in J} est une base d'un K-espace vectoriel E, alors tout vecteur v de E se décompose comme combinaison linéaire

    v=\sum_{j\in J} \lambda_j\, b_j\:,

    (\lambda_j)_{j\in J} est une famille de scalaires presque tous nuls (c'est-à-dire l'application \lambda\;:\; J \;\longrightarrow \;K\, est nulle sauf en un nombre fini de points ; cela est nécessaire pour pouvoir prendre la somme). Mais si on conçoit la base non comme une famille de vecteurs mais comme un sous-ensemble B de l'espace E, alors on peut la prendre elle-même comme ensemble d'indices et écrire simplement

    v=\sum_{b\in B} \lambda_b\, b\:.


     
  3. Point de vue les fibres en fonction de y.
    Pour chaque y dans Y on appelle fibre de f en y (ou ensemble de niveau y) l'ensemble de tous les antécédents de y, noté
     
    f_y\;=\;f^{-1}(\{y\:\})\:=\:\{\:x\in X\; :\; f(x)=y\:\} \,.

     
    Connaître une application revient à connaître la collection de ses fibres. C'est donc y qu'on considére comme variable. On s'aide du schéma mental suivant.
     

    représenter une fonction graphiquement, comprendre une fonction


    L'espace de départ est projeté sur l'espace d'arrivée. L'application est injective (resp. surjective resp. bijective) si et seulement si chaque fibre possède au plus (resp. au moins resp. précisément) un élément.
     
Une conséquence naturelle du point de vue des fibres est la factorisation canonique, que nous allons expliquer ci-dessus et dont la quintessence se résume ainsi :
L'ensemble des fibres non-vides d'une application est une partition de l'ensemble de départ et a le même cardinal que l'image de l'application.

Factorisation canonique

Nous nous proposons de montrer que toute application est la composée d'une surjection, d'une bijection et d'une injection. Soit donc f une application de X vers Y. On considère son image

\tilde{Y} = f(X)\:\subset\:Y

et l'espace des fibres

\tilde{X} = \{\,f^{-1}(\{y\})\:|\: y\in \tilde{Y}\,\}\:\subset\:{\scr P}(X).

Ainsi l'espace des fibres est le quotient de X par la relation d'équivalence  ~  qui est définie par  x ~ x'  si et seulement si f(x) = f(x'). Il est clair que \tilde{X} et \tilde{Y} sont en bijection. Plus précisément il existe une surjection \pi, une bijection \tilde{f} et une injection j tel que le diagramme suivant commute.

Factorisation canonique d'une fonction, comment comprendre les applications

En effet, il suffit de prendre pour \pi la projection canonique sur le quotient X/~, c'est-à-dire l'application qui à chaque x dans X associe la fibre de f en f(x) ; puis pour j l'injection naturelle, et enfin pour \tilde{f} l'application qui envoie une fibre sur l'unique élément dans Y qui est son image par f. Il est alors évident que f est la composée

f= j\circ \tilde{f}\circ \pi.

Un avant-goût de la suite

Concevoir une application comme la collection de ses fibres est très fréquent en topologie, géométrie algébriques et théorie des singularités. On fait varier un point dans l'espace d'arrivée pour observer, dans l'espace de départ, la manière dont varie la fibre au-dessus de ce point. Un exemple très basique est l'application

f\;:\; \mathbb{R}^3 \;\longrightarrow \;\mathbb{R}\,,\;\; (x,y,z) \; \longrightarrow\;ax+by+cz\,,

 
a,b,c sont des réels fixés non tous nuls. La collection des fibres est constituée de plans parallèles. Il s'agit donc d'un feuilletage de l'espace \mathbb{R}^3 par plans (comme un feuilleté). Les fibres se ressemblent toutes ; on a même ce qu'on appelle une fibration globalement triviale.

Plus généralement, si f est une fonction différentiable et si on fait varier le point dans l'espace d'arrivée sans toucher les valeurs critiques, alors localement les fibres se ressemblent toutes (fibration localement triviale). En revanche, si on passe par une valeur critique alors la nature des fibres peut changer. Par exemple si on traverse la valeur critique 0 de l'application

g\;:\; \mathbb{R}^2 \;\longrightarrow \;\mathbb{R}\,,\;\; (x,y) \; \longrightarrow\;x^2+y^2\,,

dans le sens décroissant, alors la fibre est d'abord un cercle, puis dégénère en un point et, enfin, devient vide — une catastrophe a lieu au sens de la théorie des catastrophes de René Thom.

Tout ça devient plus intéressant dans le complexe. Les fibres de

g\;:\; \mathbb{C}^2 \;\longrightarrow \;\mathbb{C}\,,\;\; (x,y) \; \longrightarrow\;x^2+y^2\,,

sont des surfaces réelles (courbes complexes ou surfaces de Riemann). Et au lieu de traverser la valeur critique 0, on peut la contourner avec un petit lacet dans le plan complexe et observer la déformation de cette surface le long du lacet. Evidemment à la fin on retrouve la même surface qu'au début du lacet, mais lors du trajet certaines caractéristiques se sont déplacés continûment et ont échangés leurs places... (monodromie).

Preuve que SO(3) est l'espace projectif à 3 dimensions


Ci-dessus la solution pour l'exercice sur le lien entre groupe de rotation et espace projectif.

Réponses aux questions


  1. \mathbb{B}^1 est l'intervalle fermé [-1,1] et son bord \mathbb{S}^0=\{-1,1\} est constitué des deux extrémités.\mathbb{B}^2 est un disque et son bord \mathbb{S}^1 est un cercle.\mathbb{B}^3 est une ``vraie'' boule et son bord \mathbb{S}^2 est une ``vraie'' sphère.
    \;

  2. Les deux applications suivantes sont bijectives car inverses l'une de l'autre.
    \;
    <br />\mathbb{B}^n\:\longrightarrow\:\mathbb{S}^n_+\;,\;\;\;(x_1,\ldots,x_n<br />)\:\mapsto\:\big(x_1,\ldots,x_n,\sqrt{1-x_1^2-\ldots-x_n^2}\:\big)\,,

    \mathbb{S}^n\:\longrightarrow\:\mathbb{B}^n\;,\;\;\;(x_1,\ldots,x_{n+1})\:\mapsto\:(x_1,\ldots,x_n)\,.<br />

    Illustration: si on projette l'hémisphère nord sur l'hyper-plan équatorial, on obtient la boule d'unité dans cet hyper-plan.

    Projection de l'hémisphère

    Notons que dans le graphique l'axe des abscisses représente l'espace \mathbb{R}^{n}\:. Il est instructif de comprendre ce dessin déjà pour les plus basses dimensions:


    • Si n=1 alors on est dans le plan euclidien \mathbb{R}^2. Le demi-cercle supérieur \mathbb{S}^1_+ (en rouge) se projette bijectivement sur le segment \mathbb{B}^1 (en bleu).
      \;

    • Si n=2 alors on est dans l'espace plan euclidien \mathbb{R}^3 et \mathbb{S}^2 est une ``vraie'' sphère dont le dessin montre une coupe. L'hémisphère nord \mathbb{S}^2_+ (en rouge) se projette bijectivement sur le disque \mathbb{B}^2 (en bleu).
      \;



  3. Chaque droite D\in\mathbb{P}^n coupe la sphère \mathbb{S}^n en deux antipodes: ~\frac{x}{||x||}~ et ~\frac{-x}{||x||}~x est arbitraire dans D\backslash\{0\}.
    Au moins un des deux points est dans l'hémisphère nord:

    La droite coupe la sphère en exactement deux points antipodes

    De cette observation on déduit que l'applicationf\;: \;\;\;\mathbb{S}^n_+\;\longrightarrow\;\mathbb{P}^n\:,\;\;\;x\;\mapsto~\mathbb{R}x\,,

    est surjective; en plus, elle est injective en dehors de l'équateur, et deux antipodes sur l'équateur sont envoyés sur une même image. Plus précisément

    \forall x,y\in\mathbb{S}^n_+\,:\;\big[\,x\neq y\,\text{ et }\,f(x)=f(y) \:\big]\;\Rightarrow \;<br />\big[\:x=-y\;\text{ et }\;x_{n+1}=y_{n+1}=0\:\big]\,.<br />

    Par conséquence \: \mathbb{P}^n\: est en bijection avec l'ensemble obtenu à partir de \: \mathbb{S}^n_+\: par identification des antipodes sur l'équateur. Or d'après la question précédente nous savons que \: \: \mathbb{S}^n_+ \:\simeq\: \mathbb{B}^n\: \: et l'équateur n'est rien d'autre que le bord \: \mathbb{S}^{n-1}\: de \: \mathbb{B}^n\: . Par conséquence \: \: \mathbb{P}^n \,\simeq\: \mathbb{B}^n/\!\sim\: .

    \,
  4. Le résultat précédent implique en particulier que \:\mathbb{P}^1 \,\simeq\, \mathbb{B}^1/\!\sim\:.
    Or \:\mathbb{B}^1=[-1,1] et par conséquence \:\mathbb{B}^1/\!\sim\: est simplement l'intervalle [-1,1] où on a recollé -1 et 1.
    Ainsi \:\mathbb{B}^1/\!\sim\: est en bijection avec le cercle \,\mathbb{S}^1\,. Nous obtenons \mathbb{P}^1 \,\simeq\,\mathbb{S}^1. Illustration:

    Recoller un segment en un cercle

    D'autre part SO(2) est le groupe des rotations du plan euclidien orienté \mathbb{R}^2. Comme chaque rotation est déterminée de manière unique par son angle compris dans [0,2\pi[ il est évident que SO(2) est en bijection avec le cercle \mathbb{S}^1.
    Conclusion: SO(2)\simeq \mathbb{P}^1.
    \,

  5. Pour la suite voir le fichier pdf.

Mieux comprendre la topologie des matrices singulières


Mon billet récent sur la dimension maximale d'un sous-espace affine contenu dans l'ensemble des matrices non-inversibles m'a inspiré les réflexions suivantes, une sorte de version différentiable de ce résultat.

On note {\mathcal M}_n(\mathbb{R}) l'espace des matrices n x n à coefficients réels et GL(n,\mathbb{R}) le sous-ensemble des matrices inversibles. On sait que GL(n,\mathbb{R}) est un ouvert dans {\mathcal M}_n(\mathbb{R}). En effet c'est l'image réciproque de l'ouvert \mathbb{R}^* par l'application continue déterminant

\det\;:\;\; {\mathcal M}_n(\mathbb{R}) \;\rightarrow\;\mathbb{R}.

On peut même dire un peu plus : le déterminant étant polynômial en x_{11},x_{12},\dots,x_{nn} le complémentaire des matrices inversibles, c'est-à-dire l'ensemble des matrices de déterminant nul,

\mathcal{A}\; =\; {\mathcal M}_n(\mathbb{R}) \:\backslash\:GL(n,\mathbb{R})

est une hypersurface algébrique. Géométriquement parlé \mathcal{A} est un fermé de {\mathcal M}_n(\mathbb{R}) qui ressemble localement à un hyperplan (c'est-à-dire à un sous-espace affine de dimension -1). Enfin, cela est vrai en presque tous les points, ceux où la différentielle du déterminant ne s'annulle pas (points réguliers). En revanche, en les points où la différentielle du déterminant est nulle (points singuliers), l'hypersurface \mathcal{A} ne ressemble plus à un sous-espace affine. Il peut y avoir un croisement comme par exemple

algebraische Fläche, surface algébrique

ou un rétrécissement comme par exemple

Algebraische Flächen

(Pour plus d'images de surfaces algébriques visitez le la galerie de Herwig Hauser.)

Il est évident que la différentielle du déterminant est nulle à l'origine. Donc notre hypersurface {\mathcal A} possède une singularité à l'origine. Le résultat suivant dit qu'il s'agit d'une singularité de type rétrécissement, car l'hypersurface de dimension n²-1 y perd quelques dimensions — il y reste juste assez de place pour n²-n dimensions...

Proposition :

Le nombre -n est la plus grande dimension possible d'une sous-variété différentiable F de \mathcal{M}_n(\mathbb{R}) telle que 0\in F\subset {\mathcal M}_n(\mathbb{R}) \backslash GL(n,\mathbb{R})\,.
Démonstration :
  • L'ensemble des matrices dont la première ligne est nulle est un sous-espace vectoriel (et donc en particulier une sous-variété différentielle) de dimension n²-n. Evidemment il contient l'origine 0 et est contenu dans \mathcal{A}.

  • Soit F une sous-variété de {\mathcal M}_n(K) de dimension -n+1 et telle que 0\in F. Nous allons prouver que F contient une matrice inversible.
    Au voisinage de l'origine la sous-variété F est décrite par un système de n-1 équations
    f_j(x_{11},x_{12},\ldots,x_{nn})=0\,,\;\;\;j=1,\,\ldots\,,n-1,
    tel que les différentielles df_j sont linéairement indépendantes à l'origine. On résoud ce système par le théorème des fonctions implicites, c'est-à-dire on peut isoler (théorétiquement) n-1 des coordonnées et les exprimer par les autres. On a ainsi, toujours au voisiange de l'origine, n²-n+1 coordonnées variables et n-1 coordonnées isolées (fonctions différentiables des coordonnées variables).
    Maintenant je peux poursuivre mon raisonnement de la preuve du cas affine : par des permutations de lignes et de colonnes je m'arrange à ce que les coordonnées isolées soient toutes au-dessus de la diagonale matricielle ; puis je prends les coordonnées sur la diagonale toutes égales à un nombre \epsilon non-nul et proche de 0 et les autres coordonnées variables égales à 0. Ainsi j'obtiens une matrice inversible qui est dans F.

Fibres d'une application complexe


Hier Pierre Lecomte a posé dans son blog un exercice sur des angles et la cotangente qui m'a inspiré la généralisation complexe suivante.

Notons

A :=\left\{ (\alpha,\beta,\gamma)\in(\mathbb{C}\setminus\pi\mathbb{Z})^3\;|\; \alpha+\beta+\gamma\in\pi\mathbb{Z}\right\}.

Question:
Déterminer les fibres de l'application f\: :\; A\: \to \: \mathbb{C}^3 définie par

f(\alpha,\beta,\gamma)=(\cot\beta\cot\gamma,\,\cot\alpha\cot\gamma,\,\cot\alpha\cot\beta).

Réponse:
Soit H est l'hyperplan de C3 d'équation u+v+w=1 et Dk, k=1,2,3, les droites

D_1=(1,0,0)+\mathbb{C}(0,1,-1), \;\;D_2=(0,1,0)+\mathbb{C}(1,0,-1), \;\;D_3=(0,0,1)+\mathbb{C}(1,-1,0).

Notons D'1=D1\{(1,0,0)}, D'2=D2\{(0,1,0)}, D'3=D3\{(0,0,1)} les droites épointées. Alors l'image de f est

f(A)=H\setminus(D'_1\cup D'_2\cup D'_3).
Les fibres de f en les points (1,0,0),(0,1,0) et (0,0,1) sont une union dénombrable de plans complexes (desquels on a enlevé des points isolés), tandis que la fibre en tout point de H\setminus(D_1\cup D_2\cup D_3) est discrète. Plus précisément, la restriction de f à f^{-1}(H\setminus(D_1\cup D_2\cup D_3)) est un revêtement au-dessus H\setminus(D_1\cup D_2\cup D_3).

Preuve:
D'abord nous remarquons que la formule d'addition

\cot(\alpha+\beta)=\dfrac{\cot\alpha\cot\beta-1}{\cot\alpha+\cot\beta}

peut s’écrire aussi comme \cot\beta\cot(-\alpha-\beta)+\cot\alpha\cot(-\alpha-\beta)+\cot\alpha\cot\beta=1. Cela signifie que pour tout (\alpha,\beta,\gamma)\in(\mathbb{C}\setminus\pi\mathbb{Z})^3 on a

\cot\beta\cot\gamma+\cot\alpha\cot\gamma+\cot\alpha\cot\beta=1
\quad\Leftrightarrow\quad
\alpha+\beta+\gamma\in\pi\mathbb{Z}.
Par conséquence l'image de f est contenue dans l'hyperplan H.
Soit maintenant (\alpha,\beta,\gamma)\in A.
  • Premier cas: \alpha\in\frac\pi2+\pi\mathbb{Z}. Alors \beta+\gamma\in\frac\pi2+\pi\mathbb{Z} et par conséquence \cot\beta=\tan\gamma et on a f(\alpha,\beta,\gamma)=(1,0,0).
  • Second cas: \alpha\not\in\frac\pi2+\pi\mathbb{Z}. Supposons par l'absurde que la première coordonnée de f(\alpha,\beta,\gamma) est égale à 1. Ainsi \cot\beta\cot\gamma=1 et \cot\alpha\cot\gamma+\cot\alpha\cot\beta=0. Alors \cot\beta=-\cot\gamma. Par conséquence (\cot\beta)^2=-1, c'est-à-dire \cot\beta=\pm i. C'est une contradiction, car la cotangente est une application de \mathbb{C}\setminus\pi\mathbb{Z} sur \mathbb{C}\setminus\{\pm i\}.
On vient de prouver que l'image de f ne contient pas la droite épointée D'1, et par permutation des coordonnées elle ne contient ni D'2 ni D'3. Les seuls points de l'image de f ayant une coordonnée 0 ou 1 sont les trois points (1,0,0), (0,1,0) et (0,0,1). On vient aussi de voir que la fibre en (1,0,0) est

f^{-1}(1,0,0)=\left(\frac\pi2+\pi\mathbb{Z}\right)\times\left{(\beta,\,\gamma)\in(\mathbb{C}\setminus\pi\mathbb{Z})^2\,|\,\beta+\gamma\in\frac\pi2+\pi\mathbb{Z}\right}.
De même on obtient les fibres en (0,1,0) et (0,0,1) par permutation des coordonnées.

Montrons maintenant que la restriction de f réalise un revêtement au-dessus H\setminus(D_1\cup D_2\cup D_3). Notons arccot la fonction réciproque de la cotangente. C'est une fonction analytique multivaluée sur \mathbb{C}\setminus\{\pm i\}, primitive de s=-dz/(1+z2). On remarque que le résidu de s en i (resp. -i) vaut i/2 (resp. -i/2). Donc un petit tour dans le sens positif autour de +i (resp. -i) ajoute -\pi (resp. \pi) à la détermination de arccot.
Soit (u,v,w) dans H tels que u>0, v>0 et w>0. En résolvant l'équation f(\alpha,\beta,\gamma)=(u,v,w) on trouve:

(*)    (\alpha,\beta,\gamma)=\left(\rm{arccot}\left(\sqrt{\frac{vw}u}\right),\,\rm{arccot}\left(\sqrt{\frac{uw}v}\right),\, \rm{arccot}\left(\sqrt{\frac{uv}w}\right)\right),\;\;\;u,v,w>0.
Cette formule (*) se prolonge analytiquement sur tout H\setminus(D_1\cup D_2\cup D_3). Pour voir cela il suffit de vérifier que les valeurs des racines évitent les points ±i où arccot n'est pas défini. Supposons par l'absurde que (vw/u)½i. Alors vw/u=-1. Avec l'égalité u+v+w=1 cela implique v=1 ou w=1. Donc (u,v,w)=(0,1,0) ou (0,0,1), points qui ne sont pas dans H\setminus(D_1\cup D_2\cup D_3). Le prolongement analytique est donc possible, on obtient bien un revêtement, ce qui termine la preuve.

Si u fait un petit tour autour de 0 alors la détermination de la racine change de + en -. Vu que pour tout réel x on a \rm{arccot}(-x)=\pi - \rm{arccot}(x) on obtient alors l'autre solution

(**)    \left(\pi-\rm{arccot}\left(\sqrt{\frac{vw}u}\right),\,\pi-\rm{arccot}\left(\sqrt{\frac{uw}v}\right),\, \pi-\rm{arccot}\left(\sqrt{\frac{uv}w}\right)\right),\;\;\;u,v,w>0.

Regardons le cas particulier où on prolonge (*) d'un point (u,v,w) dans H avec u>0, v>0, w>0 vers un point (u',v',w') dans H avec u'<0, v'<0, w'>0. Essentiellement il y a à choisir entre deux types de chemins:

  • Dans le plan de la variable u on fait un petit demi-tour (sens positif) autour de l'origine et dans le plan des v on fait la même chose. (Le point w reste proche de 1.) Le prolongement de (*) le long de ce chemin aboutit à
    (I)    \left(\rm{arccot}\left(\sqrt{\frac{vw}u}\right),\,\rm{arccot}\left(\sqrt{\frac{uw}v}\right),\, \rm{arccot}\left(-\sqrt{\frac{uv}w}\right)\right),\;\;\;u,v<0,\:w>0.
  • La variable u fait un petit demi-tour autour de l'origine et v fait la même chose mais dans le sens opposé. Le prolongement de (*) le long de ce chemin aboutit à
    (II)    \left(\rm{arccot}\left(-\sqrt{\frac{vw}u}\right),\,\rm{arccot}\left(-\sqrt{\frac{uw}v}\right),\, \rm{arccot}\left(\sqrt{\frac{uv}w}\right)\right),\;\;\;u,v<0,\:w>0.
Evidemment ces deux formules n'ont pas besoin de prolongement analytique pour être démontrées. Si la formule (I) donne un triplet de somme k\pi alors la formule (II) donne un triplet de somme (3-k)\pi.