Math'O Man : le Blog des Maths

L'application inverse de la co-matrice


L'application comatrice


Le cofacteur d'indice (j,k) d'une matrice carrée A est (-1)^{k+j}\det(A_{kj})A_{kj} désigne la matrice qu'on obtient en enlevant de A la k-ième ligne et la j-ième colonne. Autrement dit, si A est de format nxn alors A_{kj} est la matrice suivante de format (n-1)x(n-1)

A_{kj}=
\begin{pmatrix}a_{1,1} & \dots & a_{1,j-1}& a_{1,j+1}& \dots & a_{1,n} \\\vdots & & \vdots &  \vdots& &\vdots\\
a_{k-1,1} & \dots & a_{k-1,j-1}& a_{k-1,j+1}& \dots & a_{k-1,n} \\
a_{k+1,1} & \dots & a_{k+1,j-1}& a_{k+1,j+1}& \dots & a_{k+1,n} \\
\vdots & & \vdots & \vdots &&\vdots\\
a_{n,1} & \dots & a_{n,j-1}& a_{n,j+1}& \dots & a_{n,n}\end{pmatrix}\;.

La matrice des cofacteurs de A, s'appelle la comatrice de A, notée com(A). En résumé,

\text{com}(A) = \left((-1)^{k+j}\det(A_{kj})\right)_{1\leq k,j\leq n}

Petit exercice :  la fonction qui à une matrice associe sa comatrice est-elle un difféomorphisme du groupe linéaire GL(n,\mathbb{R}) sur lui-même ? Et de GL(n,\mathbb{C}) sur lui-même ?

Pourquoi ne pas lire aussi :


Inversibilité d'une matrice

Soit A la matrice carrée d'ordre 20 définie par les propriétés suivantes :

  • le coefficient d'indice (j,k) vaut 0 si k=j,
  • le coefficient d'indice (j,k) vaut 4 si k-j est pair et non-nul,
  • le coefficient d'indice (j,k) vaut 5 si k-j est impair.

Montrer que la matrice A est inversible (sur le corps des rationnels).

La comatrice conserve la multiplication

La comatrice com(M) d'une matrice carré M d'ordre n est la matrice des cofacteurs, c'est-à-dire sa composante en (l,k) est \small{(-1)^{l+k}} fois le déterminant de la matrice qui s'obtient lorsqu'on ôte à M sa l-ème ligne et sa k-ème colonne.
Mais c'est surtout la transposée de la comatrice qui nous intéresse ; elle s'appele matrice complémentaire (en allemand Adjunkte, en anglais adjugate matrix) et on démontre dans tout cours d'algèbre linéaire qu'elle vérifie la propriété fondamentale :

^t\text{com}(M)\:M\;=\;M\:^t\text{com}(M)\;=\;\det(M)\:I\:.

Par conséquence si on travaille avec des coefficients dans un anneau A, alors la matrice M est inversible dans l'anneau matriciel à coefficients dans A si et seulement si le scalaire det(M) est inversible dans l'anneau A. Par exemple les matrices inversibles sur \small\mathbb{Z} sont précisément celles dont le déterminant est 1 ou -1.

Exercice :  Démontrer que  com  est compatible avec la multiplication matricielle,

com(I) = I      et      com(MN) = com(M) com(N).

Déterminant de sous-matrices

Voici un petit exercice d'algèbre linéaire :

Soit A une matrice symétrique n×n à coefficients entiers et de déterminant nul. On note Aj la matrice (n-1)×(n-1) obtenue à partir de A en supprimant la j-ième ligne et la j-ième colonne. Soient i,j dans {1,...,n}. Le nombre det(AiAj) est-il un nombre carré?

Dimension du commutant d'une matrice

Après le grand succès de son dernier avis de recherche en algèbre linéaire mon collègue mathématicien Laurent Kaczmarek nous propose un nouvel exercice sympa sur les matrices.

Soit A une matrice carrée d'ordre n. Montrer que son commutant (le sous-espace vectoriel des matrices qui commutent avec A) est de dimension supérieure ou égale à n.

Etudes dans les cas réel ou complexe acceptées (et même souhaitées !).

Faut-il un corps pour la méthode du pivot ?

A l'occasion de la solution d'un joli exercice de type colle sur les matrices (voir le blog de Pierre Lecomte), je suis naturellement amené à poser la question suivante.

Soit A une matrice inversible à coefficient dans un corps. Alors par des opérations élémentaires sur les lignes on peut transformer A en la matrice unité. En fait c'est la méthode du pivot de Gauss qui permet cela. On en déduit que A est un produit de matrices correspondantes aux trois types d’opérations élémentaires (permutation de lignes, multiplication d’une ligne par un scalaire non-nul, ajout d’une ligne à une autre).
Cette écriture en produit est pratique car elle permet de prouver plein de choses. Par exemple, pour montrer que le déterminant conserve les produits il suffit de le vérifier pour la multiplication entre une matrice de ce type et une matrice quelconque — et c'est tout facile.

Or comment ça se passe-t-il sur un anneau ? Plus précisément :

Soit R un anneau commutatif et A une matrice carrée avec coefficients dans R telle que det(A) est une unité de R. On sait que A est une matrice inversible (c’est du classique, voir par exemple ici pour la formule qui donne l'inverse en fonction de (det A)-1 et de la comatrice).
Question : Peut-on ramener A à la matrice unité par des opérations élémentaires ?

Peut-être avez-vous déjà réfléchi là-dessus et connaissez la réponse...

Sens de vissage inversé pour le pédalier gauche du vélo

Chers lecteurs fidèles, ça fait un bon moment que je n'ai plus écrit de billet sur ce blog, faute de temps. Mais je vais pouvoir reprendre la cadence habituelle dans quelques mois, je l'espère. En attendant j'aimerais inverser les rôles et vous demander d'écrire quelques lignes sur une question précise que je n'arrive pas à comprendre.

Comme tout le monde le sait on serre une vis en la tournant dans le sens des aiguilles d'une montre (pour être plus précis il faut rajouter : lorsqu'on aperçoit la vis du côté du tourne-vis). Ce sens d'orientation, appelé filetage droit ou hélice droite, est devenu le standard international (parce que la majorité des humains sont des droitiers et ont plus de force dans leur main droite pour visser une vis à filetage droit qu'une vis gauche). Il y a quelques exceptions pourtant où l'on utilise une l'hélice inverse. La seule situation où j'en rencontre dans la vie de tous les jours est celle de la pédale gauche de mon vélo. Les constructeurs de vélo ont compris qu'il faut mettre un filetage gauche sur l'axe de la pédale gauche (et un filetage droit pour la pédale droite) afin d'empêcher que la pédale ne se desserre de la manivelle au fil du temps. Voici ma question :

Je ne comprends pas pourquoi ça fonctionne. Qui peut me l'expliquer ? En fait, si on bloque la pédale sur son axe et si on continue de pédaler, alors elle se défait ; en effet, le mouvement relatif de la pédale à la manivelle est contre le sens des aiguilles d'une montre pour la pédale droite, et dans le sens des aiguilles d'une montre pour la pédale gauche. Donc, selon moi, les billes du roulement mécanique exercent une force de frottement qui desserre la pédale au lieu de la serrer.

axes des pédales bicyclette
Pas de vis droit et gauche sur les axes des pédales
de ma bicyclette... (cliquez pour aggrandir)

Un ami vient de me signaler une autre vis gauche, celle du raccordement à une bouteille de gaz. Mais je ne comprends pas pourquoi on fait ainsi. Qui peut l'expliquer ?

Mieux comprendre la topologie des matrices singulières

Mon billet récent sur la dimension maximale d'un sous-espace affine contenu dans l'ensemble des matrices non-inversibles m'a inspiré les réflexions suivantes, une sorte de version différentiable de ce résultat.

On note {\mathcal M}_n(\mathbb{R}) l'espace des matrices n x n à coefficients réels et GL(n,\mathbb{R}) le sous-ensemble des matrices inversibles. On sait que GL(n,\mathbb{R}) est un ouvert dans {\mathcal M}_n(\mathbb{R}). En effet c'est l'image réciproque de l'ouvert \mathbb{R}^* par l'application continue déterminant

\det\;:\;\; {\mathcal M}_n(\mathbb{R}) \;\rightarrow\;\mathbb{R}.

On peut même dire un peu plus : le déterminant étant polynômial en x_{11},x_{12},\dots,x_{nn} le complémentaire des matrices inversibles, c'est-à-dire l'ensemble des matrices de déterminant nul,

\mathcal{A}\; =\; {\mathcal M}_n(\mathbb{R}) \:\backslash\:GL(n,\mathbb{R})

est une hypersurface algébrique. Géométriquement parlé \mathcal{A} est un fermé de {\mathcal M}_n(\mathbb{R}) qui ressemble localement à un hyperplan (c'est-à-dire à un sous-espace affine de dimension -1). Enfin, cela est vrai en presque tous les points, ceux où la différentielle du déterminant ne s'annulle pas (points réguliers). En revanche, en les points où la différentielle du déterminant est nulle (points singuliers), l'hypersurface \mathcal{A} ne ressemble plus à un sous-espace affine. Il peut y avoir un croisement comme par exemple

algebraische Fläche, surface algébrique

ou un rétrécissement comme par exemple

Algebraische Flächen

(Pour plus d'images de surfaces algébriques visitez le la galerie de Herwig Hauser.)

Il est évident que la différentielle du déterminant est nulle à l'origine. Donc notre hypersurface {\mathcal A} possède une singularité à l'origine. Le résultat suivant dit qu'il s'agit d'une singularité de type rétrécissement, car l'hypersurface de dimension n²-1 y perd quelques dimensions — il y reste juste assez de place pour n²-n dimensions...

Proposition :

Le nombre -n est la plus grande dimension possible d'une sous-variété différentiable F de \mathcal{M}_n(\mathbb{R}) telle que 0\in F\subset {\mathcal M}_n(\mathbb{R}) \backslash GL(n,\mathbb{R})\,.
Démonstration :
  • L'ensemble des matrices dont la première ligne est nulle est un sous-espace vectoriel (et donc en particulier une sous-variété différentielle) de dimension n²-n. Evidemment il contient l'origine 0 et est contenu dans \mathcal{A}.

  • Soit F une sous-variété de {\mathcal M}_n(K) de dimension -n+1 et telle que 0\in F. Nous allons prouver que F contient une matrice inversible.
    Au voisinage de l'origine la sous-variété F est décrite par un système de n-1 équations
    f_j(x_{11},x_{12},\ldots,x_{nn})=0\,,\;\;\;j=1,\,\ldots\,,n-1,
    tel que les différentielles df_j sont linéairement indépendantes à l'origine. On résoud ce système par le théorème des fonctions implicites, c'est-à-dire on peut isoler (théorétiquement) n-1 des coordonnées et les exprimer par les autres. On a ainsi, toujours au voisiange de l'origine, n²-n+1 coordonnées variables et n-1 coordonnées isolées (fonctions différentiables des coordonnées variables).
    Maintenant je peux poursuivre mon raisonnement de la preuve du cas affine : par des permutations de lignes et de colonnes je m'arrange à ce que les coordonnées isolées soient toutes au-dessus de la diagonale matricielle ; puis je prends les coordonnées sur la diagonale toutes égales à un nombre \epsilon non-nul et proche de 0 et les autres coordonnées variables égales à 0. Ainsi j'obtiens une matrice inversible qui est dans F.

Concevoir la notion d'application

Je me rappelle qu'au début de mes études de mathématiques, parfois une simple question de formalisme pouvait me poser des problèmes. Par exemple, j'avais du mal à jongler entre différents points de vue d'une notion a priori simple comme celle d'application. Voici quelques lignes qui pourraient sembler bêtes aux initiés, mais comme les livres expliquent rarement ce genre de choses en détail elles peuvent être utiles à ceux qui y sont confrontés pour la première fois — et notamment aux élèves et étudiants d'aujourd'hui qui, lors de leur parcours scolaire, ne rencontrent plus assez de théorie des ensembles.


Considérons une application (synonyme de fonction) d'un ensemble X dans un ensemble Y.

f\;:\; X \;\longrightarrow \;Y\,,\;\; x \; \longrightarrow\;f(x)\,.

(Désolé, la deuxième flèche devrait commencer par un pied mais mon plug-in LaTeX ne le permet pas.)

Si vous venez de passer le bac, vous avez déjà une notion intuitive de ce que c'est une application. Mais les mathématiciens possèdent plusieurs autres points de vue pour concevoir cet objet — et chacun a sa raison d'être.

  1. Point de vue y en fonction de x.
    C'est le point de vue habituellement enseigné au collège et au lycée. On conçoit x comme variable et y comme l'image qui change en fonction de x.
    Le schéma mental est le suivant.

    dessiner le graphe d'une fonction, comprendre les fonctions

    L'ensemble de départ X est représenté horizontalement, l'ensemble d'arrivée Y est représenté verticalement. La donnée de l'application f revient à la donnée de son graphe \Gamma \subset X\times Y constitué des couples (x,f(x)), où x parcourt X.
    En disant x parcourt X, on adopte donc bien l'idée que la variable est x.
     
  2. Point de vue collection d'éléments de Y.
    On peut aussi écrire l'application f en forme de famille (f(x))_{x\in X}. On oublie donc de spécifier l'ensemble d'arrivée Y.
    En général, une famille (y_j)_{j\in J} dans Y n'est rien d'autre qu'une application

    y\;:\; J \;\longrightarrow \;Y\,,\;\; j \; \longrightarrow\;y_j\,,

     
    où l'ensemble de départ J est appellé l'ensemble d'indices ; très souvent il n'a pas d'importance et peut être remplacé par un autre ensemble de même cardinal. Ce qui compte dans ce point de vue c'est simplement la collection des images de l'application.
    Dans certaines situations un bon choix de l'ensemble d'indices peut raccourcir les écritures. Par exemple, si (b_j)_{j\in J} est une base d'un K-espace vectoriel E, alors tout vecteur v de E se décompose comme combinaison linéaire

    v=\sum_{j\in J} \lambda_j\, b_j\:,

    (\lambda_j)_{j\in J} est une famille de scalaires presque tous nuls (c'est-à-dire l'application \lambda\;:\; J \;\longrightarrow \;K\, est nulle sauf en un nombre fini de points ; cela est nécessaire pour pouvoir prendre la somme). Mais si on conçoit la base non comme une famille de vecteurs mais comme un sous-ensemble B de l'espace E, alors on peut la prendre elle-même comme ensemble d'indices et écrire simplement

    v=\sum_{b\in B} \lambda_b\, b\:.


     
  3. Point de vue les fibres en fonction de y.
    Pour chaque y dans Y on appelle fibre de f en y (ou ensemble de niveau y) l'ensemble de tous les antécédents de y, noté
     
    f_y\;=\;f^{-1}(\{y\:\})\:=\:\{\:x\in X\; :\; f(x)=y\:\} \,.

     
    Connaître une application revient à connaître la collection de ses fibres. C'est donc y qu'on considére comme variable. On s'aide du schéma mental suivant.
     

    représenter une fonction graphiquement, comprendre une fonction


    L'espace de départ est projeté sur l'espace d'arrivée. L'application est injective (resp. surjective resp. bijective) si et seulement si chaque fibre possède au plus (resp. au moins resp. précisément) un élément.
     
Une conséquence naturelle du point de vue des fibres est la factorisation canonique, que nous allons expliquer ci-dessus et dont la quintessence se résume ainsi :
L'ensemble des fibres non-vides d'une application est une partition de l'ensemble de départ et a le même cardinal que l'image de l'application.

Factorisation canonique

Nous nous proposons de montrer que toute application est la composée d'une surjection, d'une bijection et d'une injection. Soit donc f une application de X vers Y. On considère son image

\tilde{Y} = f(X)\:\subset\:Y

et l'espace des fibres

\tilde{X} = \{\,f^{-1}(\{y\})\:|\: y\in \tilde{Y}\,\}\:\subset\:{\scr P}(X).

Ainsi l'espace des fibres est le quotient de X par la relation d'équivalence  ~  qui est définie par  x ~ x'  si et seulement si f(x) = f(x'). Il est clair que \tilde{X} et \tilde{Y} sont en bijection. Plus précisément il existe une surjection \pi, une bijection \tilde{f} et une injection j tel que le diagramme suivant commute.

Factorisation canonique d'une fonction, comment comprendre les applications

En effet, il suffit de prendre pour \pi la projection canonique sur le quotient X/~, c'est-à-dire l'application qui à chaque x dans X associe la fibre de f en f(x) ; puis pour j l'injection naturelle, et enfin pour \tilde{f} l'application qui envoie une fibre sur l'unique élément dans Y qui est son image par f. Il est alors évident que f est la composée

f= j\circ \tilde{f}\circ \pi.

Un avant-goût de la suite

Concevoir une application comme la collection de ses fibres est très fréquent en topologie, géométrie algébriques et théorie des singularités. On fait varier un point dans l'espace d'arrivée pour observer, dans l'espace de départ, la manière dont varie la fibre au-dessus de ce point. Un exemple très basique est l'application

f\;:\; \mathbb{R}^3 \;\longrightarrow \;\mathbb{R}\,,\;\; (x,y,z) \; \longrightarrow\;ax+by+cz\,,

 
a,b,c sont des réels fixés non tous nuls. La collection des fibres est constituée de plans parallèles. Il s'agit donc d'un feuilletage de l'espace \mathbb{R}^3 par plans (comme un feuilleté). Les fibres se ressemblent toutes ; on a même ce qu'on appelle une fibration globalement triviale.

Plus généralement, si f est une fonction différentiable et si on fait varier le point dans l'espace d'arrivée sans toucher les valeurs critiques, alors localement les fibres se ressemblent toutes (fibration localement triviale). En revanche, si on passe par une valeur critique alors la nature des fibres peut changer. Par exemple si on traverse la valeur critique 0 de l'application

g\;:\; \mathbb{R}^2 \;\longrightarrow \;\mathbb{R}\,,\;\; (x,y) \; \longrightarrow\;x^2+y^2\,,

dans le sens décroissant, alors la fibre est d'abord un cercle, puis dégénère en un point et, enfin, devient vide — une catastrophe a lieu au sens de la théorie des catastrophes de René Thom.

Tout ça devient plus intéressant dans le complexe. Les fibres de

g\;:\; \mathbb{C}^2 \;\longrightarrow \;\mathbb{C}\,,\;\; (x,y) \; \longrightarrow\;x^2+y^2\,,

sont des surfaces réelles (courbes complexes ou surfaces de Riemann). Et au lieu de traverser la valeur critique 0, on peut la contourner avec un petit lacet dans le plan complexe et observer la déformation de cette surface le long du lacet. Evidemment à la fin on retrouve la même surface qu'au début du lacet, mais lors du trajet certaines caractéristiques se sont déplacés continûment et ont échangés leurs places... (monodromie).

Matrices intercalées

Deux exos sympas sur les matrices.

Exercice 1. Soient M_k, k=1,...,n des matrices carrées complexes de même taille, toutes non-nulles. Existe-t-il toujours une matrice carrée A telle que

AM_1AM_2A\:\cdots\: AM_nA\neq0\;\;?

Exercice 2. On note T la transposition des matrices. Soient A,B,C,D, des matrices carrées telles que T(A)=BCD, T(B)=CDA, T(C)=DAB et T(D)=ABC. Démontrer que

(ABCD)^3=ABCD.

Somme de certains déterminants

A chaque nombre naturel avec n2 chiffres on peut associer le déterminant de la matrice nxn où on écrit ces chiffres ligne par ligne. Par exemple, si n=2 nous associons au nombre 2011 le déterminant

\begin{vmatrix}2&0\\1&1\end{vmatrix}=2.

Exercice : Trouver, en fonction de n, la somme de tous les déterminants associés aux nombres entiers positifs à n2 chiffres. (Le premier chiffre est supposé non-nul — par exemple pour n=2 il y a 9000 déterminants qui interviennent.)