Notation pour la matrice représentant une application linéaire

Soit \(f : E \rightarrow E’\) une application linéaire. Quelle notation choisir pour la matrice de f dans les bases \(\scr B\) de \(E\) et \(\scr B’\) de \(E’\) ? On rencontre essentiellement quatre notations, à savoir

\(M_{\scr B’\scr B}(f),\;\:M_{\scr B\scr B’}(f),\;\:M^{\scr B}_{\scr B’}(f),\;\:M_{\scr B}^{\scr B’}(f).\)

Dans mes cours j’utilise la première notation qui est, à mon avis, la seule valable. Lorsque je colle des étudiants en prépa j’utilise la notation de leur professeur qui est, malheureusement, souvent la deuxième; en fait, avec cette notation la moitié des étudiants se trompe lorsqu’ils doivent faire un changement de base. (Le programme PCSI s’abstient sagement d’imposer une notation tandis que le programme MPSI impose la deuxième notation.)

Le but d’une telle notation est de réduire l’idée, une fois comprise, à un simple travail qu’on peut accomplir mécaniquement, sans devoir réfléchir à nouveau chaque fois. Et seulement la première notation fait exactement cela! En fait, elle rend naturel tout le mécanisme:

  • Si dim(E)=n et dim(E’)=n’ alors la matrice \(M_{\scr B’\scr B}(f)\) est dans l’espace \({\scr M}_{n’n}(K).\) Ainsi l’ordre des bases correspond à l’ordre des dimensions dans la notation des matrices (d’abord le nombre de lignes, puis le nombre de colonnes).
  • Si on compose \(f : E \rightarrow E’\) et \(g : E’ \rightarrow E »\) alors on a

    \(M_{\scr B »\scr B}(g\circ f) = M_{\scr B »\scr B’}(g) M_{\scr B’\scr B}(f)\).

    C’est une relation de Chasles entre les bases, et donc facile à retenir.

En cohérence avec cette notation la matrice de changement de base de \(\scr B\) vers \(\scr A\) est \(M_{\scr B\scr A}(id_E)\). La formule de changement de base découle encore de la relation de Chasles:

\(M_{\scr A’\scr A}(f) = M_{\scr A’\scr B’}(id_{E’}) M_{\scr B’\scr B}(f)M_{\scr B\scr A}(id_E)\).

10 réponses
  1. Pierre Lecomte
    Pierre Lecomte dit :

    Je suis d’autant plus d’accord avec toi que j’ai depuis longtemps adopté une autre définition de la notion de base que la notion standard. Le nouveau point de vue abonde dans ton sens (fontorialité, etc.)

    En peu de mots. Pour moi, une base de \(E\) (suposé de dimension \(n\) sur \(\mathbf K\)), est une bijection linéaire \(b:\mathbf K^n \rightarrow E\). L’expression de l’application (linéaire si on veut) \(f:E\to E’\) dans des bases \(b,b’\) est alors tout simplement l’application

    \(f_{b’,b}:=b’^{-1}\circ f \circ b\)

    de \(\mathbf K^n\) dans \(\mathbf K’^n\) qui consiste à rendre commutatif un diagramme évident (que je n’ai pas le courage de dessiner). Lorsque \(f\) est linéaire, cette dernière application est assimilée à une matrice à \(n\) colonnes et \(n’\) lignes.

    Si \(f’:E’\to E »\) alors avec des notations évidentes

    \(f_{b »,b}=b »^{-1}\circ (f’\circ f)\circ b =(b »^{-1}\circ f’\circ b’)\circ (b’^{-1}\circ f\circ b)=f’_{b »,b’}\circ f_{b’,b} \)

    ce qu’on visualise en juxtaposant les diagrammes relatifs à chaque application.

    Un autre avantage de cette façon de voir les bases est de rendre complètement triviale la loi de changement de bases.

    D’abord, on appelle composante de \(x\) dans la base \(b\) l’élément \(b^{-1}(x)\) de \(\mathbf K^n\). Ensuite, on note que les bases de ce dernier forment un groupe (pour la composition des applications). On le note \(GL(n,\mathbf K)\). Il agit à droite sur l’ensemble \({\mathcal B}_E\) des bases de \(E\), via l’action (libre et transitive)

    \((b,S)\mapsto b\cdot S:=b\circ S\)

    Cela étant, soient des bases \(b_1,b_2\) de \(E\). On a \(b_2=b_1\cdot S\) où

    \(S=b_1^{-1}b_2\)

    D’un autre côté, au niveau des composantes \(u_1,u_2\) d’un élément \(x\in E\),

    \( u_2=b_2^{-1}(x)=(b_2^{-1}\circ b_1)(b_1^{-1}(x))=S^{-1}(u_1)\)

    Etc.

    Répondre
  2. MathOMan
    MathOMan dit :

    Ça me semble une très bonne idée! L’inverse de ta base sont donc les coordonnées dans la base (ce que tu appelles composante). Seul problème: Appelles-tu famille libre une application linéaire injective et famille génératrice une application linéaire surjective d’un espace canonique dans E?

    Répondre
  3. Pascal Dupont
    Pascal Dupont dit :

    Depuis plus de trente ans, je suis un usage que m’a suggéré Jean-Pierre Tignol : noter \(_bv\) les coordonnées du vecteur \(v\) dans la base \(b=(b_1,\ldots,b_n)\) et \(_{b’}(f)_b\) la matrice de l’application linéaire \(f:V\to V’\) relativement aux bases \(b\) de \(V\) et \(b’\) de \(V’\).

    On a alors : \(v=b\cdot{_bv}\) ; \(_{b’}f(v)={_{b’}(f)_b}\cdot{_bv}\) ; \(_{b »}(f’\circ f)_b={_{b »}(f’)_{b’}}\cdot{_{b’}(f)_b}\) ; etc. : c’est chaque fois la "règle des dominos" qui s’applique.

    Je note \(\mathrm I_V\) (ou plus simplement \(\mathrm I\)) l’identité sur \(V\) ; la matrice de changement de bases de \(b’\) vers \(b\) est alors \(_{b’}({\mathrm I})_b\) ; elle satisfait \(b=b’\cdot{_{b’}({\mathrm I})_b}\), mais aussi \(_{b’}v={_{b’}({\mathrm I})_b}\cdot{_bv}\) (c’est donc aussi la matrice de changement de coordonnées de \(b\) vers \(b’\)).

    Répondre
  4. Pierre Lecomte
    Pierre Lecomte dit :

    Je distingue la (ou les) coordonnée(s) d’un point d’un espace affine dans un repère et la (les) composant(e)s d’un  »vecteur » selon une base — mais je sais que tu ne distingues pas trop espaces affines et vectoriels, les premiers étant des fantômes bénins des seconds 😉

    Je dois avouer que c’est principalement pour mon compte que j’utilise la notion de base que j’ai décrite plus haut; je ne l’ai enseignée que dans certaines situations où elle s’avère réellement super efficace voire indispensable (cf. par exemple les articles de mon blog des  »séries »  »Produits mixte et vectoriel » et  »Produits scalaires et densités », une remarque en passant »).

    Je n’ai pas encore eu besoin de faire, au niveau enseignement, ce que tu suggères (à propos des notions de familles libres et génératrices) mais c’est ce qu’il faut faire pour être cohérent — et ce que je ferais si j’envisageais de tout reconstruire sur l’idée en question (en outre, je n’enseigne pas l’algèbre vectorielle mais la géométrie). J’ai d’ailleurs eu envie de développer la théorie des espaces vectoriels (de dimension finie) sans recourir à la notion de base — et donc de celles de familles libres et génératrices — mais cela n’a pas (encore) abouti. Mon idée était de ne parler, initialement, que d’applications linéaires. L’idée est (toujours) de dire que \(E\) est de dimension finie \(n\) sur \({\mathbf K}\) s’il existe une bijection de \({\mathbf K}^n\) sur \(E\). Pour prouver que cette définition est  »bonne », il faut l’équivalent du théorème de Steinitz. Le problème (conceptuel) est que je ne suis pas encore parvenu à le démontrer sans revenir aux notions classiques!

    Cela étant, j’ai instauré deux types de leçons. Les premières sont  »classiques » : celles qu’on ne définit pas, celles par défaut, dans lesquelles je suis une sorte de programme non écrit mais ambiant (en Belgique, à l’université, il n’y a pas de  »programme », la liberté académique, concept fondamental, laisse le titulaire libre du choix des matières à enseigner — dans certaines limites bien entendu) et les autres, que je qualifie de gratuites et culturelles. Celles-ci sont  »gratuites » car je n’interrogerai pas sur la matière qu’elles couvrent mais  »culturelles » car elles transcendent contenus et postures usuelles.

    C’est dans le cadre de telles leçons que j’utilise la notions de base dont je parlais plus haut.

    Répondre
  5. philippe
    philippe dit :

    "Le but d’une telle notation est de réduire l’idée, une fois comprise, à un simple travail qu’on peut accomplir mécaniquement, sans devoir réfléchir à nouveau chaque fois."

    Je vais me faire l’avocat du diable : est ce une bonne idée de ne pas réfléchir quand on fait un changement de base 🙂 Pour avoir enseigné l’algèbre linéaire en école d’ingénieur (en fait des rappels!) j’ai pu voir que de toute façon tous les étudiants s’embrouillent quelque soit la convention choisie au départ. Les seuls qui s’en sortent sont finalement ceux qui posent à chaque fois leur raisonnement en reprenant le cas du passage d’une base quelconque à la base canonique.

    Bien que je trouve ta notation séduisante, elle revient en fait à écrire l’enchaînement des applications de la droite vers la gauche ce qui est tout sauf naturel quand on est étudiant et qu’on a écrit des années durant \(f: E\longrightarrow G\) donc j’ai du choisir la notation inverse \(M_{B’\to B}\) pour la matrice de passage de la base B’ à la base B dont les coefficients sont les vecteurs de B’ exprimés dans la base B (quand B est la base canonique c’est clair).

    Répondre
  6. Fabien Besnard
    Fabien Besnard dit :

    Je dois dire que je suis absolument d’accord avec Philippe. Dans la mesure où l’on écrit les applications de la gauche vers la droite, il n’y a aucune justification à écrire les bases dans l’autre sens. Et mieux vaut réfléchir un peu à chaque fois, d’autant plus qu’il n’y a guère de possibilité de se tromper puisque le produit de matrice se fait dans le même sens que la composition des applications, et c’est bien ça l’important. Après on complète avec les bases convenables.
    D’une manière générale, je trouve qu’en tant qu’enseignant nous avons le devoir de brider notre imagination créatrice en matière de notations et de terminologie, et de nous limiter à ce qui se fait de plus standard. Rien de plus désagréable en effet de lire sous la plume des élèves des notations idiosyncratiques de collègues que l’on ne comprend pas… Si les élèves passent des concours ça peut même être dangereux pour eux.
    Même lorsque les notations sont mauvaises, il faut les conserver, parce qu’on n’est pas seul au monde. Un exemple : la notion pour l’image inverse d’une partie est franchement très mauvaise, avec un \(f^{-1}\) alors que la réciproque de \(f\) n’existe pas forcément, et elle engendre véritablement des confusions. Certains collègues ont inventé des f avec des * en haut ou en bas (on ne sait jamais), ça peut se défendre, mais comme ça n’est pas standard, c’est à proscrire.
    Je vois deux exceptions à ce que je viens de dire : 1) des notations si intuitives qu’elles se passent d’explication 2) des changements mineurs dans la typographie.
    Je donne deux exemples. 1) pour dire que $X$ est la matrice colonne des coordonnées d’un vecteur \(\vec v\) dans la base $B$ je note soit $M_B(\vec v)=X$, comme tout le monde, soit \(\vec v\buildrel B\over\leftrightarrow X\). Je crois que ça se passe d’explication. Je fais d’ailleurs la même chose pour les matrice, en mettant les deux bases au-dessus de la flèche (dans l’ordre standard).
    2) Pour essayer de pallier au problème de l’image inverse, je note \(f\langle X\rangle\) pour l’image directe et \(f^{-1}\langle X\rangle\) pour l’image inverse d’une partie. Ceci à l’avantage de coller à la notation standard, tout un introduisant une subtile différence dans la typographie qui a pour but de faire penser à l’élève que ce n’est pas pareil que \(f^{-1}(x)\). Pour être honnête je ne crois pas que ce soit très efficace…

    Répondre
  7. Miguel
    Miguel dit :

    J’utilise la 3ème notation qui offre les mêmes facilités pour retenir les formules et en plus, permet de retenir que en haut, les colonnes, en bas, les lignes. Par exemple, pour la matrice de passage, on exprime les coordonnées de la base B’ (en haut, colonne) dans la base B (en bas, lignes).
    Idem pour la matrice d’une application linéaire : les coordonnées des images de B (en haut, colonne) dans la base B’ (en bas, ligne).
    Essayez …

    Répondre
  8. MathOMan
    MathOMan dit :

    @ Fabien Besnard : Justement dans le cas présent il n’y a pas de notation standard pour la matrice d’une application linéaire dans des bases ! En effet, toutes les quatre notations mentionnées se trouvent dans la littérature. Et tout ce que je souhaite est que, par élimination darwinienne, seulement la première survit car elle est fonctorielle et donc la plus simple.

    Répondre
  9. vincent
    vincent dit :

    @ Fabien Besnard

    Bonjour

    Pour les images directe et réciproque les notations
    \(
    \overrightarrow{f}(X) \text{ et }\overleftarrow{f}(X)
    \)

    fonctionne "assez bien" avec les étudiants!

    Répondre
  10. PB
    PB dit :

    @Vincent : les flèches font penser à des vecteurs.
    Celà dit, c’est vrai que les étudiants ont du mal avec les images réciproques (et encore plus avec les images directes). Par exemple, j’énonce et démontre en cours que, dans le cas d’une fonction bijective f, l’image réciproque par f d’une partie B de l’ensemble d’arrivée est égal à l’image directe de B par la bijection réciproque de f : un vrai supplice pour la plupart des élèves 🙂

    Répondre

Laisser un commentaire

Rejoindre la discussion?
N’hésitez pas à contribuer !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *