Espaces Vectoriels

Application linéaire :

Nous savons à présent ce qu’est un espace vectoriel, un sous espace vectoriel, nous connaissons les différentes familles de vecteurs et savons faire des sommes de sous espaces vectoriels et définir des sommes directes et des sous espaces supplémentaires.


Nous savons également ce qu’est une combinaison linéaire. Ce que nous allons voir sur cette page, c’est justement ce qui fait qu’une combinaison linéaire est linéaire, et du fait que cela défini un espace vectoriel.

Soit F et G deux espaces vectoriels, et f une application de E dans F.
f est une application linéaire si elle répond à ces deux propriétés :

\forall (x,y) \in E^2, f(x+y)=f(x)+f(y) (stabilité par la loi d’addition).
\forall (x,y) \in E^2, \forall \lambda , \mu \in \mathbb{K}, f(\lambda x+\mu y)= \lambda f(x)+ \mu f(y) (stabilité pour la loi de multiplication par un scalaire).

Cela veut tout simplement dire qu’une application linéaire préserve les combinaisons linéaires, et, on peut résumer ce postulat avec cette formule :

f(\displaystyle{\sum_{i \in I} \lambda_i x_i)}=\displaystyle{\sum_{i \in I} \lambda_i f(x_i)}

Prenons trois exemples et un contre exemple, pour que vous saisissiez bien la notion.

Premier exemple simple : Soit f(x)=3x une application linéaire de E dans F et E=F=\mathbb{R}. Commençons par montrer la stabilité par la loi d’addition :

Alors, f(x_1+x_2)=3(x_1+x_2)=3x_1+3x_2=f(x_1)+f(x_2)

Maintenant, montrons la multiplication par un scalaire :

f(\alpha x)=3(\alpha x)=\alpha(3x)=\alpha f(x)

Nous avons montrer que les deux propriétés étaient vérifiées, f est donc bien une application linéaire.

Deuxième exemple :

Soit g une application de \mathbb{R}^2 dans \mathbb{R}^3 et g(x,y)=(x+y,2x-y,y).
Montrons que g est une application linéaire.

Prenons u=(x_1,y_1),v=(x_2,y_2), deux vecteurs de E, et voyons si g est une application linéaire :

g((x_1,y_1)+(x_2,y_2))=(x_1+y_1+x_2+y_2,2(x_1+x_2)-y_1+y_2,y_1+y_2)=(x_1+y_1,2x_1-y_1,y_1)+(x_2+y_2,2x_2-y_2,y_2)

En effet, la somme de vecteurs est la somme des coordonnées, nous avons donc le droit de scinder les termes, et on retrouve bien la propriété initiale : g((x_1,y_1)+(x_2,y_2))=g(x_1,y_1)+g(x_2,y_2)

Montrons la stabilité par multiplication par un scalaire :

On veut montrer que : g(\beta u + \eta v)=\beta g(u)+\eta g(v)

g(\beta u+\eta v)=(\beta x_1 + \beta y_1, \beta 2x_1 - \beta y_1,\beta y_1)+(\eta x_2 + \eta y_2, \eta 2x_2 - \eta y_2, \eta y_2)

On factorise par \beta et \eta :

g(\beta u+\eta v)=\beta(x_1 + y_1, 2x_1 - y_1,y_1)+\eta( x_2 +  y_2,  2x_2 - y_2,  y_2)

Et donc, on a montré que g(\beta u + \eta v)=\beta g(u)+\eta g(v). g est donc bien une application linéaire.

Remarque : En fait, nous aurions pu éviter d’utiliser deux étapes pour cela, en effet, la seconde étape est suffisante pour démontrer qu’il s’agit bien d’une application linéaire. En effet, si on prend par exemple \beta=\eta=1, on se trouve dans la première situation, et g(u+v)=g(u)+g(v). Si on a maintenant \eta=0, on se trouve dans la deuxième situation, et g(\beta u)=\beta g(u)

Troisième exemple :

Soit h, une application de R[X] tel que h(P)=P'

Il est facile de démontrer que l’application dérivée est linéaire, en effet :

Soit P,Q \in R[X], alors :

h(\lambda_1 P+ \lambda_2 Q)=(\lambda_1 P'+ \lambda_2 Q')=\lambda_1 P'+ \lambda_2 Q'=\lambda_1 h(P)+\lambda_2 h(Q).

Prenons maintenant un contre exemple.
Soit f, une application de \mathbb{R} dans \mathbb{R}, telle que f(x)=x^2. Cette application est-elle linéaire ?

On va démontrer que f n’est pas linéaire en fixant une valeur de x et une valeur de \lambda. Soit x=2 et soit \lambda =3.

On a alors f(\lambda 2)=(3 \times 2)^2=36.
Maintenant, on pose \lambda f(2)=3 \times 4=12
Et on voit bien que f(\lambda 2) \neq \lambda f(2), f n’est donc pas une application linéaire.

Nous allons maintenant voir deux concepts très importants, celui de noyau et d’image.

Commençons par le noyau. Qu’est ce que le noyau d’une application linéaire ? Commençons par schématiser cela :

Qu’est ce que vous comprenez dans ce schéma ? En fait, on dit du noyau d’une application linéaire, que pour toutes les valeurs de l’ensemble de départ, il renvoie le vecteur nul de l’ensemble d’arrivée.

Plus rigoureusement, on écrit ker(f)= \{ \forall x \in E, f(x)=0\}. On peut dire aussi que ker(f)=f^{-1}(\{0\}) (ker étant l’abréviation de kernel, qui veut dire noyau en anglais et en allemand.)

Attention, il faut savoir que le le vecteur nul de E est toujours dans le noyau de f, autrement dit, ker(0_E)=0_F.

Prenons un exemple d’application linéaire, et trouvons son noyau.

Premier exemple :

Soit f, une application linéaire de \mathbb{R}^3 dans \mathbb{R}^2 définie par f(x,y,z)=(x+y,x-y+z). Quel est son noyau ?

Comme nous le disions dans la définition, le noyau d’une application linéaire envoie n’importe quelle valeur de l’espace de départ sur le 0 de l’espace d’arrivée. Autrement dit, on peut écrire que :

Ker(f)=Ker(x+y,x-y+z)=0

On voit qu’il nous suffit de poser le système suivant :

\left\{\begin{array}{l} x+y = 0  \\ x-y+z = 0 \\ \end{array}\right.

Donc :

\left\{\begin{array}{l} x=-y  \\ z = y-x \\ \end{array}\right.

Par conséquent, le noyau s’écrit :

Ker(f)=(x,-x,y-x) ou Ker(f)=vect\{(1,-1,-2)\} (Remplacez les valeurs de x,y et z dans l’application, et vous verrez que vous tombez sur le vecteur nul).

Autre exemple, plus compliqué :

Soit f, une application linéaire de M_2 (K) vers R^2[X] (libre à vous de montrer que cette application est linéaire), telle que f \begin{pmatrix} a & b \\ c & d \end{pmatrix}=(a+b)+(c+2d)X+(2c+4d)X^2

Ce qui se passe ici, c’est que l’application f prend n’importe quel vecteur de l’espace de départ, qui est l’espace des matrice carrée 2 \times 2, en renvoyant comme valeur, un vecteur de l’espace des polynômes de degrés inférieur ou égal à deux.
*Ne vous inquiétez pas si cela peut paraitre confus, ces notions ne sont pas faciles à comprendre, mais ne vous en faites pas, nous allons prendre plusieurs exemples concrets. De plus, nous prenons des exemples de plus en plus compliqué.

Comment trouver le noyau de cette application ? En fait, ce n’est pas si compliqué, nous allons nous servir de notions que vous connaissez déjà. On sait que le vecteur d’arrivé du noyau d’un application linéaire est le vecteur nul de l’ensemble d’arrivée, donc, on peut écrire :

f \begin{pmatrix} a & b \\ c & d \end{pmatrix}=0

Or, quelle est la condition pour que notre polynôme de l’ensemble d’arrivée soit égal à 0 ? Eh bien, il faut que (a+b)=0 et (c+2d)=0. Il va de soit que le troisième terme, qui est une homothétie du second est aussi égal à 0.

Réfléchissons, que peut on faire ?
Nous allons tout simplement, encore une fois, poser un système que nous allons résoudre :

\left\{\begin{array}{l} a+b = 0 \\ c+2d = 0 \\ \end{array}\right.

Donc :

\left\{\begin{array}{l} a = -b \\ c = -2d \\ \end{array}\right.

Par conséquent, on a ker(f)=\begin{pmatrix} a & -a \\ c & -\frac{c}{2} \end{pmatrix}

Que voit-on ? les coordonnées de ce vecteur sont proportionnelles, on pourrait donc s’amuser à trouver une base.
On pourrait prendre la base canonique :

Base de ker(f)= a\begin{pmatrix} 1 & -1 \\ 0 & 0 \end{pmatrix}+ c \begin{pmatrix} 0 & 0 \\ 1 & -\frac{1}{2} \end{pmatrix}= vect\left\{\left(\begin{tabular}{cc}0 & 0 \\0 & 0\end{tabular}\right) , \left(\begin{tabular}{cc}0 & 0 \\1 & - \frac{1}{2} \end{tabular}\right) \right\}

On voit bien que ces deux vecteurs sont linéairement indépendants. Mais qu’est-ce que tout cela veut dire ? Cela veut dire, qu’afin qu’un vecteur appartienne au noyau de f, il faut nécessairement que ce vecteur se construise à partir de cette base.

A présent, parlons de l’image d’une application linéaire. Tout comme pour le noyau, on peut représenter l’image d’une application linéaire avec un schéma :

Alors, quelle est la définition formelle de l’image d’une application linéaire qu’on note Im(f) ?

La définition est la suivante :

Im(f)= f(x) | x \in E = f(E)

L’image d’une application linéaire est, par définition, toutes les valeurs de F ayant un antécédent dans E.

On va reprendre comme premier exemple, le premier exemple que nous avions choisis pour le noyau.
Nous avions :
Soit f, une application linéaire de \mathbb{R}^3 dans \mathbb{R}^2 définie par f(x,y,z)=(x+y,x-y+z).

Trouvons maintenant l’image de cette application linéaire.

On sait que l’image de cette application est l’ensemble de tous les vecteurs de F ayant un antécédent dans E. Pour trouver l’image, il y a une astuce. Il faut partir d’une base de E, construire l’image à partir de cette base, et voir ce que nous trouvons. Donc, tout d’abord, écrivons la base canonique de \mathbb{R}^3, qu’on va appeler B :

B=(1,0,0),(0,1,0),(0,0,1)

Appliquons à présent l’application f à chacun des vecteurs de cette base :

f(1,0,0)=(1,1), f(0,1,0)=(1,-1) et f(0,0,1)=(0,1)

Donc f(x,y,z)=x(1,1)+y(1,-1)+z(0,1)

Très bien, nous avons l’image de f, mais ce n’est pas suffisant, pourquoi ? Que remarque t-on ? Sans faire les calculs ? Si vous n’avez pas remarqué, ces 3 vecteurs sont linéairement dépendants. En effet, (1,1)-2(0,1)=(1,-1).

Par conséquent, on peut se débarrasser d’un des vecteurs, et par exemple, en conclure que :

Im(f)=vect\{(1,1),(1,-1)\}

En fait, si vous êtes observateurs, vous avez du remarquer quelque chose…
Qu’avions nous trouvé pour le noyau de l’application ? Nous avions trouvé que Ker(f)=vect\{(1,-1,-2)\}

Trêve de suspens… La somme de la dimension de l’image et du noyau est exactement la dimension de l’espace de départ, et ceci est toujours vrai. C’est d’ailleurs un théorème, qu’on appelle le théorème du rang, que nous allons voir très bientôt.

Pour en finir avec l’image (Bien évidemment, nous verrons d’autres exemples), reprenons l’exemple que nous avions utilisé pour trouver le noyau, et qui était celui-ci :

Soit f, une application linéaire de M_2,2 (K) vers R^2[X], telle que f \begin{pmatrix} a & b \\ c & d \end{pmatrix}=(a+b)+(c+2d)X+(2c+4d)X^2

Pour trouver l’image, rien de plus simple, on va reprendre la méthode de l’exemple précédent qui consistait à considérer une base de E (en l’occurence M_{2,2}(K), et voir quels vecteurs nous trouvons en y appliquant f.

On a donc :

f \begin{pmatrix} a & 0 \\ 0 & 0 \end{pmatrix} =1

f \begin{pmatrix} 0 & b \\ 0 & 0 \end{pmatrix}=1

f \begin{pmatrix} 0 & 0 \\ c & 0 \end{pmatrix}=X+2X^2

f \begin{pmatrix} 0 & 0 \\ 0 & d \end{pmatrix}=2X+4X^2

On a donc comme famille génératrice de l’ensemble d’arrivée R^3[X], Im(f) = vect\{1,1,X+2X^2,2X+4X^2\}

Que peut on voir ? Vous devriez commencer à avoir l’habitude. En effet, la famille n’est pas libre, on peut donc librement retirer deux vecteurs, il nous reste logiquement :

Im(f) = vect\{1,X+2X^2 \}

Une application linéaire porte également un autre nom : un morphisme d’espace vectoriel. Oui, car attention, il existe d’autres cas de morphismes, comme les morphismes de groupes, d’anneaux, d’algèbre unifère, etc… Nous verrons tout cela dans un chapitre avancé sur les structures algébriques.

Il existe plusieurs types d’applications linéaires :

  • Les endomorphismes : Un endomorphisme est une application linéaire d’un espace vectoriel dans lui même, ou, autrement dit, ayant le même espace de départ et d’arrivé. L’application linéaire conserve donc la structure et on note L(E,E), l’ensemble des endomorphismes de l’ensemble E.
  • Les isomorphismes : Un isomorphisme est une application linéaire bijective d’un ensemble E vers un ensemble F et qui conserve également la structure. Cela veut dire qu’il existe une application g qui est l’application réciproque de l’application f tel que f \circ g= Id(F) et g \circ f= Id(E)
  • Les automorphismes : Un automorphisme est une application qui est à la fois un endomorphisme et un isomorphisme. Autrement dit, c’est un endomorphisme bijectif. Ils n’ont pas grand intérêt, car il en existe peu, ou du moins, le nombre d’applications faisant intervenir les automorphismes sont peu nombreuses. On note l’ensemble des automorphismes GL(E)
  • Lorsque l’application linéaire ne présente aucune des caractéristiques ci dessus, alors il s’agit simplement d’un morphisme d’un espace vectoriel quelconque dans un autre.

Lorsque vous serez face à des exercices, ou que vous mettrez en pratique ces notions, il se peut que les énoncés vous demande plusieurs choses, comme montrer qu’une application est bijective, injective, surjective, est un isomorphisme ou un endomorphisme. Il existe plusieurs manière d’arriver à vos fins.

En ce qui concerne les endomorphismes, c’est relativement simple, vous devez tout d’abord comparer l’espace de départ et l’espace d’arrivée. Si ils sont différents, alors l’application ne peut pas être un endomorphisme. Si les deux espaces sont les mêmes, alors il s’agit nécessairement d’un endomorphisme.

Pour voir si une application linéaire est injective, il faut montrer que son noyau dans l’espace de départ, est l’espace nul, autrement dit, ker(f)=0_E.

Pour montrer qu’une application linéaire est surjective, il faut montrer que l’image de l’espace de départ est l’espace d’arrivée tout entier, autrement dit, Im(f)=F

Pour montrer qu’une application est un isomorphisme, il faut montrer qu’elle est à la fois injective, et à la fois surjective, autrement dit, qu’il s’agit d’un morphisme bijectif.

Pour finir, pour montrer qu’une application linéaire est un automorphisme, il faut montrer qu’elle est à la fois un endomorphisme, et à la fois un isomorphisme.

Prenons un exemple pour schématiser tout cela. On va prendre un exemple dans lequel il faudra raisonner à l’envers. On nous dit qu’il existe un unique endomorphisme dans \mathbb{R}^4, tel que, si (e_1,e_2,e_3,e_4) désigne sa base canonique, alors :

f(e_1)=e_1-e_2+e_3
f(2 e_1 + 3 e_4)=e_2
ker(f)= \{x,y,z,t\} \in \mathbb{R}^4 tel que x+2y+z=0 et x+3y-t=0

En fait, on nous donne ici des conditions, des contraintes, et on nous demande de prouver l’existence et l’unicité de cet endomorphisme.
Comment allons-nous procéder ? Il y a plusieurs choses à faire, la première, c’est trouver les valeurs de f(e_1), f(e_2), f(e_3) et f(e_4).

On peut d’ors et déjà calculer les valeurs de f(e_1) et f(e_4). En effet, f(e_1)=e_1-e_2+e_3 et f(e_4)=\frac{1}{3} (e_2-2f(e_1))=\frac{1}{3}(e_2-2(e_1+2e_2-2e_3)=\frac{1}{3}(-2 e_1 +3 e_2 -2 e_3)

Reste à trouver f(e_2) et f(e_3). C’est un petit peu compliqué, car nous ne les connaissons pas explicitement. Il va falloir se servir des données que nous avons sur le noyau. On sait qu’un endomorphisme est uniquement défini par l’image d’une base, pourquoi ? Tout simplement, car un endomorphisme conserve la structure et la dimension de l’espace de départ.

On va poser le système afin de trouver une base du noyau :

\left\{\begin{array}{l}  x+2y+z=0 \\ x+3y-t=0 \\ \end{array}\right.

On a donc facilement que :

\left\{\begin{array}{l} x+2y-x+2y=0 \\ x+3y-x-3y=0 \\ z=-x-2y \\ t=x+3y \\ \end{array}\right.

Donc :

\left\{\begin{array}{l} x=x \\ y=y \\ z=-x-2y \\ t=x+3y \\ \end{array}\right.

On a donc Ker(f)=x(1,0,-1,1)+y(0,1,-2,3)=vect\{(1,0,-1,),(0,1,-2,3)\}
Ceci forme une base du noyau, mais puisqu’on veut trouver f(e_2) et latex f(e_3)$ grâce au noyau, rien de plus simple maintenant que nous connaissons ses conditions, il suffit de reporter l’image dans le vecteur x et le vecteur y, et résoudre l’équation homogène :

f(e_1)-f(e_3)+f(e_4)=0 et f(e_2)-2 f(e_3)+3 f(e_4)=0

Par conséquent, f(e_3)=f(e_1)+f(e_4)=e_1-e_2+e_3+\frac{1}{3}(-2 e_1 +3 e_2 -2 e_3)=\frac{1}{3}e_1+\frac{1}{3}e_3

Aussi, f(e_2)=2 f(e_3)-3f(e_4)=\frac{4}{3}e_1 + \frac{4}{3}e_3+3 e_2

L’endomorphisme de \mathbb{R}^4 qui répond aux conditions que nous avions fixé est donc unique.

Peut on dire s’il s’agit d’une application injective ? Surjective ? Eh bien, elle n’est pas injective, pourquoi ? On voit bien que le noyau n’est pas réduit au vecteur nul, autrement dit Ker(f) \neq 0_{\mathbb{R}^4}, car dim(Ker(f))=2

Par le théorème du rang, on peut facilement en déduire que dim(Im(f))=2 également. Pouvons nous le prouver ? Oui, on voit déjà immédiatemment que f(e_3) est combinaison linéaire de f(e_1) et f(e_4), on peut donc l’éliminer. En réalité, f(e_2) est également une combinaison linéaire de f(e_1) et f(e_4). En effet, f(e_2)=2 f(e_1)-f(e_4).

Donc, notre endomorphisme n’est pas surjectif, son image est de dimension 2, il ne génère donc pas \mathbb{R}^4.
Par conséquent, l’application n’est ni surjective, ni injective, elle n’est donc pas bijective, en revanche, on a bien dim~Ker(f) + dim~Im(f) = \mathbb{R}^4. Ceci conclu notre exemple.

Un autre exemple rapide pour que vous compreniez bien ce qu’est, un isomorphisme cette fois :

Soit une application \phi de R^n[X] dans \mathbb{R}^{n+1}, définie par \phi P=(P(0),P(1),...,P(n)). S’agit t-il d’un isomorphisme ?

En fait, la réponse est immédiate. On commence par montrer qu’elle est injective, autrement dit, que son noyau est réduit au polynôme nul. Or, une propriété des polynômes dit qu’un polynôme de degré n, et de racine n+1 est forcément le polynôme nul. Donc, Ker(\phi)=0_{R^n[X]}
Le noyau est donc de dimension 0.

Or, en se basant sur le théorème du rang, si le noyau est de dimension 0, étant dans l’espace des polynômes de degré inférieur ou égal à n, qui est de dimension n+1, alors l’image de \phi est de dimension n+1.
Mais l’espace d’arrivée étant \mathbb{R}^{n+1}, qui est de dimension n+1, alors dim(\phi)=dim (\mathbb{R}^{n+1}). Mais \phi étant injective, elle est forcément surjective, puisque l’image et l’espace d’arrivée sont de même dimension.

Conclusion, Im(\phi)=\mathbb{R}^{n+1}, et donc, \phi est un isomorphisme.

L’astuce, est de prouver que si l’image d’un espace vectoriel est injective dans un autre, qui est de même dimension, alors, c’est une bijection, et par extension, un isomorphisme.