1.1 L’exposé classique sur les barycentres

Vide

Sommaire de l’article

Vide

1.3 Quelques illustrations

Barycentres (suite 2)

© APMEP Juin 2020

1.2 Interprétation vectorielle des points massifs

Le lecteur a certainement rencontré des écritures comme \(\mathsf{B}=\mathsf{A}+\overrightarrow{\mkern0.1mu u\mkern1mu}\) ou \(\mathsf{I}=\dfrac{1}{2}\mathsf{A}+\dfrac{1}{\mathstrut2}\mathsf{B}\) voire \(\mathsf{G}=\lambda\,\mathsf{A}+(1-\lambda)\,\mathsf{B}\) accompagnées d’incitations à calculer avec « naturellement ». Dans la célèbre collection des Vissio, Condamine les introduisait — en hors-programme — en 1971. Ces écritures, imaginées par Möbius (1827) et Grassmann (1844)9, peuvent être fondées mathématiquement ainsi que nous allons le voir.

On souhaite donc donner un sens — qui ait quelque chose à voir avec les barycentres — à l’écriture a priori formelle \[\alpha_1\mathsf{A}_1+\alpha_2\mathsf{A}_2+\cdots+\alpha_n\mathsf{A}_n\] les \(\alpha_k\) désignant des réels et les \(\mathsf{A}_k\) des points du plan; puis on définira sur ces dernières un calcul qui permet de les manipuler comme d’authentiques combinaisons linéaires. Les questions théoriques viendront ensuite.

Une réponse pratique

On se place ici dans l’idée qu’il est parfois bon que la pratique précède — pour mieux l’éclairer — la théorie et que le statut des objets manipulés n’est pas nécessairement la priorité première… Les travaux de nos collègues historiens ont largement apportés des arguments à l’appui de cette thèse. Maurice Glaymann naguère, Jean-Pierre Ferrier plus récemment, ont suggéré une voie, ne nécessitant pas de longs développements, que nous allons suivre.

Distinguons deux cas :

  1. \(\displaystyle \alpha_1+\cdots+\alpha_n=0\); la somme vectorielle \(\alpha_1\overrightarrow{\mkern0.5mu\mathstrut\mathsf{OA}_1\mkern2mu}+\cdots
    +\alpha_n\overrightarrow{\mkern0.5mu\mathstrut\mathsf{OA}_n\mkern2mu}\)
    est indépendante du point \(\mathsf{O}\). Un point important est la propriété « un/tous » associée à cette assertion : si elle est valide pour un point \(\mathsf{O}\), elle est valide pour tous. Soit \(\overrightarrow{\mkern0.1mu u\mkern1mu}\) ce vecteur; avec comme unique heuristique le souhait de traduire la propriété « un/tous », on convient d’écrire : \[\alpha_1\mathsf{A}_1+\alpha_2\mathsf{A}_2+\alpha_n\mathsf{A}_n=\overrightarrow{\mkern0.1mu u\mkern1mu}.\] Le cas important pour la suite est celui où ce vecteur est nul. \[\alpha_1\mathsf{A}_1+\cdots+\alpha_nA_n=\overrightarrow{\mkern0.1mu 0\mkern1mu}\] Par exemple \(0\,\mathsf{A}=\overrightarrow{\mkern0.5mu\mathstrut 0\mkern2mu}\) et \(1\,\mathsf{B}-1\,\mathsf{A}=\overrightarrow{\mkern0.5mu\mathstrut\mathsf{AB}\mkern2mu}\). On peut bien sûr identifier \(1\,\mathsf{A}\) et \(\mathsf{A}\). Le lecteur pourra s’intéresser au cas \(n=3\), c’est-à-dire discuter de l’égalité \(\alpha\,\mathsf{A}+\beta\,\mathsf{B}+\gamma\,\mathsf{C}=\overrightarrow{\mkern0.1mu
    0\mkern1mu}\)
    , qui va jouer un rôle essentiel dans la suite.

  2. \(\displaystyle \alpha_1+\cdots + \alpha_n =\alpha \neq 0\); on sait qu’il existe un unique point \(\mathsf{G}\) (le barycentre) tel que \[\alpha_1\overrightarrow{\mkern0.5mu\mathstrut
    \mathsf{OA}_1\mkern2mu}+\cdots+\alpha_n\overrightarrow{\mkern0.5mu\mathstrut
    \mathsf{OA}_n\mkern2mu}=\alpha\,\overrightarrow{\mkern0.5mu\mathstrut
    \mathsf{OG}\mkern2mu}\]
    et cela quel que soit le point \(\mathsf{O}\). Dans ce cas aussi, on a la même propriété « un/tous ». On convient alors d’écrire \[\alpha_1\mathsf{A}_1+\cdots+\alpha_n\mathsf{A}_n=\alpha\,\mathsf{G}\] écriture équivalente à \[\alpha_1\mathsf{A}_1+\cdots+\alpha_n\mathsf{A}_n-\alpha\,\mathsf{G}=\overrightarrow{\mkern0.5mu\mathstrut
    0\mkern2mu}\text{ et }\alpha \neq 0\]
    Le lecteur observera que ce qui précède ne dit rien sur la nature de l’objet désigné par \(\alpha \mathsf{A}\).

Lorsqu’on veut calculer sur de nouveaux objets, il importe de disposer d’une égalité; on convient que (sans aucune condition sur les points et les coefficients) l’égalité

\[\tag{4}\alpha_1\mathsf{A}_1 +\cdots+\alpha_n\mathsf{A}_n=\beta_1\mathsf{B}_1+ \cdots +
\beta_p\mathsf{B}_p
\label{equa0}\]

signifie exactement que

  1. \(\alpha_1+\cdots+\alpha_n=\beta_1+\cdots+\beta_p\);

  2. \(\alpha_1\mathsf{A}_1+\cdots+\alpha_n\mathsf{A}_n+(-\beta_1)\mathsf{B}_1+\cdots+
    (-\beta_p)\mathsf{B}_p=\overrightarrow{\mkern0.1mu 0\mkern1mu}\)
    .

    On dira que (4) est une égalité équilibrée. On voit qu’on se ramène encore une fois à la nullité de la fonction vectorielle de Leibniz associée.

    En particulier \(a\mathsf{A}=b\mathsf{B}\) signifie que \[(a=b=0)\text{ ou }(a=b \neq 0\text{ et }\mathsf{A}=\mathsf{B})\] Bien sûr, on écrira \(-\beta\mathsf{B}\) à la place de \((-\beta)\mathsf{B}\). On peut vérifier que cette définition de l’égalité est compatible avec le produit par un scalaire (non nul) des combinaisons linéaires de points en convenant que \(\lambda(\alpha\mathsf{A})=(\lambda\alpha)\mathsf{A}\).

Dès lors, à condition de n’écrire que des égalités équilibrées — et pas nécessairement avec une somme des coefficients égale à 1, et dont les membres peuvent éventuellement être des vecteurs — toutes les manipulations habituelles sur les combinaisons linéaires sont valides : commutativité, associativité, substitution, ajout membre à membre d’égalités, produit d’une égalité par un réel non nul, combinaison linéaire de combinaisons linéaires, etc. On peut entre plusieurs égalités équilibrées, procéder à des opérations élémentaires comme sur un système linéaire. Et en cas de doute, on peut toujours retourner à la signification vectorielle.

Cerise sur le gâteau, l’image d’une combinaison linéaire de points par une application affine est la combinaison des images (en remplaçant au besoin l’application affine par son application linéaire associée.). L’exemple de base est la projection — qui est une conséquence du théorème de Thalès — ce qui permet de traduire une égalité équilibrée par des égalités numériques sur les coordonnées.

Pour approfondir ces questions, on ne peut que renvoyer le lecteur à la publication de l’IREM de Bordeaux [2], disponible aussi sur Publimath.

Des exemples d’utilisation vont être donnés plus loin.

La théorie des équilibres

Pour faire du concept de barycentre un outil moins parasité par le vectoriel, le groupe géométrie de l’IREM de Bordeaux introduit en 1988 la notion d’équilibre qui permet d’éviter les formalismes des paragraphes précédents, et dont le groupe a même, après expérimentation, proposé l’introduction dans les programmes10.

Nous allons brièvement présenter cette approche, intéressante car conçue pour les élèves, mais en nous adressant à des enseignants. Pour un exposé didactique complet, nous renvoyons aux publications [2] et [3].

On suppose acquise la notion de barycentre qui, en réalité, doit être intégrée au processus.

La motivation principale est d’introduire une symétrie dans les écritures barycentriques, tout en les simplifiant, et en offrant la possibilité de s’appuyer essentiellement non pas sur le calcul vectoriel mais sur la statique de systèmes physiques simples, l’équilibre à trois points étant fondamental.

Une famille de points massifs \(\left(\lambda_k,\,\mathsf{A}_k\right)_{1 \leqslant k
\leqslant n}\)
est dite former un équilibre si et seulement si les deux propriétés suivantes sont satisfaites :

\begin{align}
\tag{5}\sum_k \lambda_k&=0;\label{equa4}\\
\tag{6}\text{il existe }\mathsf{O}\text{ tel que }
\sum_k\lambda_k\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{OA}_k\mkern2mu}&=\overrightarrow{\mkern0.1mu 0\mkern1mu}.\label{equa5}
\end{align}

On sait que si ces deux conditions sont remplies, (6) est valide quel que soit \(\mathsf{O}\). Cette définition est strictement d’ailleurs équivalente à la nullité de la fonction vectorielle de Leibniz.

Il convient de noter qu’il n’est pas imposé que les points \(\mathsf{A}_k\) soient deux à deux distincts (c’est pour cela que l’on parle de famille) ni que les \(\lambda_k\) soient tous non nuls. Pour traduire qu’un système forme un équilibre, on utilise l’écriture spéciale suivante :

\[\left\{\begin{array}{c|c|c|c} \mathsf{A}_1 & \mathsf{A}_2 & \cdots
& \mathsf{A}_n \\ \hline \lambda_1 & \lambda_2 & \cdots & \lambda_n
\end{array}\right\}\]

Il faut bien comprendre que c’est la présence des accolades qui porte l’information sur l’équilibre ([4]) et ([5]); un tableau sans accolade sert à désigner une famille de points massifs. Comme il est utile de pouvoir désigner un système en équilibre par un nom, on écrira sans hésiter

\[\sigma=\left\{\begin{array}{c|c|c|c} \mathsf{A}_1 & \mathsf{A}_2 &
\cdots & \mathsf{A}_n \\ \hline \lambda_1 & \lambda_2 & \cdots & \lambda_n
\end{array}\right\}\]

Le seul équilibre à un point est \( \displaystyle \left\{\begin{array}{c} \mathsf{A}
\\ \hline 0 \end{array}\right\}\)
, les seuls équilibres à deux points sont \(\displaystyle \left\{\begin{array}{c|c} \mathsf{A} & \mathsf{A} \\
\hline \lambda & -\lambda \end{array}\right\}\)
et \(
\displaystyle\left\{\begin{array}{c|c} \mathsf{A} & \mathsf{B} \\ \hline 0 & 0
\end{array}\right\}\)
, \(\mathsf{A} \neq \mathsf{B}\).

En revanche, \(\displaystyle \begin{array}{c|c} \mathsf{A} & \mathsf{B} \\ \hline 1 & -1
\end{array}\)
, \( \mathsf{A} \neq \mathsf{B}\), n’est pas un équilibre; physiquement, c’est un couple.

L’équilibre de base à trois points \(\displaystyle\left\{\begin{array}{c|c|c} \mathsf{A} & \mathsf{B} & \mathsf{C} \\ \hline a & b &
-(a+b) \end{array}\right\}\)
avec \(a+b \neq 0\) est caractérisé par \[(a+b)\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{OC}\mkern2mu}=a\,\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{OA}\mkern2mu}+b\,\overrightarrow{\mkern0.5mu\mathstrut\mathsf{OB}\mkern2mu}\]
qui fait le lien avec le barycentre de deux points. On verra sa justification en statique plus loin.

Réciproquement, si \(\mathsf{I}\) est milieu de \([\mathsf{AB}]\), alors \(\displaystyle\left\{\begin{array}{c|c|c} \mathsf{A} & \mathsf{B} & \mathsf{I} \\ \hline 1 & 1 & -2
\end{array}\right\}\)
mais aussi \(\displaystyle\left\{\begin{array}{c|c|c|c} \mathsf{A} & \mathsf{I} & \mathsf{B} & \ \mathsf{I} \\ \hline 1 &
-1 & 1 & -1 \end{array}\right\}\cdotp\)

On conçoit aisément des règles de transformation des équilibres : élimination ou introduction de colonnes de masse nulle, regroupement ou décomposition des colonnes relatives à un même point, remplacement d’une sous-famille de points massifs par le barycentre massif (l’associativité) et la transformation inverse.

On conçoit aussi l’idée d’équilibre réduit dans lequel les points sont deux à deux distincts et les masses non nulles; tout équilibre peut être transformé en un équilibre réduit (sans unicité) ce qui permet de définir l’égalité de deux équilibres par l’égalité des équilibres réduits.

Les équilibres réduits ont la propriété remarquable que chaque point, avec une masse opposée, est barycentre des autres. Ainsi l’équilibre \(\left\{\displaystyle \begin{array} {c|c|c} \mathsf{A} & \mathsf{B} & \mathsf{I} \\ \hline 1 & 1 & -2
\end{array} \right\}\)
nous dit aussi bien que \(\mathsf{I}\) est milieu de \([\mathsf{AB}]\) que \(\displaystyle \begin{array} {c} \mathsf{A} \\ \hline -1
\end{array} \)
est barycentre de \(\displaystyle \begin{array}
{c|c} \mathsf{B} & \mathsf{I} \\ \hline 1 & -2 \end{array} \)
et cela sans calcul. La réciproque est vraie : toute connaissance d’un point massif barycentre d’un système fournit mécaniquement un équilibre.

On peut définir des combinaisons linéaires d’équilibres de façon très naturelle :

si \(\sigma=\displaystyle \left\{\begin{array}{c|c|c} \mathsf{A}_1 & \mathsf{A}_2 & \mathsf{A}_3 \\
\hline \lambda_1 & \lambda_2 & \lambda_3
\end{array}\right\}\)
et \(\tau=\displaystyle
\left\{\begin{array}{c|c} \mathsf{B}_1 & \mathsf{B}_2 \\ \hline \mu_1 & \mu_2
\end{array}\right\}\)
alors \(\alpha\,\sigma+\beta\,\tau=\displaystyle
\left\{\begin{array}{c|c|c|c|c} \mathsf{A}_1 & \mathsf{A}_2 & \mathsf{A}_3 & \mathsf{B}_1 & \mathsf{B}_2 \\ \hline
\alpha\lambda_1 & \alpha\lambda_2 & \alpha\lambda_3 &
\beta\mu_1 & \beta\mu_2 \end{array}\right\}\cdotp\)

Et, pour terminer, on peut traduire les applications affines en terme d’équilibres, par exemple :

\(\displaystyle \left\{\begin{array}{c|c|c|c} \mathsf{M}’ & \mathsf{M} & \mathsf{A} & \mathsf{B} \\ \hline -1 &
1 & -1 & 1
\end{array}\right\}\)
équivaut à \(\mathsf{M}’=t_{\overrightarrow{\mkern0.5mu\mathstrut\mathsf{AB}\mkern2mu}}(\mathsf{M})\) et \(\displaystyle \left\{\begin{array}{c|c|c} \mathsf{M}’ & \mathsf{M} & \Omega \\ \hline -1 & k
& 1-k
\end{array}\right\}\)
équivaut à \(\mathsf{M}’=h_{\Omega,k}(\mathsf{M})\)

Il est remarquable qu’aussi bien le cas de l’équilibre à trois points que les différentes propriétés des équilibres trouvent une interprétation (un modèle) — ou une définition — dans l’équilibre mécanique d’un système discret de forces parallèles11.

Les équilibres à trois points permettent de traduire l’alignement, l’action des translations ou des homothéties, les équilibres à quatre points le parallélisme, les configurations parallélogramme et trapèze complet, etc. On trouvera dans le paragraphe suivant quelques exemples d’utilisation des équilibres.

Champs de vecteurs12

À un niveau élémentaire, une leçon sur les barycentres commence par le cas de deux points; les indispensables dessins qui accompagnent la leçon se faisant au tableau, on va supposer que la dimension de l’espace ambiant est \(2\).

La relation de base \(\alpha\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{MA}\mkern2mu}+\beta\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{MB}\mkern2mu}=(\alpha+\beta)\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{MG}\mkern2mu}\)
valide pour tout \(\mathsf{M}\), permet de construire \(\mathsf{G}\) comme intersection des droites \((\mathsf{MG})\) et \((\mathsf{AB})\).

Un logiciel de géométrie dynamique permet de visualiser l’indépendance de \(\mathsf{G}\) du point \(\mathsf{M}\) utilisé pour la construction. À l’aide de curseurs, on peut aussi faire varier les masses \(\alpha\) et \(\beta\). Tout aussi bien, si \(\alpha+\beta=0\), la même construction permet de visualiser la constance du premier membre.

Mais une autre lecture est possible au moins pour un enseignant. Il peut y voir des champs de vecteurs dont \(\mathsf{M}\) est la variable et voir s’effectuer la combinaison linéaire des applications \(\mathsf{M} \longmapsto
\overrightarrow{\mkern0.5mu\mathstrut\mathsf{MA}\mkern2mu}\)
et \(\mathsf{M} \longmapsto
\overrightarrow{\mkern0.5mu\mathstrut\mathsf{MB}\mkern2mu}\)
( semble être très efficace pour cela). Ce point de vue va permettre la construction envisagée.

Soit donc \((\mathscr{E},E)\) un espace affine de dimension \(n\); un champ de vecteurs sur \(\mathscr{E}\) est une application \(\phi\) de \(\mathscr{E}\) dans \(E\). C’est le cas des fonctions vectorielles de Leibniz. L’ensemble \(\mathcal{C}(\mathscr{E})\) des champs de vecteurs sur \(\mathscr{E}\) est naturellement un espace vectoriel comme tout ensemble d’applications à valeurs dans un espace vectoriel.

On considère deux ensembles de champs de vecteurs particuliers; les champs constants \(\mathsf{C}_{\overrightarrow{\mkern0.1mu u\mkern1mu}}= \mathsf{M} \longmapsto
\overrightarrow{\mkern0.1mu u\mkern1mu}\)
et les champs centraux \(\mathsf{C}_{\lambda,\,\mathsf{A}}=\mathsf{M}\longmapsto
\lambda\overrightarrow{\mkern0.5mu\mathstrut\mathsf{MA}\mkern2mu}\)
(\(\lambda
\neq 0\)
). Soit \(\mathcal{C}o\) (respectivement \(\mathcal{C}e\)) l’ensemble des champs constants (respectivement centraux); on dispose de deux bijections, l’une entre \(\mathcal{C}o\) et \(E\), l’autre entre \(\mathcal{C}e\) et \(\mathbb{R}^{\ast} \times \mathscr{E}\).

Nous avons suivi dans l’illustration ci-dessus les physiciens qui préfèrent représenter les champs de vecteurs par un échantillon de vecteurs qu’ils appellent liés et qui sont des couples \((\mathsf{M},\,\phi(\mathsf{M}))\).

On a \(\mathcal{C}o \cap \mathcal{C}e =\emptyset\); si \(\mathcal{C}o\) est un espace vectoriel isomorphe à \(E\), ce n’est pas le cas de \(\mathcal{C}e\). En revanche, et c’est la clef de la construction envisagée, la réunion \(\mathcal{D}=\mathcal{C}o\cup \mathcal{C}e\) est un sous-espace vectoriel de \(\mathcal{C}(\mathscr{E})\). La démonstration est simple mais essentielle.

\(\scriptscriptstyle \blacksquare\) \(\mathcal{D}\) est non vide. En évidence, \(\mathsf{C}_{\overrightarrow{\mkern0.1mu
u\mkern1mu}}+\mathsf{C}_{\overrightarrow{\mkern0.1mu
v\mkern1mu}}=\mathsf{C}_{\overrightarrow{\mkern0.1mu
u\mkern1mu}+\overrightarrow{\mkern0.1mu v\mkern1mu}}\)
, puis \(\lambda\,\mathsf{C}_{\overrightarrow{\mkern0.1mu
u\mkern1mu}}=\mathsf{C}_{\lambda\,\overrightarrow{\mkern0.1mu u\mkern1mu}}\)
et \(\mu\,\mathsf{C}_{\lambda,\,\mathsf{A}}=\mathsf{C}_{\mu\lambda,\,\mathsf{A}}\); on a en particulier \(\mathsf{C}_{\lambda,\,\mathsf{A}}=\lambda\,\mathsf{C}_{1,\,\mathsf{A}}\).

Ensuite, si \(\lambda+\mu \neq 0\), alors il n’est pas nécessaire d’avoir étudié les barycentres pour démontrer qu’il existe \(\mathsf{G}\) tel que, pour tout \(\mathsf{M}\), \(\lambda\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{MA}\mkern2mu}+\mu\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{MB}\mkern2mu}=(\lambda+\mu)\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{MG}\mkern2mu}\)
ce qui se traduit sur les champs par \(\mathsf{C}_{\lambda,\,\mathsf{A}}+\mathsf{C}_{\mu,\,\mathsf{B}}=
\mathsf{C}_{\lambda+\mu,\,\mathsf{G}}\)
.

Si \(\lambda+\mu = 0\), alors \(\lambda\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{MA}\mkern2mu}+\mu\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{MB}\mkern2mu}=\lambda\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{BA}\mkern2mu}\)
est indépendant de \(\mathsf{M}\) et donc \(\mathsf{C}_{\lambda,\,\mathsf{A}}+\mathsf{C}_{\mu,\,\mathsf{B}}=
\mathsf{C}_{\lambda\,\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{BA}\mkern2mu}}\)

Enfin, \(\lambda\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{MA}\mkern2mu}+\overrightarrow{\mkern0.1mu u\mkern1mu}=
\lambda(\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{MA}\mkern2mu}+\lambda^{-1}\overrightarrow{\mkern0.1mu
u\mkern1mu})=\lambda\overrightarrow{\mkern0.5mu\mathstrut\mathsf{MB}\mkern2mu}\)
\(\mathsf{B}\) est tel que \(\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{AB}\mkern2mu}=\lambda^{-1}\overrightarrow{\mkern0.1mu u\mkern1mu}\)
. Donc \(\mathsf{C}_{\lambda,\,\mathsf{A}}+\mathsf{C}_{\overrightarrow{\mkern0.1mu
u\mkern1mu}}=\mathsf{C}_{\lambda,\,\mathsf{B}}\)
.

On a ainsi démontré la stabilité par combinaison linéaire de \(\mathcal{D}\).

Il ne reste plus qu’à faire le lien entre les champs et les points. L’application \(\Omega\) de \(\mathcal{D}=\mathcal{C}o \cup \mathcal{C}e\) dans \(\mathbb{R}\) définie par \(\Omega(\mathsf{C}_{\overrightarrow{\mkern0.1mu
u\mkern1mu}})=0\)
et \(\Omega(\mathsf{C}_{\lambda,\,\mathsf{A}})=\lambda\) est une forme linéaire non nulle (c’est démontré dans ce qui précède) ce qui démontre que la dimension de \(\mathcal{D}\) est \(n+1\) et l’application \(I_{\lambda}=\mathsf{M}
\longmapsto \mathsf{C}_{\lambda,\,\mathsf{M}}\)
est une bijection affine entre \(\mathscr{E}\) et l’hyperplan \(\Omega^{-1}(\{\lambda\})\) de \(\mathcal{D}\). L’espace vectoriel associé à \(\Omega^{-1}(\{\lambda\})\) est bien sûr \(\ker(\Omega)=\Omega^{-1}(\{0\})=\mathcal{C}o\).

\(\scriptscriptstyle \blacksquare\) Ce point mérite démonstration. \(\Omega^{-1}(\{1\})\) est un hyperplan affine de \(\mathcal{D}\) de direction (espace vectoriel associé) le noyau de \(\Omega\) et \(\Omega^{-1}(\{\lambda\})\) est homothétique de \(\Omega^{-1}(\{1\})\). Le caractère bijectif de \(I_1\) est « naturel » par construction même. Pour démontrer le caractère affine de \(I_1\), on a besoin d’une application linéaire de \(E\) dans \(\Omega^{-1}(\{0\})=\mathcal{C}o\); \(\overrightarrow{\mkern0.1mu u\mkern1mu} \longmapsto
\mathcal{C}_{\overrightarrow{\mkern0.1mu u\mkern1mu}}\)
est un candidat disponible. Soient donc \(\mathsf{P},\,\mathsf{Q} \in \mathscr{E}\); on a \[\overrightarrow{\mkern0.5mu\mathstrut I_1(\mathsf{P})I_1(\mathsf{Q})\mkern2mu}=\mathsf{X}
\longmapsto \overrightarrow{\mkern0.5mu\mathstrut
\mathsf{XQ}\mkern2mu}-\overrightarrow{\mkern0.5mu\mathstrut\mathsf{XP}\mkern2mu}= \mathsf{X}
\longmapsto \overrightarrow{\mkern0.5mu\mathstrut \mathsf{PQ}\mkern2mu}\]
donc \(\overrightarrow{\mkern0.5mu\mathstrut
I_1(\mathsf{P})I_1(\mathsf{Q})\mkern2mu}=\mathsf{C}_{\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{PQ}\mkern2mu}}\)
, ce qui achève la démonstration.

On peut faire un bilan : les vecteurs de \(E\) s’identifient aux champs constants via l’isomorphisme linéaire canonique \(\overrightarrow{\mkern0.1mu
u\mkern1mu} \longmapsto \mathsf{C}_{\overrightarrow{\mkern0.1mu u\mkern1mu}}\)
. L’ensemble \(\mathbb{R}^{\ast} \times \mathscr{E}\) des points massifs \((\lambda,\,\mathsf{A})\) s’identifie à celui des champs centraux \(\mathcal{C}e=
\bigcup_{\lambda}\Omega^{-1}(\{\lambda\})\)
; chaque \(\Omega^{-1}(\{\lambda\})\) est homothétique de \(\Omega^{-1}(\{1\})\) donc isomorphe (comme espace affine) canoniquement à \(\mathscr{E}\). Il est ainsi naturel de procéder à la succession d’identifications : \[\mathsf{C}_{\overrightarrow{\mkern0.1mu u\mkern1mu}}=\overrightarrow{\mkern0.1mu
u\mkern1mu},\ \mathsf{C}_{1,\mathsf{A}}=(1,\,\mathsf{A})=1\mathsf{A}=\mathsf{A}
\text{ et }\mathsf{C}_{\lambda,\,\mathsf{A}}=(\lambda,\,\mathsf{A})=
\lambda(1,\,\mathsf{A})=\lambda\mathsf{A}.\]
Ainsi dans l’écriture \(\lambda\mathsf{A}\), on a bien affaire à une multiplication externe du vecteur \(\mathsf{A}\) par le scalaire \(\lambda\)… Dès lors, toutes les règles de calcul fournies par l’algèbre linéaire sont disponibles; les combinaisons linéaires finies sont des objets de base aux propriétés bien établies; c’est le cas des \(\displaystyle\sum_k \lambda_k\mathsf{A}_k\).

Si on introduit l’ensemble plus simple à représenter \(\widehat{E}=E\,\cup\,(\mathbb{R}^{\ast}\times \mathscr{E})\), les identifications précédentes font de \(\widehat{E}\) un espace vectoriel, dont \(\mathscr{E}\) est un hyperplan affine de direction \(E\) ce qu’illustre le dessin ci-dessous. On peut oublier les champs de vecteurs et calculer sereinement sur les points en comprenant mieux ce que l’on fait. Dans la suite, on ne parlera que de \(\widehat{E}\).

Il est utile d’observer que, pour tout \(\mathsf{A}\in\mathscr{E}\), on a \(\widehat{E}= \mathbb{R}\mathsf{A} \oplus E \). Si \(\dim(E)=2\) par exemple et si \((\overrightarrow{\mkern0.1mu e\mkern1mu}_1,\,\overrightarrow{\mkern0.1mu
e\mkern1mu}_2)\)
est une base de \(E\) alors, en posant \(\mathsf{A}_0=\mathsf{A}\), \(\mathsf{A}_1=\mathsf{A}+\overrightarrow{\mkern0.1mu e\mkern1mu}_1\) et \(\mathsf{A}_2=\mathsf{A}+\overrightarrow{\mkern0.1mu e\mkern1mu}_2\), \((\mathsf{A}_0,\,
\mathsf{A}_1,\,\mathsf{A}_2)\)
est une base de \(\widehat{E}\) et tout \(\mathsf{M}\in\mathscr{E}\) s’écrit alors de façon unique sous la forme \[\mathsf{M}=\lambda_1\mathsf{A}_1+\lambda_2\mathsf{A}_2+\lambda_3\mathsf{A}_3
\text{ avec }\lambda_1+\lambda_2+\lambda_3=1.\]

L’introduction de l’espace \(\mathcal{D}\) n’a pas pour fonction de satisfaire un besoin de rigueur déraisonnable; on y dispose de toutes les ressources de l’algèbre linéaire : bases, calcul matriciel, déterminant, endomorphismes13… Voir [6] pour un bref tableau. Il est d’ailleurs tout-à-fait possible de travailler directement dans \(\widehat{E}\) et de définir les opérations \((\lambda,\,\mathsf{A})+(\mu,\,\mathsf{B})\), \(\alpha\,(\lambda,\,\mathsf{A})\), \((\lambda,\,\mathsf{A})+\overrightarrow{\mkern0.1mu
u\mkern1mu}\)
, celles sur \(E\) étant connues et de démontrer — au prix d’un labeur considérable mais élémentaire — qu’on obtient bien une structure d’espace vectoriel. L’écriture \(\lambda\mathsf{A}\) est ensuite introduite comme abréviation de \((\lambda,\,\mathsf{A})\) après identification de \((1,\,\mathsf{A})\) avec \(\mathsf{A}\).

Retour sur certaines écritures

\(\boxed{\mathsf{L’\acute{e}criture\ A+\overrightarrow{\mkern0.1mu u\mkern1mu}}}\)

En utilisant les identifications précédentes, on peut écrire \(\mathsf{A}+\overrightarrow{\mkern0.1mu u\mkern1mu}=
1\mathsf{A}+\overrightarrow{\mkern0.1mu u\mkern1mu}=
\mathsf{C}_{1,\mathsf{A}}+\mathsf{C}_{\overrightarrow{\mkern0.1mu u\mkern1mu}}=
\mathsf{C}_{1,\mathsf{B}}=\mathsf{B}\)
\(\mathsf{B}\) est défini par \(\overrightarrow{\mkern0.5mu\mathstrut
\mathsf{AB}\mkern2mu}=\overrightarrow{\mkern0.1mu u\mkern1mu}\)
.
\(\boxed{\mathsf{L’\acute{e}criture\ B-A= \overrightarrow{\mkern0.5mu\mathstrut AB\mkern2mu}}}\)

\(\mathsf{B}-\mathsf{A}\ =\ 1\mathsf{B}+(-1\mathsf{A})=
\mathsf{C}_{1,\mathsf{B}}+\mathsf{C}_{-1,\mathsf{A}}=
\mathsf{C}_{\overrightarrow{\mkern0.5mu\mathstrut\mathsf{AB}\mkern2mu}}=
\overrightarrow{\mkern0.5mu\mathstrut\mathsf{AB}\mkern2mu}\)

On observera donc que dans les trois écritures \(\mathsf{A}+\overrightarrow{\mkern0.1mu u\mkern1mu}\), \(\mathsf{A}+\mathsf{B}\) et \(\mathsf{B}-\mathsf{A}\) les signes d’opérations désignent bien une addition ou une soustraction dans l’espace vectoriel \(\widehat{E}\). Si \(\mathsf{A}+\overrightarrow{\mkern0.1mu u\mkern1mu}\) est un point de \(\mathscr{E}\), et \(\mathsf{B}-\mathsf{A}\) est un vecteur de \(E\), \(\mathsf{A}+\mathsf{B}\) est n’est pas un point mais le point massif \(2\,\mathsf{I}\) homothétique (vectoriel !) du milieu \(\mathsf{I}\) de \([\mathsf{AB}]\) dans \(\widehat{E}\).

\(\boxed{\mathsf{0A=\overrightarrow{\mkern0.1mu 0\mkern1mu}}}\)

On a \(0\mathsf{A}=0(1\mathsf{A})=\overrightarrow{\mkern0.1mu 0\mkern1mu}\) comme dans tout espace vectoriel. \((0,\,\mathsf{A})\) a donc droit à l’existence toutefois ce n’est pas un point massif mais le vecteur nul.

\(\boxed{\mathsf{La\ notation\ G=Bar\left((\alpha,\,A),\,(\beta,\,B)\right)}}\)

La théorie nous permet d’écrire \((\alpha+\beta)\mathsf{G}=\alpha\mathsf{A}+\beta\mathsf{B}\) soit\(\left((\alpha+\beta)\mathsf{G}\right)=
\mathrm{Bar}\left((\alpha,\,\mathsf{A}),\,(\beta,\,\mathsf{B})\right)\)
.

Si \(\alpha+\beta=1\) alors \(1\mathsf{G}=\mathsf{G}\) et donc l’écriture est valide. Sinon, \((\alpha+\beta)\mathsf{G}\) ne s’identifie pas à \(\mathsf{G}\). Pour conserver la cohérence des écritures, il convient d’accepter le fait qu’un barycentre de points massifs est un point massif (relire Berger [5]) ou alors de n’accepter l’appellation de barycentre que lorsque la masse totale est \(1\), choix qu’un certain nombre d’auteurs font. On voit que la définition donnée au début :

Le barycentre de la famille des points massifs \((\lambda_k,\,\mathsf{A}_k)\) est défini comme le point \(\mathsf{G}\) unique solution de l’équation \(\phi(\mathsf{G})=\overrightarrow{\mkern0.1mu 0\mkern1mu}\).

est problématique à moins que \(\displaystyle\sum_k\lambda_k=1\). Certes, dans la langue parlée (et sa transcription écrite) une métonymie inévitable conduit à utiliser une phrase non ambiguë comme « soit \(\mathsf{G}\) le barycentre de \((1,\,\mathsf{A})\) et \((2,\,\mathsf{B})\) ». Mais dans le contexte de la mise en place d’un calcul barycentrique, il vaut peut être mieux éviter une écriture du type \(\mathsf{G}=\textrm{Bar}\left((1,\,\mathsf{A}),(2,\,\mathsf{B})\right)\). Chacun appréciera.

Enfin, les notions d’égalité équilibrée à coefficients non nuls, d’équilibre réduit et celle de famille de \(\mathscr{E}\) linéairement liée dans \(\widehat{E}\) coïncident et chacune de ces notions permet d’exprimer le calcul barycentrique. Dans la suite, nous alternerons l’emploi de ces différentes écritures.


  1. Auguste Möbius (1790-1868) et Hermann Grassman (1809-1877) sont deux mathématiciens allemands.

  2. Ce qui n’a pas eu lieu; les années quatre-vingt-dix ont marqué le début de l’abandon progressif de la réforme de l’enseignement de la géométrie entreprise par Jean-Louis Ovaert. La suppression des Terminales C est alors en route.

  3. Ces questions, qui ne semblent plus étudiées en physique au lycée, le sont encore, modestement, au collège. Cette discipline a été « récupérée » par les sciences de l’ingénieur.

  4. L’idée d’utiliser des champs de vecteurs semble remonter à Élie Cartan (1869-1951), et trouver l’origine de sa diffusion dans l’enseignement universitaire français dans une étude de Y. Bamberger et J.-P. Bourguignon sur les torseurs affines publiée en 1970. Elle est reprise dans [4] et par Berger [5].

  5. Il possède une propriété d’universalité qui assure son unicité.

1.1 L’exposé classique sur les barycentres

Vide

Sommaire de l’article

Vide

1.3 Quelques illustrations

Pour citer cet article : Beck V., Boucher F. et Gauthier G., « 1.2 Interprétation vectorielle des points massifs », in APMEP Au fil des maths. N° 536. 2 juillet 2020, https://afdm.apmep.fr/rubriques/ouvertures/1-2-interpretation-vectorielle-des-points-massifs/.

Une réflexion sur « 1.2 Interprétation vectorielle des points massifs »

Les commentaires sont fermés.