SCIENCES PURES 

Einstein

de 1919 à 1949

Texte fondateur

 

Relativité, masse et énergie

SOMMAIRE

(Épigraphe) Relativité générale - 1919

Vitesse de la lumière et continuum espace-temps (1936)

Qu'est-ce que la théorie de la relativité ? (1919)

La théorie de la relativité (1949)

A. Théorie de la relativité restreinte

B. Théorie de la relativité générale

E=mc2 (1946)

Épigraphe
Einstein - Relativité générale - 1919 [1]

Vitesse de la lumière et continuum espace-temps (1936) [2]

Il n'y a pas de méthode inductive qui puisse conduire aux concepts fondamentaux de la physique. Faute de comprendre ce fait, bien des chercheurs du XIXe siècle ont été victimes d'une erreur philosophique fondamentale. Ce fut probablement la raison pourquoi la théorie moléculaire et la théorie de Maxwell ne purent s'établir qu'à une date relativement tardive. La pensée logique est nécessairement déductive, elle est basée sur des concepts hypothétiques et des axiomes. Quel espoir y a-t-il de choisir ces derniers d'une façon telle qu'on puisse espérer la confirmation de leurs conséquences ?

Le cas le plus favorable est évidemment celui où les nouvelles hypothèses fondamentales sont suggérées par l'expérience elle-même. L'hypothèse de la non-existence du mouvement perpétuel, qui est la base de la thermodynamique, fournit un exemple d'une hypothèse fondamentale suggérée par l'expérience ; ceci est également vrai pour le principe de l'inertie de Galilée. À la même catégorie appartiennent aussi les hypothèses fondamentales de la théorie de la relativité, qui a conduit à une extension et à un approfondissement de la théorie du champ et au remplacement des fondements de la mécanique classique.

Les succès de la théorie de Maxwell-Lorentz ont inspiré une grande confiance dans la validité des équations électromagnétiques du vide et, ainsi, tout particulièrement, dans l'énoncé que la lumière se propage « dans l'espace » avec une certaine vitesse constante c. Cette loi de l'invariabilité de la vitesse de la lumière est-elle valable relativement à n'importe quel système d'inertie ? Si elle ne l'était pas, alors un système d'inertie spécifique ou, plus exactement, un état de mouvement spécifique (d'un corps de référence) se distinguerait de tous les autres. Contre cette idée se dressent cependant tous les faits expérimentaux de la mécanique et de l'électromagnétisme ou de l'optique.

Il était pour ces raisons devenu nécessaire d'élever la loi de la constance de la vitesse de la lumière pour tous les systèmes d'inertie au rang de principe. De là il suit que les coordonnées spatiales x1, x2, x3 et le temps x4 doivent se transformer conformément à la « transformation de Lorentz », qui est caractérisée par l'invariance de l'expression

ds2 = dx12 + dx22 + dx32 - dx42,

(si l'unité de temps est choisie de telle sorte que la vitesse de la lumière c = 1).

Par ce procédé le temps perdit son caractère absolu et fut adjoint aux coordonnées « spatiales » comme une grandeur ayant (presque) le même type algébrique. Le caractère absolu du temps et particulièrement celui de la simultanéité était détruit et la description quadridimensionnelle fut introduite comme la seule qui soit adéquate.

Qu'est-ce que la théorie de la relativité ? (1919) [3]

Il y a plusieurs sortes de théories en physique. La plupart d'entre elles sont constructives. Celles-ci tentent de construire une image des phénomènes complexes en partant d'un formalisme de base relativement simple. La théorie cinétique des gaz, par exemple, essaie de ramener aux mouvements des molécules les processus mécaniques, thermiques et diffusionnels, c'est-à-dire de les construire à partir de l'hypothèse du mouvement moléculaire [4]. Quand nous disons que nous avons réussi à comprendre un groupe de phénomènes naturels, nous entendons par là que nous avons trouvé une théorie constructive qui les embrasse.

Mais outre ce groupe de théories extrêmement important, il existe un autre groupe qui se compose de ce que j'appelle théories à principes. Celles-ci emploient, non pas la méthode synthétique, mais la méthode analytique. Leur point de départ et leur base ne sont pas des constituants hypothétiques, mais des propriétés générales des phénomènes naturels trouvées empiriquement, des principes, d'où l'on déduit ensuite des critères formulés mathématiquement auxquels les phénomènes individuels — ou leur représentation théorique — doivent satisfaire. La thermodynamique, par exemple, en partant du fait d'expérience que le mouvement perpétuel est impossible, essaie de déduire de ce fait, par un processus analytique, des relations auxquelles les processus individuels doivent satisfaire. L'avantage des théories constructives réside dans leur étendue, leur application facile et leur clarté, tandis que celui des théories à principes réside dans leur perfection logique et la solidité de leurs fondements.

La théorie de la relativité est une théorie à principes. Pour la comprendre, il faut avant tout saisir les principes sur lesquels elle est basée. Mais auparavant je dois faire remarquer que la théorie de la relativité ressemble à une maison à deux étages : la théorie de la relativité restreinte et la théorie de la relativité générale. La théorie de la relativité restreinte, sur laquelle repose la théorie générale, s'applique à tous les phénomènes physiques à l'exception de la gravitation. De la théorie générale dépendent la loi de gravitation et ses rapports avec les autres forces de la nature.

Depuis le temps des Grecs on sait bien que pour décrire le mouvement d'un corps on doit le rapporter à un autre corps. Le mouvement d'un véhicule est décrit par rapport au sol, celui d'une planète par rapport à l'ensemble des étoiles fixes visibles. En physique, les corps auxquels les mouvements sont rapportés dans l'espace sont appelés systèmes de coordonnées. Les lois de la mécanique de Galilée et de Newton ne peuvent être formulées qu'en employant un système de coordonnées.

L'état de mouvement du système de coordonnées ne peut être choisi arbitrairement, si l'on veut que les lois de la mécanique soient exactes (il doit être sans rotation ni accélération). Un système de coordonnées admissible en mécanique est appelé système d'inertie. L'état de mouvement d'un système d'inertie, d'après la mécanique, n'est pas déterminé de manière unique par la nature. Au contraire, on a la proposition suivante : un système de coordonnées se mouvant uniformément et en ligne droite par rapport à un système d'inertie est lui-même un système d'inertie. Ce qu'on entend par « principe de relativité restreinte » est alors la généralisation de cette proposition à n'importe quel processus naturel : toute loi générale de la nature qui est vraie relativement à un système de coordonnées K doit aussi être vraie pour n'importe quel système K', qui est en mouvement de translation uniforme par rapport à K.

Le second principe sur lequel repose la théorie de la relativité restreinte est le « principe de la constance de la vitesse de la lumière dans le vide ». La lumière a dans le vide une vitesse de propagation définie et constante (indépendante de l'état de mouvement et de la vitesse de la source). Les physiciens doivent leur confiance dans cette proposition aux succès de la théorie électrodynamique de Maxwell-Lorentz.

Les deux principes que je viens de mentionner ont reçu une solide confirmation expérimentale, mais ne paraissent pas être logiquement compatibles. La théorie de la relativité restreinte est finalement arrivée à établir entre eux un accord logique en introduisant un changement dans la cinématique, c'est-à-dire dans la doctrine des lois (physiques) qui concernent l'espace et le temps. Il devint évident que l'affirmation de la simultanéité de deux événements ne pouvait avoir de sens que par rapport à un système de coordonnées et que la forme des corps et le rythme des horloges doivent dépendre de leur état de mouvement relativement au système de coordonnées.

Mais la vieille physique, y compris les lois du mouvement de Galilée et de Newton, était en désaccord avec la cinématique relativiste. Celle-ci donna naissance à certaines conditions mathématiques générales auxquelles les lois de la nature devaient se conformer, si les deux principes fondamentaux étaient réellement valables. La physique devait être adaptée. Le changement le plus notable était une nouvelle loi du mouvement des points matériels (en mouvement rapide), loi qui fut remarquablement bien vérifiée dans le cas de particules chargées d'électricité. Le plus important résultat de la relativité restreinte concernait la masse inerte d'un système matériel. Il devint manifeste que l'inertie d'un tel système doit dépendre de l'énergie qu'il contient, de sorte que l'on fut conduit à la conception que la masse inerte n'était rien de plus que de l'énergie latente. Le principe de la conservation de la masse perdit son indépendance et se fondit avec celui de la conservation de l'énergie.

La théorie de la relativité restreinte, qui était simplement une extension systématique de l'électrodynamique de Maxwell-Lorentz, incitait à poursuivre plus loin. L'indépendance des lois physiques, relativement à un système de coordonnées, doit-elle être limitée aux systèmes de coordonnées en mouvement uniforme l'un par rapport à l'autre ? Que peut avoir à faire la nature avec les systèmes de coordonnées que nous proposons et avec leurs mouvements ? Bien qu'il puisse être nécessaire pour la description de la nature d'employer des systèmes de coordonnées que nous avons choisis arbitrairement, le choix de leur mouvement ne devrait en aucune façon être limité. Les lois devraient être complètement indépendantes de ce choix (Théorie de la relativité générale.)

On peut aisément faire comprendre l'application de cette théorie de la relativité générale à partir d'un fait d'expérience bien connu, selon lequel le poids et l'inertie d'un corps dépendent de la même constante (identité de la masse inerte et de la masse pesante). Considérons le cas d'un système de coordonnées qu'on suppose être en rotation uniforme relativement à un système d'inertie au sens newtonien. Les forces qui, relativement à ce système, sont centrifuges doivent, selon Newton, être attribuées à l'inertie. Mais ces forces centrifuges sont, comme la gravitation, proportionnelles à la masse des corps. N'est-il pas alors possible de regarder le système de coordonnées comme étant au repos et les forces centrifuges comme gravitationnelles ? L'interprétation paraît évidente, mais la mécanique classique l'interdit.

Cette brève esquisse suggère qu'une théorie de la relativité générale doit fournir les lois de la gravitation, et la poursuite de cette idée a justifié cette espérance.

Mais le chemin était plus ardu qu'on n'avait prévu, parce qu'il exigeait l'abandon de la géométrie euclidienne. En d'autres termes les lois, conformément auxquelles les corps matériels peuvent être arrangés dans l'espace, ne concordent pas exactement avec les lois prescrites par la géométrie euclidienne. C'est ce qu'on entend quand on parle de « courbure de l'espace ». Les concepts fondamentaux « droite », « plan », etc. perdent, par conséquent, leur signification exacte en physique.

Dans la théorie de la relativité générale, la doctrine de l'espace et du temps, la cinématique perd son rôle de fondement indépendant du reste de la physique. Les propriétés géométriques des corps et la marche des horloges dépendent en premier lieu des champs de gravitation, qui, à leur tour, sont produits par la matière.

Ainsi, la nouvelle théorie de la gravitation s'écarte beaucoup de celle de Newton en ce qui concerne ses principes. Mais dans l'application pratique, les deux théories s'accordent si étroitement qu'il a été difficile de trouver des cas où les différences réelles aient pu être soumises à l'observation. Jusqu'à présent on en a trouvé dans :

1. la rotation des orbites elliptiques des planètes autour du soleil : (vérifiée dans le cas de la planète Mercure).

2. la déviation des rayons lumineux sous l'effet de champs de gravitation (confirmée par les photographies d'éclipses prises par les Anglais en 1919).

3. le déplacement des raies spectrales vers l'extrémité rouge du spectre dans le cas où la lumière nous arrive d'étoiles de masse appréciable (non encore vérifié [5]).

Le grand attrait de la théorie est sa cohérence logique. Si une conséquence quelconque tirée d'elle s'avérait insoutenable, la théorie devrait être abandonnée. Il paraît impossible de lui faire subir une modification sans la détruire entièrement.

Il ne faut pas penser que la grande création de Newton puisse réellement être renversée par cette théorie-ci ou par une autre. Ses idées claires et vastes garderont toujours leur rôle essentiel de fondements sur lesquels nos conceptions de la physique ont été construites.

La théorie de la relativité (1949) [6]

Les mathématiques traitent exclusivement des relations des concepts entre eux, sans considérer leurs relations avec l'expérience. La physique aussi traite de concepts mathématiques ; ces concepts acquièrent cependant un contenu physique grâce à la détermination précise de leurs relations avec les objets de l'expérience. Ceci est particulièrement le cas des concepts de mouvement, d'espace et de temps.

La théorie de la relativité est cette théorie physique qui est basée sur une interprétation physique cohérente de ces trois concepts. Le nom de « théorie de la relativité » est lié au fait que le mouvement, du point de vue de l'expérience possible, apparaît toujours comme le mouvement relatif d'un objet par rapport à un autre (par exemple d'une voiture par rapport au sol, de la terre par rapport au soleil et aux étoiles fixes). Jamais on n'observe un « mouvement par rapport à l'espace », ou, comme on dit, « un mouvement absolu ». Le « principe de relativité » dans le sens le plus large est contenu dans cet énoncé : la totalité des phénomènes physiques est d'un caractère tel qu'elle ne donne aucune raison d'introduire le concept de « mouvement absolu » ou, pour parler plus brièvement mais moins exactement : Il n'y a pas de mouvement absolu.

Il pourrait sembler que notre connaissance a peu de profit à tirer d'un tel énoncé négatif. En réalité, il présente une forte restriction aux lois (concevables) de la nature. Dans ce sens, il existe une analogie entre la théorie de la relativité et la thermodynamique. Cette dernière est également basée sur un énoncé négatif : « Il n'y a pas de mouvement perpétuel. »

Le développement de la théorie de la relativité s'est effectué en deux étapes : « théorie de la relativité restreinte » et « théorie de la relativité générale ». Cette dernière suppose la validité de la première comme cas limite et est sa continuation logique.

A. — Théorie de la relativité restreinte

Interprétation physique de l'espace et du temps dans la mécanique classique.

La géométrie, du point de vue physique, est l'ensemble des lois selon lesquelles des corps rigides en repos relatif peuvent être placés les uns par rapport aux autres (par exemple un triangle est formé de trois baguettes dont les extrémités se touchent d'une façon permanente). Il est supposé qu'avec une telle interprétation les lois d'Euclide sont valables. « L'espace », dans cette interprétation, est en principe un corps rigide infini (ou charpente) auquel la position de tous les autres corps est rapportée (corps de référence). La géométrie analytique (cartésienne) emploie comme corps de référence représentant l'espace trois baguettes rigides perpendiculaires les unes aux autres, sur lesquelles les « coordonnées » (x, y, z) des points de l'espace sont mesurées, de la façon bien connue, comme des projections perpendiculaires (à l'aide d'une unité de mesure rigide).

La physique traite « d'événements » dans l'espace et le temps. À chaque événement appartient, outre ses coordonnées d'espace x, y, z, une valeur temporelle t. Cette dernière était considérée comme mesurable par une horloge (processus périodique idéal) d'une dimension spatiale négligeable. Cette horloge H doit être considérée comme étant au repos en un point du système de coordonnées, par exemple à l'origine des coordonnées (z = y = z = 0). L'instant auquel un événement à lieu au point P (x, y, z) est alors défini comme étant le temps indiqué par l'horloge H simultanément avec l'événement. Ici, le concept « simultané » était supposé avoir un sens physique, sans être spécialement défini. C'est là un manque d'exactitude qui paraît bénin seulement parce que, à l'aide de la lumière (dont la vitesse est pratiquement infinie quand on la compare aux vitesses courantes), la simultanéité d'événements distants dans l'espace peut apparemment être déterminée immédiatement.

La théorie de la relativité restreinte fait disparaître ce manque de précision en définissant la simultanéité physiquement au moyen de signaux lumineux. L'instant t de l'événement en P est l'indication de l'horloge H au moment de l'arrivée d'un signal lumineux parti de l'événement, corrigé relativement au temps dont a besoin le signal lumineux pour parcourir la distance. La correction suppose (postule) que la vitesse de la lumière est constante.

Cette définition réduit le concept de simultanéité d'événements distants dans l'espace à celui de simultanéité d'événements se produisant au même lieu (coïncidence), c'est-à-dire l'arrivée du signal lumineux en H et la lecture de H.

La mécanique classique est fondée sur le principe de Galilée : Un corps est en mouvement rectiligne et uniforme tant que d'autres corps n'agissent pas sur lui. Cet énoncé ne peut pas être valable pour des systèmes de coordonnées se mouvant arbitrairement. Sa validité ne s'étend qu'à ce qu'on appelle « systèmes d'inertie ». Les systèmes d'inertie sont en un mouvement rectiligne et uniforme les uns par rapport aux autres. Dans la physique classique, les lois sont valables seulement par rapport à l'ensemble des systèmes d'inertie (principe de relativité restreinte).

On peut maintenant facilement comprendre le dilemme qui a conduit à la théorie de la relativité restreinte. L'expérience et la théorie ont graduellement conduit à la conviction que la lumière se propage toujours dans le vide avec la même vitesse c, indépendamment de sa couleur et de l'état de mouvement de la source lumineuse (principe de constance de la vitesse de la lumière, que nous appellerons dans ce qui suit « principe-L »). Maintenant, des considérations intuitives élémentaires semblent montrer que le même rayon lumineux ne peut pas se mouvoir relativement à tous les systèmes d'inertie avec la même vitesse c. Le principe-L paraît contredire le principe de relativité restreinte.

Il se trouve cependant que cette contradiction n'est qu'apparente, elle repose essentiellement sur le préjugé du caractère absolu du temps, ou plutôt de la simultanéité d'événements distants. Nous venons de voir que x, y, z, et t d'un événement peuvent, pour le moment, être définis seulement par rapport à un certain système de coordonnées choisi (système d'inertie). La transformation des x, y, z, t d'événements, qui doit être effectuée quand on passe d'un système d'inertie à un autre (transformation de coordonnées), est un problème qui ne peut pas être résolu sans certaines hypothèses physiques. Toutefois, le postulat suivant est précisément suffisant pour une solution : Le principe-L demeure vrai pour tous les systèmes d'inertie (application du principe de relativité restreinte au principe-L). Les transformations ainsi définies, qui sont linéaires en x, y, z, t, sont appelées transformations de Lorentz. Les transformations de Lorentz sont, au point de vue formel, caractérisées par l'exigence que l'expression

dx2 + dy2 + dz2 - c2dt2,

qui est formée à partir des différentielles des coordonnées dx, dy, dz, dt de deux événements infiniment proches, soit invariante (c'est-à-dire qu'au cours de la transformation elle se transforme en la même expression formée avec les différentielles des coordonnées dans le nouveau système).

À l'aide des transformations de Lorentz, le principe de relativité restreinte peut être exprimé ainsi : Les lois de la nature sont invariantes par rapport aux transformations de Lorentz (c'est-à-dire, une loi de la nature ne change pas sa forme, si l'on y introduit un nouveau système d'inertie à l'aide d'une transformation de Lorentz sur x, y, z, t).

La théorie de la relativité restreinte a conduit à une claire intelligence des concepts d'espace et de temps et, par suite, à faire connaître le comportement des règles et des horloges en mouvement. Elle a en principe éliminé le concept de simultanéité absolue et, par là, celui d'action instantanée à distance dans le sens de Newton. Elle a montré comment la loi du mouvement doit être modifiée quand il s'agit de mouvements qui ne sont pas d'une petitesse négligeable comparés à la vitesse de la lumière. Elle a conduit à une clarification formelle des équations de Maxwell du champ électromagnétique ; elle a, en particulier, conduit à une intelligence de l'unité essentielle du champ électrique et du champ magnétique. Elle a réuni en une seule loi les lois de la conservation de la quantité de mouvement et de l'énergie et démontré l'équivalence de la masse et de l'énergie. Du point de vue formel, on peut caractériser ainsi l'oeuvre accomplie par la théorie de la relativité restreinte : elle a montré quel rôle joue la constante universelle c (vitesse de la lumière) dans les lois de la nature et démontré qu'il y a une connexion étroite entre la forme sous laquelle le temps, d'une part, et les coordonnées d'espace, d'autre part, entrent dans les lois de la nature.

B. — Théorie de la relativité générale

La théorie de la relativité restreinte conservait la base de la mécanique classique sur un point fondamental, c'est-à-dire l'énoncé : Les lois de la nature sont valables seulement par rapport aux systèmes d'inertie. Les transformations « permises » pour les coordonnées (c'est-à-dire celles qui laissent la forme des lois inchangée) sont exclusivement les transformations (linéaires) de Lorentz. Cette restriction est-elle réellement basée sur des faits physiques ? L'argument suivant montre d'une façon convaincante que ce n'est pas le cas.

Principe d'équivalence. Un corps a une masse inerte (résistance à l'accélération) et une masse pesante (qui détermine le poids d'un corps dans un champ gravifique donné, par exemple celui à la surface de la Terre). Ces deux quantités si différentes d'après leurs définitions sont, d'après l'expérience, caractérisées par un seul et même nombre. Il doit y avoir une raison plus profonde pour cela. Le fait peut aussi être décrit de la manière suivante : Dans un champ de gravitation, des masses différentes subissent la même accélération. Finalement, on peut aussi l'exprimer ainsi : Des corps dans un champ de gravitation se comportent comme en l'absence d'un champ de gravitation si, dans le dernier cas, le système de référence employé est un système de coordonnées uniformément accéléré (au lieu d'un système d'inertie).

Il ne paraît pas, par conséquent, y avoir de raison d'interdire l'interprétation suivante du dernier cas. On considère le système comme étant « au repos » et le champ de gravitation « apparent » qui existe par rapport à lui comme « réel ». Ce champ de gravitation « engendré » par l'accélération du système de coordonnées serait naturellement d'une étendue illimitée, de telle sorte qu'il ne pourrait être produit par des masses graves dans une région finie ; cependant, si nous cherchons une théorie du champ, ce fait ne doit pas nous décourager. Par cette interprétation, le système d'inertie perd sa signification et l'on a une « explication » de l'égalité de la masse pesante et de la masse inerte (la même propriété de la matière apparaît comme poids ou comme inertie, selon le mode de description).

Envisagée au point de vue formel, l'admission d'un système de coordonnées, qui est accéléré par rapport aux coordonnées « d'inertie » originelles, signifie l'admission de transformations de coordonnées non linéaires, d'où une puissante extension de l'idée d'invariance, c'est-à-dire du principe de relativité.

Tout d'abord, une discussion approfondie, qui se sert des résultats de la théorie de la relativité restreinte, montre qu'avec une telle généralisation les coordonnées ne peuvent plus être interprétées directement comme des résultats de mesure. Seules les différences de coordonnées, ainsi que les grandeurs de champ qui décrivent le champ de gravitation, déterminent les distances mesurables entre les événements. Quand on s'est vu forcé d'admettre des transformations de coordonnées non linéaires comme transformations entre systèmes de coordonnées équivalents, il paraît très simple d'admettre toutes les transformations continues de coordonnées (qui forment un groupe), c'est-à-dire d'admettre des systèmes de coordonnées curvilignes arbitraires dans lesquels les champs sont décrits par des fonctions régulières (principe de relativité générale).

Il n'est pas difficile maintenant de comprendre pourquoi le principe de relativité générale (se basant sur le principe d'équivalence) a conduit à une théorie de la gravitation. Il existe un genre spécial d'espace, dont nous pouvons supposer la structure physique (champ) comme connue précisément sur la base de la théorie de la relativité restreinte. C'est l'espace vide sans champ électromagnétique et sans matière. Il est entièrement déterminé par sa propriété « métrique ». Soit dx0 , dy0 , dz0 , dt0 , les différences de coordonnées de deux points infiniment proches (événements), alors

(1)          ds2 = dx02 + dy02 + dz02 - c2dt02

est une quantité mesurable, qui est indépendante du choix spécial du système d'inertie. Si l'on introduit dans cet espace les nouvelles coordonnées x1, x2, x3, x4 par une transformation générale de coordonnées, alors la quantité ds2 pour les mêmes deux points a une expression de la forme

(2)          ds2 = gik dxidxk (sommé par rapport à i et k de 1 à 4),

gik = gki . Les gik qui forment un « tenseur symétrique » et sont des fonctions continues de x1 ... x4 décrivent alors, conformément au « principe d'équivalence », un champ de gravitation d'un genre spécial (c'est-à-dire un champ qui peut de nouveau être ramené à la forme (1)). Les recherches de Riemann sur les espaces métriques permettent d'indiquer exactement les propriétés mathématiques de ce champ gik condition de Riemann »). Cependant, ce que nous cherchons ce sont les équations qui sont satisfaites par des champs de gravitation « généraux ». Il est naturel de supposer qu'eux aussi peuvent être décrits comme des champs tensoriels du type gik, qui n'admettent pas généralement une transformation en la forme (1), c'est-à-dire qui ne satisfont pas à la « condition de Riemann », mais à des conditions plus faibles, lesquelles, exactement comme la condition de Riemann, sont indépendantes du choix des coordonnés (c'est-à-dire, elles sont généralement invariantes). Un raisonnement formel simple conduit à des conditions plus faibles, qui sont étroitement liées à la condition de Riemann. Ces conditions sont les véritables équations du champ de gravitation pur (en dehors de la matière et en l'absence de champ électromagnétique).

Ces équations font apparaître les lois de la gravitation de Newton comme une loi approchée et expliquent en outre certains petits effets qui ont été confirmés par l'observation (déviation de la lumière par le champ de gravitation d'une étoile, influence du potentiel gravifique sur la fréquence de la lumière émise, lente rotation des trajectoires elliptiques des planètes — mouvement du périhélie de Mercure). Elles fournissent de plus une explication de l'expansion des systèmes galactiques, qui se manifeste par un déplacement vers le rouge de la lumière émise par ces systèmes.

La théorie de la relativité générale est encore incomplète en ce sens qu'il n'a été possible de l'appliquer d'une manière satisfaisante qu'aux champs de gravitation, mais non pas au champ total. Nous ne savons pas encore avec certitude par quel mécanisme mathématique le champ total dans l'espace doit être décrit, et quelles sont les lois générales invariantes auxquelles ce champ total obéit. Une chose cependant paraît certaine : le principe de relativité générale sera un instrument nécessaire et efficace pour la solution du problème du champ total.

E=mc2 (1946) [7]

Pour comprendre la loi de l'équivalence de la masse et de l'énergie, nous devons rappeler les deux principes de conservation ou de « bilan » qui ont occupé, chacun à part, un rang élevé dans la physique prérelativiste. Ces deux principes étaient le principe de la conservation de l'énergie et celui de la conservation de la masse. Le premier, énoncé par Leibniz au XVIIe siècle, a été développé au XIXe siècle essentiellement comme un corollaire à un principe de mécanique.


(Dessin reproduit d'après le manuscrit de A. Einstein.)

Considérons, par exemple, un pendule dont la masse oscille entre les points A et B. En ces points la masse m est surélevée de la hauteur h au-dessus de C, qui est le point le plus bas du chemin. En C, au contraire, la surélévation est zéro et la masse est maintenant animée d'une vitesse v. C'est comme si la hauteur pouvait être entièrement convertie en vitesse, et inversement. La relation exacte est exprimée par

g représente l'accélération de la pesanteur. Ce qui est ici intéressant, c'est que cette relation est indépendante de la longueur du pendule et de la forme du chemin que la masse parcourt.

Cela signifie qu'il y a quelque chose qui reste constant dans tout le processus, et ce quelque chose est de l'énergie. En A et en B c'est de l'énergie de position ou de l'énergie « potentielle », en C c'est de l'énergie de mouvement ou de l'énergie « cinétique ». Si ce concept est correct, la somme

doit avoir la même valeur pour n'importe quelle position du pendule, s'il est entendu que h représente la hauteur au-dessus de C et v la vitesse en ce point du chemin que parcourt le pendule. Tel est réellement le cas. La généralisation de ce principe nous donne la loi de la conservation de l'énergie mécanique. Mais qu'arrive-t-il quand le pendule est arrêté par le frottement ?

La réponse à cette question est fournie par l'étude des phénomènes calorifiques. Cette étude, basée sur la supposition que la chaleur est une substance indestructible qui s'écoule du chaud vers le froid, semblait nous donner un principe de la « conservation de la chaleur ». D'autre part, depuis des temps immémoriaux, on savait que la chaleur peut être produite par le frottement, comme les Indiens font du feu en se servant de forets. Les physiciens furent pendant longtemps incapables d'expliquer ce type de production de chaleur. Ils triomphèrent de ces difficultés seulement quand il fut établi que pour produire une certaine quantité de chaleur par frottement, il fallait dépenser une quantité rigoureusement proportionnelle d'énergie. C'est de cette façon que fut obtenu le principe de « l'équivalence du travail et de la chaleur ». Dans le cas de notre pendule, par exemple, de l'énergie mécanique est graduellement convertie par le frottement en chaleur.

De cette façon, les principes de la conservation de l'énergie mécanique et de l'énergie thermique furent fondus en un seul principe. Là-dessus, les physiciens étaient persuadés que le principe de conservation pouvait être étendu de façon à englober les processus chimiques et électromagnétiques — bref, il pouvait être appliqué à tous les domaines. Il devint manifeste que dans notre système physique la somme totale des énergies reste constante à travers tous les changements qui puissent se produire.

Examinons maintenant le principe de la conservation de la masse. La masse est définie par la résistance qu'un corps oppose à son accélération (masse inerte). Elle est aussi définie par le poids du corps (masse pesante). Que ces deux définitions radicalement différentes conduisent à la même valeur de la masse d'un corps, est en soi un fait étonnant. Conformément au principe que les masses restent quantitativement invariables dans tous les changements physiques ou chimiques, la masse paraissait être la propriété essentielle de la matière (parce qu'elle était invariable). Ni l'échauffement, ni la fusion, ni la vaporisation, ni la combinaison en composés chimiques ne pourraient changer la masse totale.

Les physiciens ont accepté ce principe jusqu'à il y a quelques décades. Mais il se montra inadéquat en présence de la théorie de la relativité restreinte. C'est pourquoi il fut fondu dans le principe de l'énergie, exactement comme, il y a soixante ans, le principe de la conservation de l'énergie mécanique a été combiné avec celui de la conservation de la chaleur. On peut dire que le principe de la conservation de l'énergie, après avoir absorbé celui de la conservation de la chaleur, a fini par absorber celui de la conservation de la masse et occupe seul le terrain.

Il est d'usage d'exprimer l'équivalence de la masse et de l'énergie (bien que d'une façon quelque peu inexacte) par la formule E=mc2c représente la vitesse de la lumière, environ 300 000 km par seconde. E est l'énergie contenue dans un corps au repos, m est sa masse. L'énergie qui appartient à la masse m est égale à cette masse, multipliée par le carré de l'énorme vitesse de la lumière, ce qui veut dire, une somme énorme d'énergie pour chaque unité de masse.

Mais si chaque gramme de matière contient cette énergie prodigieuse, comment se fait-il qu'elle n'ait pas été remarquée pendant si longtemps ? La réponse est toute simple : tant que l'énergie n'est pas émise extérieurement, elle ne peut pas être observée. C'est comme un homme fabuleusement riche qui ne dépense ni ne donne jamais rien ; personne ne pourrait savoir combien il est riche.

Maintenant, nous pouvons renverser la relation et dire qu'un accroissement de E dans la quantité d'énergie doit être accompagné d'un accroissement de

dans la masse. Je puis facilement fournir de l'énergie à la masse, par exemple en la chauffant de 10 degrés. Pourquoi alors ne pas mesurer l'accroissement de la masse ou l'accroissement du poids en rapport avec ce changement ? L'ennuyeux ici est que dans l'accroissement de la masse le facteur énorme c2 figure comme dénominateur de la fraction. Dans un tel cas, l'accroissement est trop petit pour pouvoir être mesuré directement, même en employant la balance la plus sensible.

Pour que l'accroissement d'une masse soit mesurable, il faut que le changement d'énergie par unité de masse soit énormément grand. Nous ne connaissons qu'un domaine où de telles quantités d'énergie par unité de masse soient libérées, c'est la désintégration radioactive. Schématiquement, le processus se déroule de la façon suivante : Un atome de masse M se divise en deux atomes de masse M' et M", qui se séparent avec une énergie cinétique énorme. Si nous imaginons ces deux masses immobilisées, c'est-à-dire si nous leur enlevons cette énergie de mouvement, alors elles seront, prises ensemble, essentiellement plus pauvres en énergie que l'atome originel. Conformément au principe d'équivalence, la somme des masses M' + M", produite par la désintégration, doit aussi être un peu plus petite que la masse originelle M de l'atome, ce qui contredit le vieux principe de la conservation de la masse. La différence relative des deux valeurs est de l'ordre de 1/10 pour cent.

Or, nous ne pouvons pas en réalité peser les atomes individuellement. Il existe cependant des méthodes indirectes pour déterminer leurs poids avec exactitude. Nous pouvons également déterminer les énergies cinétiques qui sont transmises aux produits de la désintégration M' et M". Il est ainsi devenu possible d'éprouver et de confirmer la formule d'équivalence. La loi nous permet aussi de calculer d'avance, d'après les poids atomiques déterminés avec précision, combien d'énergie sera libérée par la désintégration atomique à laquelle nous pensons. La loi ne nous dit naturellement pas si, ou comment, la réaction de désintégration peut être provoquée.

Ce qui se passe peut être illustré par l'exemple de notre richard. L'atome est le riche avare qui, pendant sa vie, ne dépense point d'argent (énergie). Mais dans son testament il lègue sa fortune à ses deux fils M' et M", sous la condition qu'ils donnent une petite somme à la communauté, moins d'un millième de toute sa fortune (énergie ou masse). La fortune des deux fils est un peu moindre que celle qu'avait possédée le père (la somme des masses M' + M" est un peu plus petite que la masse M de l'atome radioactif). Mais la part donnée à la communauté, bien que relativement petite, est encore tellement énorme (considérée comme énergie cinétique) qu'elle porte en elle une grande menace de malheur. Détourner cette menace est devenu le problème le plus urgent de notre temps.

[1] Nicolas Gessner, Tous sur orbite, Éditions Montparnasse © 1996,
Fantôme Animation - France3 - Télé Images - I.T.I, semaine # 22.

[On sait que la lumière se propage à une certaine vitesse depuis que l'astronome danois Ole Christensen Rømer observa au XVIIe siècle que, pendant les éclipses d'Io (une des lunes de Jupiter) le moment de l'occultation prévu retardait ou prenait de l'avance selon que Jupiter se trouvait plus ou moins rapproché de la terre (dans son cycle de rotation autour du soleil). Aujourd'hui, la précision de la vitesse de la lumière (299 792 458 m/s) est exacte par définition puisque, depuis 1983, le mètre est défini à partir de la vitesse de la lumière dans le système international d'unités (SI). Un mètre, c'est la distance parcourue par la lumière dans le vide pendant 1/299 792 458 de seconde. Ceci fait que la vitesse fixée pour la lumière est maintenant définie par la seconde.]

[2] Albert Einstein, Conceptions scientifiques, Flammarion © 1990, Champs-Flammarion # 214, pp. 48-50.

[3] Ibid. pp. 12-18.

[4] Cela a été vérifié depuis. (Note de l'éditeur.)

[5] Ce phénomène a également été vérifié depuis. (Note de l'éditeur.)

[6] Ibid. pp. 114-125.

[7] Ibid. pp. 102-108.

Philo5
                À quelle source choisissez-vous d'alimenter votre esprit ?