La théorie de la relativité restreinte étudie les référentiels en translation uniforme, appelés référentiels inertiels. Elle propose un changement de référentiel inertiel portant sur les 4 coorodonnées `t,x,y,z` de temps et d'espace, et qui constituent une application affine de `RR^4` satisfaisant le principe selon lequel la vitesse de la lumière à la même valeur en norme dans chaque référentiel inertiel et ne peut être dépassée. Elle démontre l'unicité de cette application affine dont le seul paramètre est le vecteur vitesse de translation du référentiel, et elle calcule son expression précisement.
La théorie s'expriment de manière élégante dans un formalisme quadridimensionnel. Nous décrivons ce formalisme qui s'applique aussi bien à la relativité galiléenne qu'à la relativité restreinte. Et nous l'étudions dans le cas d'un univers d'espace unidimensionnel. Puis nous explorons les paradoxes qui apparaissent lorsque cet univers est refermé sur lui-même.
On identifie l'espace-temps à l'espace euclidien à 4 dimensions, `RR^4`, que l'on muni du référentiel fixe canonique `Omega` appelé le référentiel du laboratoire. Ce référentiel comprend le vecteur nul `(0","0","0","0)` désigant le point origine du référentiel, et 4 vecteurs ; le vecteur `(1","0","0","0)` désignant l'axe du temps, et les 3 vecteurs `(0","1","0","0), (0","0","1","0), (0","0","0","1)` désignant l'espace. Le vecteur axe du temps est implicitement multiplié par l'unité de vitesse du système d'unité choisie afin de rendre homogène en une distance les 4 coordonnées et de définir ainsi la norme quadridimensionnelle `t^2"+"x^2"+"y^2"+"z^2`, mais cette norme dépend du choix arbitraire de deux étalons indépendants que sont l'étalon de temps et l'étalon de distance, et n'aura de réelle pertinence que dans le cas relativiste où l'unité de vitesse choisie correspondra à la vitesse de la lumière dans le vide, une constante fondamentale, qui n'atteint le statut de constante fondamentale que dans le cas relativiste.
On définie un référentiel fixe orthonormé par un quintuplet comprenant un vecteur origine désignant le point origine du référentiel dans `RR^4` c'est à dire relativement à `Omega`, et 4 vecteurs orthonormés, commençant par un vecteur axe du temps qui est soit `(1","0","0","0)` ou `(-1","0","0","0)`, et 3 autres vecteurs désignant l'espace. Le référentiel fixe orthonormé, que nous nommons `A`, détermine un système de coordonnées cartésiennes de l'espace-temps, avec une coordonnée de temps `t` et trois coordonnées d'espaces `x,y,z`. Tout point de l'espace-temps est défini par ses coordonnées dans `A`, et qui constitue un vecteur à 4 composantes appelé quadrivecteur position dans `A` où simplement position dans `A`. Notez la distinction entre une position absolue de l'espace-temps et une position relative dans un référentiel fixe orthonormé, la position absolue est simplement celle relative au référentiel `Omega`. Puis on explorera d'autres type de référentiel.
Conventionnellement on désigne un quadrivecteur position par une majuscule `X` et en vecteur colonne, bien que dans le texte on le citera en vecteur ligne `X= [t,x,y,z]` :
`X= [(t),(x),(y),(z)]`
La position `X` est relative à un référentiel (qui est par défaut `Omega`) et désigne un point de l'espace-temps, c'est à dire la position d'un événement ponctuel instantané. L'évènement est caractérisé par la date de sa manifestation ou coordonnée temporelle `t` exprimée relativement au référentiel, et par le lieu de sa manifestation ou coordonnées spatiales `x, y, z` exprimées relativement au référentiel. On met la coordonnée temporelle en premier car elle est jugée la plus impotante et la plus globale.
Si la position `X=[t,x,y,z]` désigne la position d'une particule, alors la variable `t` devient un paramètre libre représentant le temps dans le référentiel, et les variables `x,y,z` dépendent de `t` et forme une courbe qui constitue la trajectoire de la particule dans le référentiel. Cette dépendance se note par les neurones suivants :
`x"←"(t)`
`y"←"(t)`
`z"←"(t)`
Ou simplement par le neurone suivant et l'égalité suivante :
`X"←"(t)`
`X= [(t),(x),(y),(z)]`
Ces déclarations permettent de définir les coordonnées de la particule dans le référentiel comme des fonctions du temps dans le référentiel, dont les entêtes d'appel se notent comme suit :
`x"(.)"`
`y"(.)"`
`z"(.)"`
`X"(.)"`
Le neurone `X"←"(t)` précise également l'argument d'appel par défaut, qui est ici `t`, faisant que :
`x=x(t)`
`y=y(t)`
`z=z(t)`
`X=[(t),(x),(y),(z)]=X(t) = [(t),(x(t)),(y(t)),(z(t))]`
On pose par principe qu'il existe une évolution du système selon un paramètre causal réel inconnu non encore défini. Cela permet de définir les différentiels exactes `dx, dy, dz, dt`, qui désignent les variations infinitésimales de `x,y,z,t` qui se produisent lorsque le paramètre réel inconnue non encore défini, évoqué comme cause de l'évolution du système, subit une variation infinitésimale `epsilon`. Notez que cet `epsilon` représente un infiniment petit du premier ordre qui est arbitrairement choisi. Et que ce choix a pour conséquence que toutes les différentielles de variable réel sont de l'ordre d'`epsilon`. Le choix d'`epsilon` étant libre, on peut le considérer comme une fonction de `t` arbitraire. les différentiels exactes `dx, dy, dz, dt` sont alors des fonctions de se paramètre causal inconnu.
L'opérateur de différentiel exacte `d` s'applique au vecteur et quadrivecteur par définition comme suit :
`dX = d[(t),(x),(y),(z)] = [(dt),(dx),(dy),(dz)]`
Et nous avons donc :
x(t+dt) = x(t)+dx
y(t+dt) = y(t)+dy
z(t+dt) = z(t)+dzX(t+dt) = X(t)+dX
En utilisant la valeur par défaut définie par les neurones `x"←"(t), y"←"(t), z"←"(t), X"←"(t)`, ces équations se réécrivent plus simplement :
x(t+dt) = x+dx
y(t+dt) = y+dy
z(t+dt) = z+dzX(t+dt) = X+dX
Un ensemble de variables forment un sous-système s'il possède une variable causale, dont sont fonctions toutes les autres variables du sous-système. Délors, la variable évoquée comme cause de l'évolution du sous-système est dite libre dans ce sous-système. Elle peut être choisie librement, ainsi que sa différentielle. Par exemple le sous-système `{t,x,y,z}` dépend de `t`. Dans ce sous-système la variable causale `t` est libre. Cela signifie que l'on peut choisire `t` arbitrairement. Et concernant le neurone `dt"←"(t)`, cela signifie que l'on peut choisire une fonction `dt"(.)"` comme l'on veut, ou autrement dit, que `dt` est libre également. Le choix de la fonction `dt"←"(t)` n'altère pas l'évolution du système, elle ne fait que choisir un procédé de calcul eulerien pour résoudre de façon approché le système d'équation différentiel.
Le fait que `x` soit une fonction de `t`, et que `dt` soit aussi une fonction de `t`, entraine que `dx` est également une fonction de `t`. De même pour les autres composantes. Ainsi à chaque instant `t` il existe des valeurs `x,y,z,t` et des vartiations infinitésimales `dx,dy,dz,dt` qui ont cours. Autrement dit, les neurones `x"←"(t)` et `dx"←"(t)`, entraine l'existance des neurones `X"←"(t)` et `dX"←"(t)`
L'opérateur de dérivée exacte `d/(dt)` peut s'appliquer à toute variables qui est une fonction de `t`. Et nous avons :
`d/(dt) x = (dx)/(dt)`
Et si nous explicitons l'instant `t`, l'égalité se complète comme suit :
`d/(dt) x(t) = (dx(t))/(dt(t))`
Notez que l'opérateur de dérivée exacte n'utilise pas la définition de `dt` comme une fonction de `t`. C'est pourquoi il est noté `d"/"dt` sans faire référence à l'instant `t`.
Les différentiels de fonction analytique sont linéaure. A chaque instant `t`, les éléments `dx, dy, dz` sont dépendants linéairement de `dt`, une dépendance néanmoins restreinte à l'ensemble des infinitésimaux. Cette nouvelle dépendance à `dt` ne peut pas être notée fonctionnellement de la même façon sans quoi elle serait confondu avec la première dépendance à `t`. D'autre part cette nouvelle dépendance est linéaire lorsqu'elle s'applique à d'autres éléments différentiels. C'est une propriété des différentielles qui explique pourquoi l'étude des différentielles se fait en même temps que l'étude des fonctions linéaires. Et donc, conventionellement, on ne la note pas sous forme d'appel directe. On l'évoque simplement en écrivant le produit avec le facteur linéaire en question. Par exemple, `dx(t)` désigne la variation infinitésimale de `x` se produisant à l'instant `t`. Mais cette variation `dx(t)` est également fonction de `dt(t)` qui est la variation infinitésimale de `t` se produisant à l'instant `t`, une fonction arbitrairement choisie. On pourrait noter cette dépendance fonctionnelle sous forme d'appel directe avec un autre type de parenthèse `dx(t)(:".":)`, qui appliqué par exemple à `du` produit le produit en question. La linéarité s'ajuste au fait que lorsque `du=dt(t)` nous avons `dx(t)(: du :)=dx(t)`. Ainsi nous avons :
`dx(t)(: du :) = dx(t) (du)/(dt(t))`
`= (dx(t))/(dt(t)) du`
`= (d/dt dx(t)) du`
En utilisant la valeur par défaut définie par les neurones `x"←"(t), dx"←"(t), dt"←"(t)`, cette équation se réécrit plus simplement :
`dx(: du :) = (dx)/(dt) du`
Étant donné un système de variables dépendant d'une variable causale réel `t`, celle-ci définit `dt` arbitrairement. L'élément `dt` est indépendant de `t`, il peut être définie arbitrairement comme une fonction de `t` produisant des infinitésimaux, sans que cela ne modifie l'évolution des variables réels.
Mais ce n'est pas cette formule que l'on retiendra car celle-ci ne fait qu'affirmer la nature linéaire des différentiels de fonction analytique. C'est deux premiers termes de la série de Taylor que l'on retiendra, et qui produit cette équation portant sur deux ordres de grandeurs :
`x(t"+"du) = x(t) + dx(t)(: du :)`
`x(t"+"du) = x(t) + (dx(t))/(dt(t))du`
Et en utilisant les argument par défaut définie par les neurones `x"←"(t), dx"←"(t),dt"←"(t)`, cette équation se réécrit plus simplement :
`x(t"+"du) = x + (dx)/(dt) du`
C'est la formule de Taylor, le développement de `x` en fonction de ses dérivées, et que l'on arrête au premier ordre infinitésimal.
Le quadrivecteur position d'une particule est une fonction de `t` et désigne la trajectoire de la particule. Cela se résume par le neurone et l'égalité suivante :
`X"←"(t)`
`X=[(t),(x),(y),(z)]`
On garde les notations habituelles, pour désigner les coordonnées spatiales sous forme vectorielle `vec x` d'une particule et sa vitesse `vec v` :
`vec x = [(x),(y),(z)]` `dvec x = [(dx),(dy),(dz)]`
`vec v = [(dx"/"dt),(dy"/"dt),(dz"/"dt)]`
`vec v = (d vec x) / dt`
Et nous avons naturellement `vecx"←"(t), vecv"←"(t)`. De telle sorte qu'un quadrivecteur position peut se noter comme suit :
`X = [(t),(vecx)] = X(t) = [(t),(vecx(t))]`
Remarquez que la vitesse de la particule exprimée dans le référentiel est définie cinématiquement par l'élément différentiel de déplacement `d vec x` exprimé dans le référentiel, divisé par l'élément différentiel de temps `dt` exprimé dans le référentiel.
Puisque les forces sont supposée être des fonctions analytiques des positions des particules, les trajectoires des particules sont aussi des fonctions analytiques, c'est à dire indéfiniement dérivable et de série de Taylor partout convergente. Par soucis de simplicité, on élimine les infinis en posant des lois analytiques partout définie. Cela peut se faire par exemple en complétant la loi d'attraction de coulomb par une loi arbitraire relatant une distibution continue des charges d'une particule dans l'espace.
Un référentiel correspond à un observateur qui veut prendre des mesures dans son référentiel à lui.
Une particule constitue un observateur, au sens où les forces qui s'exercent sur elle sont ce qu'elle perçoit. Il est donc tout-à-fait logique de commencer à concevoir un référentiel comme une particule, ou tout au moins de le munir d'un quadrivecteur position qui désignera sa trajectoire dans un référentiel parent. Et on commencera par les trajectoires les plus simples, par des référentiels fixes obtenus par déplacement à une position fixe. Puis d'autres paramètres s'ajouteront à ce quadrivecteur position fixe pour définir complètement un référentiel fixe.
Grosso-modo, les lois physiques devaient être les mêmes dans tout référentiel, où l'on entendait par référentiel, un cadre dans le quel nous, observateurs, pouvions nous placer. C'est un vague principe de relativité, qui était déjà présent dans les esprits avec la relativité galiléenne, et qui participait d'un mouvement générale de pensée évoluant de l'absolu vers la relativité. Cela se traduisait par l'affirmation qu'il n'y a pas de centre de l'univers ni de direction privilégié, l'intuition d'une sorte d'homogénéité et d'isotropie de l'espace et même du temps. Où que nous soyons dans le monde, nous devrions retrouver les mêmes lois physiques, et être incapable de déterminer où nous somme en analysant seulement localement ces lois physiques. Puis viendra avec Newton la notion d'inertie et de vitesse, qui étendra la question aux vitesses, en affirmant qu'il est impossible de déterminer sa propre vitesse en analysant seulement localement les lois physiques.
Tout quadrivecteur est nécessairement définie relativement à un référentiel. Nous faisons le choix de réserver le terme de "position", pour désigner un quadrivecteur position dans un référentiel. Ainsi "position" devient synonyme de "coordonnées". De même, tout référentiel est nécessairement définie relativement à un référentiel parent qui peut être le référentiel `Omega`. Et tout peut se ramèner au premier choix absolu arbitraire qui est le choix du référentiel du laboratoire, `Omega`.
Apparaît alors une opération fondamentale qu'est la transformation de référentiel, et qui correspond à une opération inverse tout aussi fondamentale qui est le changement de référentiel. La transformation de référentiel a pour but, à partir d'un référentiel `A` de construire un nouveau référentiel `B`. Et le changement de référentiel qui correspond à la fonction inverse, à pour but, à partir d'un quadrivecteur `X"="[t,x,y,z]` désignant la position d'un évènement dans le référentiel `A`, de calculer ses nouvelles coordonnées formant le quadrivecteur `X’"="[t’,x’,y’,z’]` dans le nouveau référentiel `B`, de la position du même évènement ponctuel instantané.
Et on commence à étudier les changements de référentiel simples correspondant à des applications affines dans `RR^4`.
Etant donné deux référentiels `A, B`. La position de `B` dans `A` est définie comme étant la position de l'origine spaciale de `B` dans `A`, et qui évolue en fonction du temps propre du référentiel `A`.
Le temps propre d'un référentiel correspond au temps indiqué par une horloge placé à l'origine spaciale du référentiel et se déplaçant avec le référentiel, et qui est mise à zéro à l'instant zéro du référentiel. Le point zéro ou point d'origine du référentiel est son origine spatiale à l'instant propre zéro. C'est un évènement ponctuelle instantané.
Le temps relatif au référentiel est le temps propre du référentiel, c'est à dire celui indiqué par une horloge fixé au référentiel et initialisée à l'instant zéro du référentiel, dit de création du référentiel. C'est donc aussi l'age du référentiel.
On recherche la meilleur notation possible. Et c'est un point majeur, car la notation porte l'intuition, c'est à dire une partie des connaissances implicites, et elle nous permet d'agir en accordant sa sympathie à notre psychologie. Tout d'abord, pour combiner des applications, on utilisera la notation française de composition d'application et d'application d'application qui s'écrit dans l'ordre inverse de la notation anglaise et qui utilise l'absence de symbole. La notation française remet dans l'ordre de gauche à droite les transformations successives, faisant que par exemple :
`(a"↦"b)(b"↦"c)"="(a"↦"c)`
`a(a"↦"b)(b"↦"c)"="c`
Puis dans les cas où il est nécessaire de distinguer la composition d'applications, de l'application sur un élément, on utilise l'exposant pour exprimer cette dernière :
Notation française Notation anglaise `x^f` `f(x)` `fgh` `h"∘"g"∘"f` `x^(fgh) = ((x^f)^g)^h` `(h"∘"g"∘"f)(x) = h(g(f(x)))`
Puis il s'avèrera inutile de distinguer la composition d'application, de l'application sur un élément. On utilisera le même symbole de composition, à savoir l'absence de symbole, la distinction se faisant alors selon le type des arguments. Ainsi, si `x` est un élément, l'expression `xfg` désignera `(x^f)^g` ou `x^(fg)`, ou en notation anglaise `g(f(x))` c'est à dire `(g"∘"f)(x)`, par contre, si `f` est une application, l'expression `fgh` désignera en notation anglaise `h"∘"g"∘"f`.
La même problèmatique notationnelle se pose pour le produit maticielle. Si nous voulons remettre dans l'ordre de gauche à droite les transformations vectorielles successives, sans pour autant modifier le produit matriciel tel qu'il est habituellement définie, on peut y arriver simplement en effectuant la transposition sur toutes les matrices et vecteurs compris. La transposition d'un vecteur transforme le vecteur ligne en vecteur colonne et vis-versa. La transposition d'un produit de matrices donne le produit des matrices transposée mais dans l'ordre inverse. Voyez par par exemple :
`((x,y))((a,b),(c,d)) = ((a,c),(b,d))((x),(y))`
Nous présenterons les résultat avec la notation habituelle en vecteurs colonnes pour ne pas brusquer inutilement nos auditeurs, donc en réinversant l'ordre des compositions. Par exemple étant données trois applications vectorielles `f,g,h` de matrice respectives `F,G,H`, et étant donné un vecteur `x` de matrice colonne `X`. En notation anglaise, la composition d'application `(h"∘"g"∘"f)(x)` sera égale au produit matriciel `HGFX`. En notation française, chaque matrice est transposé, le vecteur colonne est transposé en un vecteur ligne, et la composition d'application `xfgh` sera égale au produit matriciel `X^T F^T G^T H^T`.
Le changement de référentiel étant une application affine, chaque changement de référentiel `f` appliqué à un quadrivecteur `X` produira en notation anglaise `FX+F_0` où `F` est la matrice de l'application affine `f`, et où `F_0` est le vecteur colonne second membre de l'application affine `f`. En notation française, chaque matrice et vecteur sont transposés, l'application affine `f`, appliqué au quadrivecteur `X` produira `X^TF^T+F_0^T`.
On désignera l'application affine `f` par le couple `f=(F,F_0)`
Au lieu de désigner la position `X` d'un évènement par un quadrivecteur position qui est alors relative à un référentiel, on peut vouloir désigner la position absolue de l'évènement qui est alors déterminée par l'association d'un quadrivecteur position et d'un référentiel. Pour cela, nous utilisons la notations logique d'un quadrivecteur placé au dessus d'un référentiel avec une barre séparateur horizontale gris-claire :
`color(#AAA)(frac(color(blue)( X ))(color(blue)( Omega )))`
Cela représente la position absolue d'un évènement ponctuel instantané, qui possède la position `X` dans le référentiel `Omega` . Noter que pour sur ce type d'élément que constitue une position absolue, nous n'avons pour l'instant définit aucune opération, à part l'égalité qui signifie qu'il s'agit de la même position absolue. Les égalités de position absolue permettent de formaliser de façon concise les hypothèses géométriques dans l'espace-temps en les incopororant dans la formule. Par exemple l'expression suivante indique que la position de coordonnée `X` dans `A` possède les coorodonnées `Y` dans `B`.
`color(#AAA)(frac(color(blue)( X ))(color(blue)( A ))) = color(#AAA)(frac(color(blue)( Y ))(color(blue)( B )))`
En procédant à cette dichotomie coordonnées-référentiel, on pourra explorer de nouveaux systèmes de coordonnées associés à de nouveaux types de référentiel. En explorant d'autres types de référentiel, on définira d'autres forme de coordonnées, formant d'autres structures algèbriques avec certaines propriétés invariantes selon certains types de changement de référentiel.
On se place dans le référentiel du laboratoire `Omega`, et tous les autres référentiels doivent alors pouvoir se définir avec des paramètres interprétés relativement au référentiel `Omega`. N'ayant pas de connaissance à quoi ressemble un référentiel complètement défini, nous procédons prudemment en définissant d'abord des transformations simples de référentiel, qui doivent pouvoir s'appliquer de la même façon à tout référentiel. Puis, ces transformations, telles des générateurs, engendreront par composition, un groupe de transformations. Et chacune de ces transformations appliquées à `Omega` désignera alors de façon complétement défini un référentiel.
La première transformation de référentiel que nous proposons est le déplacement du point `[0,0,0,0]` au point `X_0=[t_0,x_0,y_0,z_0]`, appelé déplacement `X_0`. On part d'un référentiel `A` quelconque, et on déplace son origine `[0,0,0,0]` au point `X_0=[t_0,x_0,y_0,z_0]` dans `A` pour ainsi construire un nouveau référentiel `B` sans rien changer d'autre que son origine. On note ce déplacement de façon formelle par l'expression suivante :
`ccD(X_0)` ou bien directement `ccD[(t_0), (x_0) ,(y_0), (z_0)]`
Notez bien que le quadrivecteur position `X_0` est relatif au référentiel sur lequel s'applique cette transformation `ccD(X_0)`. Puis considérons un évènement ponctuel instantané à la position `X"="[t,x,y,z]` dans `A`. On note `X’ "=" [t’,x’,y’,z’]` sa position dans `B`. Le changement de référentiel, qui correspond à l'inverse de la transformation de référentiel, est l'application qui à partir de `X` calcule `X’`. Ces deux applications seront désignés par le même nom. Et c'est le type de l'argument qui permettra de savoir laquelle des deux est évoquées, la transformation de référentiel ou le changement de référentiel. Ainsi, à chaque transformations de référentiel opérant sur les référentiels, correspond une fonction inverse désignée par le même nom, appelée changement de référentiel et opérant sur les quadrivecteurs :
`AccD(X_0) = B`
`XccD(X_0) = X’`
Pour bien comprendre la notation, il convient de poser comme syntaxe que les lettres majuscules rondes désignent des fonctions en notation anglaise qui sont évaluées en premier, tel que `ccD(X_0)`, puis celles-ci produisant des fonctions qui s'appliquent en notation française, appliquée à un référentiel `A` dans la première équation `AccD(X_0)`, et appliquée à un quadrivecteur `X` dans la seconde équation `XccD(X_0)`. Et selon le type d'élément sur lequel s'applique cette fonction, il s'agira d'une transformation de référentiel ou d'un changement de référentiel.
Le quadrivecteur `X_0` est une position dans `A`. Le référentiel `B` est créé à partir du référentiel `A` en déplaçant son point origine `[0,0,0,0]` au point `X_0` exprimé dans `A`. Le quadrivecteur `X` désigne la postition dans `A` d'un évènement, et le quadrivecteur `X’` désigne la position dans `B` du même évènement.
L'application inverse, `ccD(X_0)^-1`, où `X_0` désigne alors une position relative au référentiel résultat, correspond alors à l'application qui appliquée au référentiel `B` construit le référentiel `A`, et qui appliqué à un quadrivecteur dans `B` produit un quadrivecteur dans `A`.
`B ccD(X_0)^-1=A`
`X’ccD(X_0)^-1=X`
Notez que cette transformation appelé déplacement `ccD(X_0)` peut s'appliquer à tout référentiel `A`, et l'interprétation du point `X_0` est alors relative au référentiel `A` concidéré . Ces transformations de référentiel fixe sont définies de façon identique dans la relativité galiléenne comme dans la relativité restreinte. Et nous avons la loi de composition suivante :
`ccD(P)ccD(Q) = ccD(P+Q)`
`ccD(P)^-1 = ccD(-P)`
Procédant pas à pas, et ne connaissant pas la forme générale des référentiels, on procède prudemment en définissant chaque nouveau référentiel `A` à l'aide de la transformation qui change le référentiel du laboratoire, `Omega`, en le référentiel `A`. Et les transformations en question doivent pouvoir s'appliquer de la même façon à tout référentiel.
On considère le déplacement du point `[0,0,0,0]` au point `X_0=[t_0,x_0,y_0,z_0]` dans un référentiel quelconque `A`, produisant un nouveau référentiel `B` ayant son point d'origine en `X_0` dans `A`. Ce déplacement relatif, se note de façon formelle par l'expression `ccD(X_0)`. Etant donné la position d'un évènement `X"="[t,x,y,z]` dans `A`, et notons `X’ "=" [t’,x’,y’,z’]` sa position dans `B`. Autrement dit, les coordonnées de l'évènement dans `A` sont `X`, et les coordonnées du même évènement dans `B` sont `X’`. Nous avons :
`X’ = XccD(X_0)`
`[(t’),(x’),(y’),(z’)] = [(t),(x),(y),(z)]ccD[(t_0), (x_0) ,(y_0), (z_0)]`
Le calcul du changement de référentiel, qui est ici un déplacement, est :
`X’ = X-X_0`
`[(t’),(x’),(y’),(z’)] = [(t),(x),(y),(z)]-[(t_0), (x_0) ,(y_0), (z_0)]`
`t’=t-t_0`
`x’=x-x_0`
`y’=y-y_0`
`z’=z-z_0`
Pour résumer nous avons, quelque soit deux quadrivecteurs `X, X_0` :
`XccD(X_0) = X-X_0`
Cela signifie que le changement de référentiel par déplacement `X_0` se traduit par la soustraction de `X_0`. Cette propriété se met sous forme d'égalité de position absolue comme suit. Quelque soit le référentiel `A` et quelque soit deux quadrivecteurs `X, X_0`, il existe un référentiel `B` tel que :
`color(#AAA)(frac(color(blue)( X ))(color(blue)( A ))) = color(#AAA)(frac(color(blue)( XccD(X_0) ))(color(blue)( AccD(X_0) ))) = color(#AAA)(frac(color(blue)( X-X_0 ))(color(blue)( B )))`
Les égalités de position absolue permettent de formaliser de façon concise les hypothèses et de les incoprorer dans la formule rendant celle-ci tautologique.
Remarquer que le paramètre `t_0` correspond à un décalage de l'origine des temps du référentiel `B` par rapport à celui de `A`, faisant que tout évènement se déroulant à l'instant `t` dans le référentiel `A`, se déroule à l'instant `t-t_0` dans le référentiel `B`.
Les mêmes notations s'appliquerons pour la relativité restreinte, en prenant un système d'unité ou la constante de la vitesse de la lumière est fixé à `1`, c'est à dire, à exactement une unité de vitesse. La différence entre les deux systèmes n'apparaitra qu'avec la définition des référentiels en translation uniforme.
On se place dans un univers de géométrie euclidienne, autrement dit, dans lequel les masses gravifiques sont d'effet négligeable sur l'espace et le temps.
Newton avait déjà constaté le principe d'inertie qui caractérise le mouvement des corps soumis à aucune force. Ceux-ci suivent des trajectoires droites avec des vitesses constantes, appelées des translations uniformes. C'est pourquoi les seconds référentiels qui seront considérés, sont les référentiels en translation uniforme, appelé aussi référentiel inertiel.
Les lois physiques doivent être identiques dans tout référentiel non accéléré. C'est un principe de relativité, qui était déjà présent dans les esprits avant la relativité restreinte. Et ce principe appliqué à ces référentiels en translation uniforme, va naturellement aboutir à l'idée que la vitesse de la lumière est la même dans chacun de ces référentiels.
On définit la théorie de la relativité restreinte à partir du principe de l'invariance de la vitesse de la lumière `c` (de sa norme) lors des changements de référentiel en translation uniforme.
Un référentiel correspond à un observateur. Ainsi quelque soit la façon dont un observateur se situe dans l'espace-temps, et se déplace en translation uniforme, celui-ci perçoit la lumière se déplaçant dans le vide autour de lui toujours à une vitesse de norme `c`.
Cette condition d'invariance de la vitesse de la lumière fait qu'un changement de référentiel en translation uniforme appliqué à un évènement ponctuelle instantané, entraine un changement de ses coordonnées non seulement spaciales `x,y,z` mais aussi nécessairement temporelle `t`, faisant que des évènements dans des lieux distincts peuvent se réaliser en même temps pour un observateur, et dans des instants différents pour un autre observateur qui serait en translation uniforme par rapport au premier observateur.
On met la coordonnée temporelle en premier car elle est jugée la plus impotante et la plus globale. Et on préfère la multiplier par la constante fondamentale `c` afin d'obtenir une coordonnée de même unité que les autres, une unité de distance. La constante `c` étant une constante fondamentale, aucun arbitraire n'est introduit dans ce choix. Ainsi on homogénise le quadrivecteur position `[ct,x,y,z]`, et toutes ces composantes s'expriment selon une même unité qui est l'étalon de distance.
La constante `c` étant parfaitement déterminée pour des raisons fondamentales et principiel, il apparaît naturel, de choisir un système d'unité physique dans lequel cette constante `c` est égale à l'unité de vitesse, c'est à dire égale à l'unité de distance divisé par l'unité de temps.
En effet, pourquoi s'embarrasser dans les formules d'une variable `c` qui pour des raisons théoriques fondamentales est connue de façon exacte ? Autant choisire un système de coordonnée où cette valeur vaut `1`, et ne plus s'en occuper. Ainsi faisons nous le choix d'un système d'unité où l'unité de vitesse est la vitesse de la lumière dans le vide.
La vitesse de la lumière est d'environ `3"×"10^8"m/s"`. On choisie par exemple comme unité de temps la microseconde, et comme unité de distance environ 300 mètres. Ce choix, liant unité de distance et de temps, désignant la vitesse de la lumière comme unité de vitesse, va simplifier les formulations de la relativité restreinte.
La théorie de la relativité restreinte s'expriment de manière élégante dans un formalisme quadridimensionnel, et ce sont les mêmes notations utilisées pour désigner une position spatio-temporelle galiléenne qui s'appliquerons pour désigner un quadrivecteur. Le système d'unité étant choisi de tel sorte que l'unité de temps soit lié par principe à l'unité de longueur, et dans lequel la constante de la vitesse de la lumière soit égale à `c=1`. Ainsi, le quadrivecteur position `[t,x,y,z]` admet comme genre d'unité : [longueur × longueur × longueur × longueur].
Etant donné un photon dans le vide, sa trajectoire dans l'espace-temps est définie par le quadrivecteur position `X=[t,x,y,z]`. On note sa position spaciale par `vec x = [x,y,z]`. Le carré de la vitesse de la lumière qui est par principe de norme égale à `1`, s'exprime comme suit :
`(dvec x)/dt "⋅" (dvec x)/dt = 1`
`(dvec x"⋅" dvec x)/dt^2 = 1`
`(dvec x"⋅" dvec x) = dt^2`
`dx^2 +dy^2+dz^2 = dt^2`
En conséquence un changement de référenciel qui laisse invariant la vitesse de la lumière produira une trajectoire du photon de coordonnées `x’,y’,z’,t’` vérifiant :
`dx’^2 +dy’^2+dz’^2 = dt’^2`
De telles transformations fixes sont par nature cartésienne et coïncident donc dans les deux systèmes, de la relativité galiléenne et de la relativité restreinte. Car les effets de la relativité restreinte n'apparaissent que lorsque les référentiels considérés se meuvent les uns par rapport aux autres.
Si nous ne considérons qu'une seule dimension spaciale, les formulations deviennent plus simples. La position d'une particule dans l'espace-temps relativement au référentiel du laboratoire, est alors décrite par un bivecteur :
`X"←"(t)`
`X = [(t),(x)]`
Un référentiel correspond à un observateur qui veut prendre des mesures dans son référentiel à lui. Dans un espace unidimensionnel, on a vite fait le tour des changements de référentiel fixe possibles constituant des applications affines et ne modifiant pas la norme de la vitesse de la lumière. On ajoutera néanmoins une condition supplémentaire, celle de ne pas produire de particule allant plus vite que la vitesse de la lumière. Il existe 4 types simples de tel changement de référentiel fixe :
Les déplacements ne changent pas les vitesses. Idem pour le changement d'échelle car si l'étalon de distance et l'étalon de temps sont multipliés par un même facteur cela ne change pas la norme des vitesses. L'inversion du sens de l'espace ainsi que l'inversion du sens du temps pris isolément change le signe des vitesses `dx"/"dt` et donc ne change pas la norme des vitesses.
Parcontre la permutation des axes d'espace et de temps y est exclut, celle-ci, inversant les vitesses, ferait apparaître des vitesses supérieures à la vitesse de la lumière. On en conclut également que toute combinaison linéaire croisant le temps et l'espace aboutirait au même conséquence. Ainsi avons-nous épuisé toutes les possibilités.
Le groupe des transformations engendrées par ces 4 types de tranformations forment donc le groupe des transformations fixes respectant l'invariance de la norme de la vitesse de la lumière et l'absence de particule de vitesse supérieure à la vitesse lumière. Ces tranformations sont dites catésiennes.
On se place dans un référentiel `A` quelconque. Tout référentiel `B`, fixe relativement au référentiel `A` et qui ne change rien d'autre que son origine, est défini complètement par sa position d'origine `X_0"="[t_0,x_0]` dans `A`. Le référentiel `B` est le résultat du déplacement `ccD(X_0)` appliquée à `A`. Cela se note `AccD(X_0)"="B`. La formule à retenir du changement de référentiel par déplacement `X_0` est : quelque soit deux quadrivecteurs `X, X_0` :
`XccD(X_0) = X-X_0`
On conclut que le changement de référentiel par déplacement `X_0` est l'application affine suivante :
`ccD(X_0)=( [(1,0),(0,1)], [(-t_0),(-x_0)] )`
Cette propriété se met sous forme d'égalité de position absolue comme suit. Quelque soit le référentiel `A` et quelque soit deux quadrivecteurs `X, X_0`, il existe un nouveau référentiel `B` tel que :
`color(#AAA)(frac(color(blue)( X ))(color(blue)( A ))) = color(#AAA)(frac(color(blue)( XccD(X_0) ))(color(blue)( AccD(X_0) ))) = color(#AAA)(frac(color(blue)( X-X_0 ))(color(blue)( B )))`
Considérons une particule à la position `X"="[t,x]` dans `A`. Sa position `X’"="[t’,x’]` dans `B` se note :
`X’= XccD(X_0)`
`[(t’),(x’)] =[(t),(x)]ccD[(t_0),(x_0)]`
Et se calcule comme suit :
`X’ = X-X_0`
`[(t’),(x’)] = [(t),(x)]-[(t_0),(x_0)]`
`t’=t-t_0`
`x’=x-x_0`
Pour le référentiel `B`, l'origine du calendrier est avancé de `t_0`, cela explique pourquoi `t’ = t-t_0` ce qui signifie textuellement que la date d'un évènement dans `B` est égale à la date de l'évènement dans `A` moins `t_0`.
L'échelle ne se définit pas dans l'absolu, car les lois jusqu'à présent sont invariantes par changement d'échelle. Le changement de référentiel qu'est la dilatation fixe d'échelle consiste en une dilatation fixe de l'étalon d'espace et de l'étalon de temps par un même facteur `k`. Ce changement de référentiel respecte bien l'invariance de la vitesse de la lumière `c"="1` puisque cette vitesse est obtenue en divisant l'unité de distance par l'unité de temps, rapport qui reste inchangé si les étalons de temps et de distances sont multipliés par un même facteur `k`.
Ces changements de référentiel laissant invariant la vitesse de la lumière, peuvent donc être ajouté au groupe des transformations fixes. L'échelle interviendra plus-tard lorsqu'on introduira les principes de la relativité d'échelle.
On se place dans un référentiel quelconque `A`. Et on définit un nouveau référentiel `B`, fixe par rapport à `A`, localisé à la même position que `A` c'est à dire dont le point origine coïncide avec le point origine de `A`, mais dans lequel l'échelle est `k` fois plus grande, et on parle de l'échelle de temps comme de l'échelle de longueur, toutes deux `k` fois plus grandes. Autrement dit, les étalons de temps et de distances sont `k` fois plus grand. On note `ccxi(k)` cette transformation. Le référentiel `B` se définie donc formellement à partir du référentiel `A` en lui appliquant ce changement d'échelle, ce qui se note `Accxi(k)"="B`.
Considérons une particule à la position `X"="[t,x]` dans `A`. Sa position `X’"="[t’,x’]` dans `B` se note :
`X’=Xccxi(k)`
`[(t’),(x’)] = [(t),(x)]ccxi(k)`
Un tel référentiel dans lequel l'échelle est `k` fois plus grande, verra la taille des objets `k` fois plus petit, et verra évoluer les objets `k` fois plus lentement, et donc verra la lumière se déplacer avec la même vitesse.
`X’ = X"/"k`
`[(t’),(x’)] = 1/k[(t’),(x’)]`
La formule à retenir du changement d'échelle est : quelque soit deux quadrivecteurs `X, X_0` :
`[(t),(x)]ccxi(k) = 1/k[(t),(x)]`
Cela signifie que le changement de référentiel par augmentation d'échelle d'un facteur `k`, se traduit par la division par `k` des coordonnées. On conclut que le changement de référentiel par dilatation d'échelle `k` est l'application affine suivante :
`ccxi(k)=( [(1/k, 0),(0,1/k)], [(0),(0)] )`
Cette propriété se met sous forme d'égalité de position absolue comme suit. Quelque soit `k">"0`, Quelque soit le référentiel `A`, et quelque soit un quadrivecteur `[t,x]`, il existe un référentiel `B` tel que :
`color(#AAA)(frac(color(blue)( [(t),(x)] ))(color(blue)( A ))) = color(#AAA)(frac(color(blue)( [(t),(x)]ccxi(k) ))(color(blue)( Accxi(k) ))) = color(#AAA)(frac(color(blue)( [(t"/"k),(x"/"k)] ))(color(blue)( B )))`
Remarquez que la dilatation de l'echelle d'un facteur `"-"1` correspond à l'inversion du sens de l'espace et du sens du temps, mais que la dilatation d'un facteur zéro n'est pas autorisée.
L'inversion du sens de l'espace dans un espace unidimensionnelle est simple à comprendre. C'est un observateur qui tourne sur lui-même d'un demi-tour, et inverse ainsi le sens du chemin.
On se place dans un référentiel quelconque `A`. Et on définit un nouveau référentiel `B`, localisé à la même position que `A`, mais pour lequel le sens de `x` est inversé. On note `ccsigma` la transformation qui inverse le sens de `x`. Le référentiel `B` se définie donc formellement à partir du référentiel `A` comme suit : `B=Accsigma`. Considérons une particule à la position `X"="[t,x]` dans `A`. Sa position `X’"="[t’,x’]` dans `B` se note :
`X’=Xccsigma`
`[(t’),(x’)] = [(t),(x)]ccsigma`
Le changement de coordonnées qui s'opère lors du changement de référentiel passant du référentiel `A` au référentiel `B`, est l'application symétrique suivante :
`[(t’),(x’)]=[(t),(-x)]`
qui s'écrit sous forme de produit matriciel :
`[(t’),(x’)] = ((1,0),(0,-1)) [(t),(x)]`
`X’ = ((1,0),(0,-1))X`
La formule à retenir du changement de référentiel par inversion du sens de l'espace est :
`[(t),(x)]ccsigma = ((1,0),(0,-1))[(t),(x)]`
On conclut que le changement de référentiel par inversion du sens de l'espace est l'application affine suivante :
`ccsigma=( [(1,0),(0,-1)], [(0),(0)] )`
Cette propriété se met sous forme d'égalité de position absolue comme suit, et notre réticence dans l'usage de la notation de bivecteur n'est plus utile puisque les référentiels sont explicitement mentionnés. Quelque soit le référentiel `A` et quelque soit un quadrivecteur `[t,x]`, nous avons :
`color(#AAA)(frac(color(blue)( [(t),(x)] ))(color(blue)( A )))=color(#AAA)(frac(color(blue)( [(t),(x)]ccsigma ))(color(blue)( Accsigma )))=color(#AAA)(frac(color(blue)( [(t),(-x)] ))(color(blue)( B )))`
Par contre, pour l'inversion du sens du temps, le concept est un peu plus compliqué. Il faut considérer que les lois posées jusqu'à présent sont parfaitement symétriques à l'égard du temps, et donc que si on inverse le sens du temps, on obtient un déroulé qui obéït encore aux mêmes lois. L'expérience statistique semble contredire cela, car on ne constate pas de suite causale se déployant dans le sens inverse du temps. Mais cela ne prouve pas qu'il ne puisse pas y en avoir. Considérons une goutte d'encre tombant dans un verre d'eau. Si on inverse par un tour de magie, la vitesse de toutes les molécules, l'évolution se déroulera comme si on avait inversé le sens du temps.... Une conscience se définit par une mémoire s'actualisant constamment et sur laquelle s'opère un processus d'analyse et de reflexion, et cela se déroule dans le sens du temps. La mémorisation et les processus d'analyse et de reflexion en question obéïssent aux lois, et donc rien n'interdit de concevoir une conscience qui se déroulerait dans le sens inverse du temps. Notre référentiel, avec un sens du temps inversé, correspond à un observateur dont la conscience se déploierait dans ce sens du temps inversé, où sa mémoire ne retiendrait que les constats futures, et non les constats passés et ses processus d'analyse et de réflexion se déroulerait à l'envers.
On se place dans un référentiel quelconque `A`. Et on définit un nouveau référentiel `B`, localisé à la même position que `A`, mais pour lequel le sens de `t` est inversé. On note `ccς` la transformation qui inverse le sens de `t`. Le référentiel `B` se définie donc formellement à partir du référentiel `A` comme suit :
`B=Accς`
Considérons une particule à la position `X"="[t,x]` dans `A`. Sa position `X’"="[t’,x’]` dans `B` se note :
`X’=Xccς`
`[(t’),(x’)]=[(t),(x)]ccς`
Le changement de coordonnées qui s'opère lors du changement de référentiel passant du référentiel `A` au référentiel `B`, est l'application symétrique suivante :
` [(t’),(x’)] = [(-t),(x)]`
qui s'écrit sous forme de produit matriciel :
` [(t’),(x’)] = ((-1,0),(0,1))[(t),(x)]`
La formule à retenir du changement de référentiel par inversion du sens du temps est :
`[(t),(x)]ccς = ((-1,0),(0,1))[(t),(x)]`
On conclut que le changement de référentiel par inversion du sens du temps est l'application affine suivante :
`ccς=( [(-1,0),(0,1)], [(0),(0)] )`
Cette propriété se met sous forme d'égalité de position absolue comme suit. Quelque soit le référentiel `A`, et quelque soit un quadrivecteur `[t,x]`, nous avons :
`color(#AAA)(frac(color(blue)( [(t),(x)] ))(color(blue)( A )))=color(#AAA)(frac(color(blue)( [(t),(x)]ccς ))(color(blue)( Accς )))=color(#AAA)(frac(color(blue)( [(-t),(x)] ))(color(blue)( B )))`
---- 9 décembre 2020 ----
On construit un second type de transformation de référentiel que sont les transformation de référentiels en translation uniforme. On choisit d'abord des transformations simples, faisant coïncider les origines des deux référentiels, qui sont catractérisés par un unique paramètre qu'est la vitesse de translation uniforme, définie relativement au référentiel sur lequel est appliqué la transformation. Les autres transformations de référentiels en translation uniforme s'obtiendront en combinant celles-ci avec les transformations de référentiel fixe vus précédement.
On se place dans un référentiel quelconque `A`. Et on définit un nouveau référentiel `B`, localisé à la même position que `A`, mais se déplaçant à la vitesse `v` relativement au référentiel `A`. De tel sorte que la trajectoire de son origine spatiale, que l'on note `b` exprimée dans `A`, est donnée par la formule :
`b = vt`
Notez que `b` représente la position du référentiel `B` dans `A`, que `v` représente la vitesse de `B` dans `A` et que `t` est un paramètre libre désignant le temps propre dans le référentiel `A`. On note `ccT(v)` cette transformation par translation uniforme de vitesse `v` dans `A`. Le référentiel `B` se définie donc formellement à partir du référentiel `A` comme suit :
`B=AccT(v)`
Considérons une particule à la position `X"="[t,x]` dans `A`. Sa position `X’"="[t’,x’]` dans `B` se note :
`X’ = XccT(v)`
`[(t’),(x’)] = [(t),(x)]ccT(v)`
Selon la relativité galiléenne, le changement de coordonnées qui s'opère lors du changement de référentiel passant du référentiel `A`, au référentiel `B` en translation uniforme de vitesse `v`, est l'application affine suivante :
` t’ = t`
` x’ = x-vt`
La matrice du changement de référentiel `ccT(v)` est la suivante :
`ccT(v) = [(1,0),(-v,1)]`
Les changements successifs `ccT(u)ccT(v) = ccT(u+v)` établissent la règle de sommations des vitesses. Les vitesses s'ajoutent, faisant que l'on peut construire des référentiels où la vitesses est aussi grande que l'on veut, donc supérieure à celle de la lumière. Ces transformations galiléennes ne conservent pas la vitesse de la lumière. Les vitesses s'ajoutent lors de tranformation successives et peuvent donc dépasser la vitesse de la lumière.
Cherchons maintenant les transformations affines possédant un paramètre réel `v`, et satisfaisant les trois hypothèses suivantes :
Le paramètre `v` désigne la vitesse de translation uniforme du nouveau référentiel par rapport au référentiel initial. Considérons une particule à la position `X"="[t,x]` dans `A`. Sa position `X’"="[t’,x’]` dans `B` se note :
`X’ = XccT(v)`
`[(t’),(x’)] = [(t),(x)]ccT(v)`
La transformation affine générale `ccT(v)` s'écrit avec les paramètres réels `p,q,r,s,i,j` fonctions de `v` comme suit :
`[(t’),(x’)] = [(p,r),(q,s)][(t),(x)] + [(i),(j)]`
`t’= pt+rx+i`
`x’= qt+sx+j`
La position de `A` dans `A` est `[t,a]` avec `a"="0`. La position de `B` dans `A` est `[t,b]` avec `b"="vt`. La position de `A` dans `B` est donc `[t’,a’]` avec par hypothèse n°2, l'hypothèse de symétrie `a’"=-"vt’`. Et la position de `B` dans `B` est donc `[t’,b’]` avec `b’"="0`. Et le changement de référentiel affirme que : `[t’,a’]"="[t,a]ccT(v)` et `[t’,b’]"="[t,b]ccT(v)`. Pour résumer, nous avons :
Dans le référentiel `A` Dans le référentiel `B`Position de `A` `[(t),(a)]` avec `a=0` `[(t’),(a’)]` avec `a’=-vt’` Position de `B` `[(t),(b)]` avec `b=vt` `[(t’),(b’)]` avec `b’=0`
Ces hypothèses se résument et s'écrivent formellement en ce système de 8 équations :
`color(#AAA)(frac(color(blue)( [(t),(a)] ))(color(blue)( A ))) = color(#AAA)(frac(color(blue)( [(t’),(a’)] ))(color(blue)( B )))`
`color(#AAA)(frac(color(blue)( [(t),(b)] ))(color(blue)( A ))) = color(#AAA)(frac(color(blue)( [(t’),(b’)] ))(color(blue)( B )))`
`a=0`
`b=vt`
`a’=-vt’`
`b’=0`
`[(t’),(a’)]=[(t),(a)]ccT(v)`
`[(t’),(b’)]=[(t),(b)]ccT(v)`
`a=0`
`b=vt`
`a’=-vt’`
`b’=0`
`t’= pt+ra+i`
`a’= qt+sa+j`
`t’= pt+rb+i`
`b’= qt+sb+j`
`a=0`
`b=vt`
`a’=-vt’`
`b’=0`
On en conclue que quelque soit `t` nous avons :
`a’=-vt’`
`qt+sa+j = v(pt+ra)+i`
`qt+j = vpt+i``b’=0`
`qt+sb+j=0`
`qt+svt+j=0`
Et donc que :
`i=j=0`
`q+pv=0`
`q+sv=0`
`p=s`
La transformation affine générale `ccT(v)` est donc de la forme suivante avec les paramètres réel `r,s` fonctions de `v` :
`[(t’),(x’)] = [(s,r),(-sv,s)][(t),(x)]`
`t’= st+rx`
`x’= -svt+sx`
Passons maintenant à l'hypothèse n°3, l'invariance de la vitesse de la lumière. Reprenons la discution du chapitre 7. Etant donné un photon dans le vide, sa trajectoire dans le référentiel `A` est définie par le bivecteur position :
`x"←"(t)`
`X= [(t),(x)]`
Le carré de la vitesse de la lumière qui est par principe de norme égale à `1`, s'exprime comme suit :
`(dx/dt)^2 = dx^2"/"dt^2 = 1`
`dt^2 = dx^2`
En conséquence le changement de référenciel `ccT(v)` devant laisser invariant la vitesse de la lumière, appliqué à la trajectoire du photon `[x,t]`, produira une trajectoire `[t’,x’]` vérifiant également `dt’^2 = dx’^2`.
`X’ = XccT(v)`
`dX’ = dXccT(v)`
`d[(t’),(x’)] = [(s,r),(-sv,s)]d[(t),(x)]`
`[(dt’),(dx’)] = [(s,r),(-sv,s)][(dt),(dx)]`
`dt’= sdt+rdx`
`dx’= -svdt+sdx`
L'égalité `dt^2 = dx^2` entraine par hypothèse n°3 que `dt’^2 = dx’^2`, et cela se décline en 4 cas possibles :
`dt=dx` `dt’=dx’` |
`dt=dx` `dt’=-dx’` |
`dt=-dx` `dt’=dx’` |
`dt=-dx` `dt’=-dx’` |
`dt’ = dx’` `sdt+rdx= -svdt+sdx` `s+r=-sv+s`
`r=-sv` |
`dt’ = -dx’` `sdt+rdx= svdt-sdx` `s+r=sv-s`
`r=sv-2s` |
`dt’ = dx’` `sdt+rdx = -svdt+sdx` `-s+r=sv+s`
`r=sv+2s` |
`dt’ = -dx’` `sdt+rdx= svdt-sdx` `-s+r=-sv-s`
`r=-sv` |
qui se réduisent en trois cas possibles :
`r= -sv`
`r=s(v+2)`
`r=s(v-2)`
On ne retient que le premier cas, l'hypothèse n°1 excluant les deux autres cas. Pour déterminer `s`, on se servira de l'hypothèse n° 4, à savoir : Si on combine successivement deux telles transformations de référentiel alors on obtient une transformation de référentiel du même genre. C'est à dire : si `B"="AccT(u)` et `C"="BccT(v)` alors la transformation résultante est de la même forme `C"="AccT(w)`. Autrement dit :
`ccT(u)ccT(v)=ccT(w)`
`s(u)[(1,-u),(-u,1)] s(v)[(1,-v),(-v,1)] = s(w)[(1,-v),(-v,1)]`
`s(u)s(v)[(1+uv,-(u+v)),(-(u+v),1+uv)] = s(w)[(1,-w),(-w,1)]`
`(1+uv) s(u)s(v) = s(w)`
`-(u+v)s(u)s(v)= -w s(w)`
Et donc on obtient la règle d'addition des vitesses :
`w = (u+v)/(1+uv)`
`(1+uv) s(u)s(v) = s((u+v)/(1+uv))`
`s(u)s(v) = (s((u+v)/(1+uv)))/(1+uv)`
Cela doit nous permettre de calculer `s` :
`s(0)=1`
`s(v)s(-v) = (s(0))/(1+v^2)`
`s(v)=s(-v)`
Donc
`s(v) = 1/sqrt(1+v^2)`
Ainsi le changement de référentiel en translation uniforme de vitesse `v` est :
`X’=1/sqrt(1-v^2) [(1,-v),(-v,1)]X`
`[(t’),(x’)] =1/sqrt(1-v^2) [(1,-v),(-v,1)][(t),(x)]`
Tout en faisant attention au fait que le calcul matriciel compose les matrices dans l'ordre inverse de la notation française de compositions d'application, on conclut que :
`ccT(v) = 1/sqrt(1-v^2) [(1,-v),(-v,1)]`
Cette propriété se met sous forme d'égalité de position absolue comme suit. Quelque soit un réel `v`, quelque soit le référentiel `A`, et quelque soit un quadrivecteur `[t,x]`, nous avons :
`color(#AAA)(frac(color(blue)( [(t),(x)] ))(color(blue)( A ))) = color(#AAA)(frac(color(blue)( 1/sqrt(1-v^2) [(1,-v),(-v,1)][(t),(x)]))(color(blue)( AccT(v) )))`
Nous avons définie 5 types de générateurs de référentiel :
Ces transformations laissent invariant la norme de la vitesse de la lumière. Leurs compositions forment le groupe de Poincaré pour un univers à une dimension d'espace.
Les déplacements `ccD(P)` et `ccD(Q)` se combinent comme suit :
`ccD(P)ccD(Q) = ccD(P+Q)`
`ccD(P)^-1 = ccD(-P)`
Les inversions de sens se combinent comme suit :
`ccsigma_xccsigma_x=1`
`ccsigma_tccsigma_t=1`
`ccsigma_tccsigma_x=ccsigma_xccsigma_t=-1``ccD(P)ccsigma_x =ccsigma_xccD(Pccsigma_x)`
`ccD(P)ccsigma_t = ccsigma_tccD(Pccsigma_t)`
Les translations uniformes se combinent entre-elles comme suit :
`XccT(v)ccT(w) = 1/sqrt(1-v^2) 1/sqrt(1-w^2) ((1,-w),(-w, 1)) ((1,-v),(-v, 1))X`
` = 1/sqrt(1-v^2) 1/sqrt(1-w^2) ((1+vw,-(v+w)),(-(v+w), 1+vw))X`
` = (1+vw)/sqrt((1-v^2)(1-w^2)) ((1,-(v+w)/(1+vw)),(-(v+w)/(1+vw), 1))X`
On constate que `1/sqrt(1-(v+w)^2/(1+vw)^2) = (1+vw)/sqrt((1-v^2)(1-w^2))`
On conclut que `XccT(v)ccT(w) = XccT((v+w)/(1+vw))`
`ccT(v)ccT(w) = ccT((v+w)/(1+vw))`
Les translations uniformes se combinent avec les déplacements comme suit :
`XccD(P)ccT(v) = (X-P)ccT(v) = XccT(v)-PccT(v) = XccT(v)ccD(PccT(v))`
On conclut :
`ccD(P)ccT(v) = ccT(v)ccD(PccT(v))`
Les translations uniformes se combinent avec les inversions de sens comme suit :
`Xccsigma_xccT(v) = 1/sqrt(1 - v^2) ((1,-v),(-v, 1))((1,0),(0,-1))`
` = gamma ((1,-v),(-v, 1))((1,0),(0,-1))`
` = gamma ((1,v),(-v,-1))`
` = gamma ((1,0),(0,-1))((1,v),(v, 1))`
` = XccT(-v)ccsigma_x`
De même pour l'inversion du temps. On en conclut :
`ccsigma_xccT(v) = ccT(-v)ccsigma_x`
`ccsigma_tccT(v) = ccT(-v)ccsigma_t`
L'inverse d'une translation uniforme se calcule comme suit :
`ccT(v) = 1/sqrt(1 - v^2) ((1,-v),(-v, 1))`
`ccT(v)^-1 = 1/sqrt(1 - v^2) ((1,v),(v, 1))`
On en conclut :
`ccT(v)^-1 = ccT(-v)`
Ainsi `ccT(v)ccT(-v) = 1`
Il apparait 4 types de changement de référentiel selon qu'il y a eu inversion du sens de l'espace ou une inversion du sens du temps. Chacun est caractérisé par une translation uniforme de paramètre `v in RR` et avec un second membre correspondant à un déplacement au point `[t_0,x_0] in RR^2`, et un changement d'échelle `k>0`. De telle sorte que, partant du référentiel du laboratoire `Omega`, on peut définir tout référentiel en translation uniforme avec déplacement et inversion éventuelle de l'espace et du temps, par 3 paramètres réels, un paramètre réel positif non nul et deux paramètres booléens :
`(t_0, x_0, v, k, s_x, s_t) in RR^3"×"RR^"+""*×"{"-"1,1}^2`
`[(t’),(x’)] = k/(sqrt(1-v^2))[(s_t,-s_xv),(-s_tv,s_x)][(t),(x)] + [(t_0),(x_0)]`
Si on admet, commme avec la relativité de galilée, que les vitesses s'ajoutent et peuvent être aussi grande que l'on veut, on autorise alors l'intéraction quasi-instantanée avec une propagation de champs instantané. En effet, la loi physique devant être la même dans chaque tel référentiel, les champs de forces devant se propager à la même vitesse dans chaque référentiel, cette vitesse est nécessairement infini. On autorise ainsi une propagation de champ de force quasi-instantané. Aucune localisation n'est alors possible, puisque tout peut intéragire avec tout, dans l'instant !...
Si nous voulions définir les lois d'un monde (ici unidimensionnel) qui ne soit pas chaotique, ou tout au moins, qui puisse isoler des parties qui ne s'entendent pas. On comprend alors l'ineptie que constituerait la possibilité d'une action instantanée, d'un champ se propageant instantanément. Et comment faire pour limiter le plus simplement possible cette vitesse de transmission ? ce qui revient à limiter les sommations de vitesses ? Précisement en posant une vitesse maximale devant être égale dans tous les référentiels en translations uniforme. Ainsi, la relativité restreinte semble finalement la solution la plus simple.
Pour les mêmes raisons métaphysiques, il est plus simple de concevoir des univers finis que des univers infinis. Car l'infini est une hypothèse impondérable. C'est pourquoi on refermera notre univers d'espace unidimensionnel en un cercle, en rejoignant les deux bouts. Puis on pourra faire de même pour le temps. Cela se fait en considérant une coordonnée spaciale modulo `L`, où `L` désigne la taille de l'univers unidimensionnel. La position spatio-temporelle `[t,0]` est rendue identique en la collant à la position `[t,L]`, et ceci quelque soit `t`.
`AAt, [t,0]=[t,L]`
Notez que cela n'introduit aucune singularité dans l'espace, aucun point singulier, un cercle parfaitement symétrique, ou seul le référentiel désignera un point origine. Vous aurez remarqué que la géométrie n'est plus euclidienne. Elle l'est localement, mais à l'échelle de l'univers elle ne l'est pas, transformant ainsi une droite en un cercle.
Dans le cas du cercle simple, une particule devra faire une fois le tour de l'univers c'est à dire parcourir une longueur `L`, par exemple à une vitesse constante `v`, pour revenir à la même situation géométrique et à un temps augmenté de `L"/"v`.
L'introduction de la relativité restreinte fait alors apparaître un paradoxe dit, "le paradoxe des jumeaux".
On considère deux référentiels, le référentiel du laboratoire avec son temps `t` désigné comme étant l'observateur `A`, et le référentiel en translation uniforme de vitesse `v` avec son temps `tau` désigné comme étant l'observateur `B`. Noter que les deux paramètres `v` et `tau` sont exprimés relativement au référentiel du laboratoire `A`. Le changement de référentiel `A"↦"B` établit le lien entre `t` et `tau` comme le perçois `A`. Le référentiel du laboratoire `A` voit le référentiel en mouvement `B` avec une horloge ralentie (voir volume II) :
`t’"="t"/"gamma`
De tels sorte qu'après avoir fait le tour du cercle, l'observateur `B` rejoint l'observateur `A`. Et l'observateur `A` constate que `B` a veillit moins vite que `A`. Apparaît alors le paradoxe dit "des jumeaux", car le problème est symétrique. C'est l'observateur `B` qui est maintenant considéré comme fixe, et l'observateur `A` qui est en translation uniforme de vitesse `-v`. Et après avoir fait le tour du cercle, c'est maintenant l'observateur `B` qui constate que l'observateur `A` a veilli moins vite que lui. En l'état, le paradoxe n'est pas résolvable.
C'est pourquoi on se rabat sur une autre construction de l'univers fini, sur un autre moyen de refermer l'univers sur lui-même. Il semble qu'il y ait plusieur façons possibles particulièrement simple de refermer cet espace-temps. Chaque raccord doit désigner localement la même coordonnée spatiale puisqu'ils se rejoignent, et aussi la même coordonnée temporelle pour qu'il n'y ait pas de discontinuité. En effet, considérons une particule circulant à la vitesse `v` dans notre univers d'espace unidimensionnel. La cinématique définie la vitesse par `v=dx"/"dt`, si nous souhaitons de plus que le principe d'inertie reste valable et qu'une particule en mouvement garde sa vitesse inchangé, `dx` étant inchangé, `dt` doit être inchangé. Le temps doit évolué localement continument dans l'espace-temps. Chaque raccord de bord à bord doit désigner les mêmes coordonnées spacio-temporelles localement, et ne pas enfreindre le principe d'inertie.
Néanmoins les lois posées étant symétrique à l'égard du temps et de l'espace, si on inverse l'étalon de temps dans le raccord des deux bouts de l'univers et si on inverse également l'étalon de distance, cela laissera inchangé la vitesse. Car `v=dx"/"dt` reste inchangé si à la fois `x` et `t` change de signe. Cette construction s'inspire du ruban de Möbius. Mais comme il n'y a qu'une seule dimension d'espace, nous appellerons cette construction un cercle de Möbius.
Cela se fait toujours en considérant une coordonnée spaciale modulo `L`, où `L` désigne la taille de l'univers unidimensionnel. Mais dans le cas du cercle de Möbius, le passsage à travers le raccord spaciale de `0` à `L` entraine la modification des étalons de temps et de distance du référenciel, ils changent de signe. Qu'est qu'un référentiel où le sens du temps est inversé ? cela pourrait être une caractéristique de l'antimatière ? Et dans ce cas la matière deviendrait antimatière après avoir fait un tour complet de l'univers.
Dans la cas du cercle de Möbius, un observateur devra faire deux fois le tour c'est à dire parcourir une longueur `2L` pour revenir à la même situation géométrique. S'il ne parcourt qu'un seul tour, il se retrouvera au même point spacio-temporel mais dans une situation où le sens du temps est inversé et où le sens de l'espace est inversé.