Chapitre 3 - La mécanique quantique justification mathématique

Représentations mathématiques des particules

Représentation sans spin dans l’espace en 3 dimensions

Équation de Schrödinger

Dans l’espace en 3 dimensions et sans spin, une particule peut être représentée par un champ de nombres complexes, noté \(ψ\). L’amplitude de ces nombres complexes représente la densité de probabilité de présence de la particule dans l’espace. Leur phase est un angle de rotation dans l’espace (1,i), mais le nombre \(i\) ne semble pas avoir une quelconque signification physique dans ce contexte. Mathématiquement, les différences de phases provoquent néanmoins des interférences qui ont des effets observables.

L’évolution de ce champ dans un potentiel d’énergie \(V\) est décrite par l’équation de Schrödinger :

\(iℏ∂_tψ=((iℏ∇_{sp})²/2m + V)ψ\) , où \(m\) est la masse de la particule, \(ℏ\) la constante de Plank réduite, \(i\) un nombre tel que \(i²=-1\) et \(Ɐx ix=xi\), \(∇_{sp}=Σ_{1,2,3}γ^j∂_j\), \(γ_j²=1\) et \(Ɐi≠j γ_iγ_j+γ_jγ_i=0\).

L’équation de Schrödinger est de loin l’équation de mécanique quantique la plus connue, et elle est utile pour les calculs en pratique.

Malheureusement, cette équation est plus mathématique que physique, car :

On va donc plutôt s’intéresser aux équations de Madelung, qui sont une version plus physique de l’équation de Schrödinger.

Équations de Madelung

En partant de l’équation de Schrödinger et en décomposant \(ψ\) en \(Re^{iφ}\), où \(R\) et \(φ\) sont des réels, on obtient :

\(iℏ\) \(∂_tψ\) = \(((iℏ∇_{sp})²/2m + V)ψ\)
\(iℏ((\) \(∂_tṘ)e^{iφ}\) \(+i∂_tφ̇Re^{iφ})\) =- \((ℏ²/2m)(∇_{sp}·(∇_{sp}Ṙe^{iφ} + i∇_{sp}φ̇Re^{iφ})) + VRe^{iφ}\)
\(iℏ((\) \(∂_tṘ)e^{iφ}\) \(+i∂_tφ̇Re^{iφ})\) =- \((ℏ²/2m)(\) \((∇_{sp}²Ṙ)e^{iφ}\) +i \((∇_{sp}φ)·(∇_{sp}Ṙ)e^{iφ}\) +i \(∇_{sp}²φ̇Re^{iφ}\) +i( \(∇_{sp}φ̇)·(∇_{sp}Ṙe^{iφ}\) + \(i∇_{sp}φ̇Re^{iφ}\) )) + \(VRe^{iφ}\)
\(∂_tṘ\) \(+i∂_tφ̇R\) = \((ℏ /2m)(\) \(i∇_{sp}²Ṙ\) - \((∇_{sp}φ)·(∇_{sp}Ṙ)\) - \(∇_{sp}²φ̇R\) - ( \(∇_{sp}φ̇)·(∇_{sp}Ṙ\) + \(i∇_{sp}φ̇R\) )) - \(iVR/ℏ\)
\(∂_tṘ\) = \((ℏ /2m)(\) - \((∇_{sp}φ)·(∇_{sp}Ṙ)\) - \(∇_{sp}²φ̇R\) - ( \(∇_{sp}φ̇)·(∇_{sp}Ṙ\) ))
et \(∂_tφ̇R\) = \((ℏ /2m)(\) \(∇_{sp}²Ṙ\) - ( \(∇_{sp}φ̇)·(\) \(∇_{sp}φ̇R\) )) - \(VR/ℏ\)
\(∂_tṘ\) = \((ℏ/2m)(-2(∇_{sp}φ̇)·(∇_{sp}Ṙ) - ∇_{sp}²φ̇R)\)
et \(∂_tφ̇R\) = \((ℏ/2m)(∇_{sp}²Ṙ - (∇_{sp}φ̇)²R) - VR/ℏ\)

Sur la partie réelle, on a :

\(∂_tṘ\) = \(-(2(∇_{sp}φ̇)·(∇_{sp}Ṙ)\) + \(∇_{sp}²φ̇R\) \()ℏ/2m\)
\(2∂_tṘR\) = \(-(2(∇_{sp}φ̇)·(∇_{sp}ṘR)\) + \(∇_{sp}²φ̇R²\) \()ℏ/m\)
\(∂_tρ\) = \(-( (∇_{sp}φ̇)·(∇_{sp}ρ)\) + \(∇_{sp}²φ̇ρ\) \()ℏ/m\) où ρ=R²
\(∂_tρ\) = \(-∇_{sp}·(∇_{sp}φ̇ρℏ/m)\)

Or, \(ρ\) étant une densité de probabilité locale, elle doit être localement conservée, à savoir \(∂_tρ+∇_{sp}·(ρv_{sp})=0\), où \(v_{sp}\) est un champ de vitesse dans l’espace tel que \(ρv_{sp}\) est le flux de \(ρ\). En fait, le flux de \(ρ\) n’est pas défini de manière unique, car il peut y avoir des flux qui ne modifient pas \(ρ\), en faisant des boucles. Du coup le champ de vitesse \(v_{sp}\) n’est pas non plus défini de manière unique.

On choisit \(v_{sp}=ℏ∇_{sp}φ̇/m\), qui est un champ de vitesse valable pour \(ρ\), car il vérifie \(∂_tρ+∇_{sp}·(ρv_{sp})=0\). C’est d’ailleurs le seul champ de vitesse de \(ρ\) qui soit irrotationnel (tel que \(∇_{sp}∧v̇_{sp}=0)\), ce qui en fait le choix le plus simple (pas de composante inutile qui fait des boucles).

L’interprétation de de Broglie-Bohm est que la particule, de masse \(m\), est ponctuelle et que sa trajectoire suit le flux de \(ρ\). Dans ce cas, sur la trajectoire de la particule, \(v_{sp}\) coïncide avec la vitesse de la particule, et \(∇_{sp}ℏφ̇=mv_{sp}\) coïncide avec la quantité de mouvement de la particule. Il s’agit d’une coïncidence localement sur la trajectoire car \(v_{sp}\) et \(∇_{sp}ℏφ̇\) sont des champs définis dans tout l’espace, alors que la particule est ponctuelle. Selon cette interprétation, l’expérimentateur ne maîtrise jamais complètement les données initiales de son expérience : il ne parvient qu’à reproduire la densité \(ρ\) initiale, et la position initiale de la particule suit une distribution de probabilité égale à \(ρ\). Comme la particule suit le champ de vitesses de \(ρ\), les résultats suivent également une distribution de probabilité égale à \(ρ\) à l’arrivée.

L’interprétation de Copenhague est que la particule est présente simultanément en tout point de l’espace avec une densité de présence égale à \(ρ\). Selon cette interprétation, lorsque quelque chose mesure la position de la particule, le résultat de mesure est aléatoire, avec \(ρ\) comme distribution de probabilité. De plus, lors de la mesure, \(ρ\) est modifié pour refléter le résultat de mesure, de sorte que deux mesures successives donnent toujours le même résultat.

Sur la partie imaginaire, on a :

\(∂_tφ̇R\) = \((∇_{sp}²Ṙ\) \(- (∇_{sp}φ̇)²R)ℏ/2m\) - \(VR/ℏ\)
\(∂_tφ̇ℏ\) = \((∇_{sp}²ṘR^{-1}\) \(- (∇_{sp}φ̇)² )ℏ²/2m\) - \(V\)
\(∂_tφ̇ℏ\) = \(∇_{sp}²ṘR^{-1}(ℏ²/2m)\) \(- mv_{sp}²/2\) - \(V\) où on rappelle que \(ℏ∇_{sp}φ̇=mv_{sp}\)
\(∂_tφ̇ℏ\) = \(-\) \((Q+V)\) \(- mv_{sp}²/2\) \(Q=-∇_{sp}²ṘR^{-1}(ℏ²/2m)\)
\(∂_t∇_{sp}φ̇ℏ\) = \(-∇_{sp}(Q+V)\) \(- ∇_{sp}(mv_{sp}²/2)\)
\(∂_t(mv̇_{sp})\) = \(-∇_{sp}(Q+V)\) \(- ∇_{sp}(mv̇_{sp}·v_{sp})\)
\(∂_t(mv̇_{sp})\) = \(-∇_{sp}(Q+V)\) \(- (v_{sp}·∇_{sp})(mv̇_{sp})\) - \((∇_{sp}∧(mv̇_{sp}))·v_{sp}\) car \((A∧B)·C=A(B.C)-B(A·C)\)
\(∂_t(mv̇_{sp})\) = \(-∇_{sp}(Q+V)\) \(- (v_{sp}·∇_{sp})(mv̇_{sp})\) car \(v_{sp}=ℏ∇_{sp}φ̇/m\)
\((∂_t+v_{sp}·∇_{sp})(mv̇_{sp})\) = \(-∇_{sp}(Q+V)\)
\(Ḋ_t(mv̇_{sp})\) = \(-∇_{sp}(Q+V)\) \(Ḋ_t=∂_t+v_{sp}·∇_{sp}\) est la dérivée particulaire

Premièrement, l’apparition de la dérivée particulaire révèle que l’équation de Schrödinger est une équation de mécanique des fluides. En mécanique classique, les lois physiques fondamentales suivent les particules dans leur trajectoire et non pas un repère fixe. Mais, dans le cas de fluides, on utilise la dérivée particulaire pour exprimer ces lois dans un repère fixe pour des questions pratiques de calcul. Ici, on voit que l’équation de Schrödinger est déjà dans un repère fixe, et que les équations de Madelung sont sa forme équivalente qui suit les trajectoires.

Deuxièmement, l’équation ci-dessus est le principe fondamental de la mécanique classique : la dérivée temporelle de la quantité de mouvement est égale à la somme des forces. Par contre \(v_{sp}\) est ici un champ défini dans tout l’espace, comme pour un fluide. Ces forces dérivent ici d’un potentiel d’énergie \(Q+V\). Les forces de la mécanique classique dérivent du potentiel \(V\), donc les forces qui dérivent du potentiel \(Q\) sont des forces supplémentaires qui décrivent les nouveautés de la mécanique quantique. Pour cette raison, \(Q\) est appelé le potentiel quantique.

Regardons plus en détail ce potentiel quantique :

\(Q\) = \(-(ℏ²/2m)∇_{sp}²ṘR^{-1}\)
= \(-(ℏ²/2m)(∇_{sp}²ln(ρ)/2+(∇_{sp}ln(ρ)/2)²)\) car \(R=exp(ln(ρ)/2)\)
= \(-(ℏ/2)²(∇_{sp}²ln(ρ)+(∇_{sp}ln(ρ))²/2)/m\)

Comme on a des dérivées relatives, on va regarder des exemples de la forme \(ρ=e^{f(X)}\).

Pour \(ρ=e^{-(X/σ)²}\), on a :

\(Q\) =- \((ℏ²/2m)( ∇_{sp}²ln(ρ) /2\) + \((∇_{sp}ln(ρ) /2)²)\)
=- \((ℏ²/2m)(-∇_{sp}²(X/σ)²/2\) + \((∇_{sp}(X/σ)²/2)²)\)
= \((ℏ²/2m)( ∇_{sp}²(X²) /2σ²\) - \((∇_{sp}(X²) )²/4σ⁴)\)
= \((ℏ²/2m)( 9 /σ²\) - \((6X )²/4σ⁴)\)
= \((9ℏ²/2σ²m)(1 - X²/σ²)\)

Donc pour une distribution gaussienne, \(Q\) est un potentiel répulsif en \(-X²\). La distribution gaussienne est donc stable dans un potentiel en \(X²\) comme un oscillateur harmonique.

Pour \(ρ=e^{-(|X|/σ)}\), on a :

\(Q\) =- \((ℏ²/2m)( ∇_{sp}²ln(ρ)/2\) + \((∇_{sp}ln(ρ)/2)²)\)
=- \((ℏ²/2m)(-∇_{sp}²(|X|/σ)/2\) + \((∇_{sp}(|X|/σ)/2)²)\)
= \((ℏ²/2m)(\) - \(9/4σ²)\)
=- \((9ℏ²/8mσ²)\)

Donc pour une distribution exponentielle, \(Q\) est un potentiel constant. Cette distribution est donc stable en l’absence de forces classiques \((-∇_{sp}V=0)\). On la trouve sur les bords d’un puits de potentiel carré. C’est elle qui explique l’effet tunnel.

Pour ρ=e-(|X|/σ)+nln(|X|), on a :

\(Q\) =- \((ℏ²/2m)( ∇_{sp}²ln(ρ)/2\) + \((∇_{sp}ln(ρ)/2)²)\)
=- \((ℏ²/2m)(-∇_{sp}²(|X|/σ)/2\) + \(∇_{sp}²(nln(|X|))/2 + (∇_{sp}(nln(|X|)-|X|/σ)/2)²)\)
= \((ℏ²/2m)(\) + \(9n/2X² - 9n²/4X² - 9/4σ² + 9n/σ|X|)\)
= \((9ℏ²/2m)((n-n²/2)/2X²\) + \(n/σ|X| - 1/4σ²)\)

Donc pour \(n=2\), on a une force \(-∇_{sp}Q=9ℏ²/mσX²\) capable de compenser exactement l’attraction électrique \(q_{particule}q_{noyau}/4πX²ε_0\) d’une charge \(q_{noyau}\) placée en \(X=0\). Ce potentiel quantique permet ainsi d’expliquer la stabilité des atomes. On a trouvé ici une solution possible pour \(ρ\) pour l’électron dans l’atome d’hydrogène : \(ρ=X²e^-(|X/σ|)\) avec \(σ=36ℏ²πε_0/mq_{électron}q_{proton}\).

Enfin, on s’aperçoit que dans l’équation de Schrödinger, toutes les dépendances en \(ρ\) sont en fait des variations relatives de \(ρ\), que ce soit dans le temps ou dans l’espace. Donc, en ce qui concerne l’équation de Schrödinger, \(ρ\) est globalement défini à un facteur près. Le fait de normaliser \(ρ\) n’a donc pas d’effet sur la dynamique, ça n’est utile que dans l’interprétation de \(ρ\) comme une densité de probabilité.

Du coup, l’équation de conservation de \(ρ\) n’est pas nécessaire pour que \(ρ\) puisse être interprété comme une densité de probabilité : on peut considérer que la densité de probabilité est \(ρ/∫ρ\) et que \(ρ\) n’a pas besoin d’être normalisé. En revanche, l’équation de conservation de \(ρ\) est nécessaire pour garantir la localité de la dynamique, puisque sans elle, le terme \(∫ρ\) ne serait pas constant, et pourrait être affecté par des variations arbitrairement lointaines.

En conclusion, pour pouvoir donner un sens à l’équation de Schrödinger, on a posé \(v_{sp}=∇_{sp}φ̇ℏ/m\). Cela nous a permis d’interpréter la partie réelle de l’équation de Schrödinger comme l’équation de conservation de \(ρ\), et la partie imaginaire comme une extension quantique du principe fondamental de la dynamique.

On va donc considérer que la définition \(v_{sp}=∇_{sp}φ̇ℏ/m\) est en fait une équation physique sans laquelle l’équation de Schrödinger est incomplète.

La mécanique quantique non relativiste sans spin est ainsi décrite par le jeu d’équations suivant :

Ce sont les équations de Madelung.

Représentations avec spin dans l’espace en 3 dimensions

Représentation de Pauli (matricielle)

Dans l’espace en 3 dimensions avec spin, une particule est habituellement représentée par un champ de vecteurs complexes à 2 dimensions. L’amplitude de chacune des composantes correspond à la densité de probabilité de présence de la particule dans l’espace, avec un spin positif pour l’une, et négatif pour l’autre, dans le plan \(σ_1σ_2\) (axe \(z\)). Ces composantes sont notées \(ψ_+\) et \(ψ_-\).

L’équation d’évolution de ce champ dans un potentiel d’énergie \(V\) et un potentiel de quantité de mouvement \(A_{sp}\) est l’équation de Pauli :

\(iℏ∂_tψ=((σ·(iℏ∇_{sp}-A_{sp}))²/2m+V)ψ\)

\(σ_1\) = 0 1 , \(σ_2\) = 0 \(-i\) , \(σ_3\) = 1 0
1 0 \(i\) 0 0 -1

\(((σ·(iℏ∇_{sp}-A_{sp}))²\) est le carré de \(σ·(iℏ∇_{sp}-A_{sp})\) en tant qu’opérateur (ie. \(f²ψ=f(f(ψ))\)), \(σ·v=Σv^iσ_i\), \(v^i\) sont les coordonnées du vecteur \(v\), et \(σ_i\) sont les matrices de Pauli.

Note sur les représentations matricielles ou algébrique

Les matrices et les vecteurs sont des tableaux de nombres munis de certaines règlès de calcul. C’est la représentation matricielle.

Mais un vecteur n’est pas juste une séquence de nombres \(x^i\), car la même séquence de nombres peut représenter différents vecteurs, et un vecteur peut être représenté par différentes séquences de nombres. Dans la représentation matricielle, il manque en fait la donnée d’une base de vecteurs \(e_i\), telle que la séquence de nombres \(x^i\), associée à la base \(e_i\), représente le vecteur \(Σx^ie_i\). L’écriture \(Σx^ie_i\) est la représentation algébrique, plus précise.

Représentation de Pauli (algébrique)

L’étrange notation \(σ·v\) dans l’équation de Pauli indique que les composantes des vecteurs de l’espace, dans cette équation, font référence à la base \(σ_i\) au lieu de la base de l’espace \(ℝ³\).

Il se trouve que les matrices de Pauli génèrent une algèbre dans l’espace des matrices, et que cette algèbre est une représentation de l’algèbre géométrique sur ℝ³, où les \(σ_i\) sont les vecteurs de base de \(ℝ³\), avec \(σ_i²=1\). On va donc considérer que la base \(σ_i\) est la base de l’espace, munie d’une action sur \(ψ\). C’est cette action qui est représentée par les matrices de Pauli, et elle respecte la structure de l’algèbre géométrique.

L’équation devient alors simplement :

\(iℏ∂_tψ=((iℏ∇_{sp}-A_{sp})²/2m+V)ψ\) , avec un carré toujours en tant qu’opérateur

On va maintenant représenter \(ψ\) de manière algébrique. On ne connait pas a priori les vecteurs de base associés, mais on va voir qu’on peut les déterminer.

Pour commencer, on va écrire \(ψ=ψ_+e_++ψ_-e_-\), où \(e_+\) et \(e_-\) sont les vecteurs de base associés aux composantes \(ψ_+\) et \(ψ_-\).

En utilisant la représentation matricielle, on a :

\(σ_1ψ=ψ_+e_-+ψ_-e_+\)

En utilisant la représentation algébrique (on développe simplement le produit), on a :

\(σ_1ψ=ψ_+σ_1e_++ψ_-σ_1e_-\)

Donc \(e_-=σ_1e_+\) et \(e_+=σ_1e_-\), ce qui est cohérent car \(σ_1²=1\). Et on a :

\(ψ=(ψ_++ψ_-σ_1)e_+\)

De même, \(σ_3e_+=e_+\) et \(σ_3e_-=-e_-\), ce qui est cohérent car \(e_-=σ_1e_+\) et \(σ_3σ_1=-σ_1σ_3\).

Appliquer \(σ_2\) ne nous fournit pas plus d’information car \(σ_2=-iσ_3σ_1\), et on connait déjà l’action de \(i\), \(σ_1\) et \(σ_3\) sur \(e_+\) et \(e_-\).

En utilisant, \(σ_3e_+=e_+\), on obtient :

\(ψ=(ψ_++ψ_-σ_1σ_3)e_+=ψ_{Pauli}e_+\)

Par ailleurs, le calcul montre que \(σ_1σ_2σ_3=i\). Dans l’équation de Pauli, \(i\) est donc le pseudo scalaire de l’espace. Mais \(ie_+=iσ_3e_+=σ_1σ_2\), donc on peut aussi considérer que \(i\) est la multiplication à droite par \(σ_1σ_2\). Les nombres complexes \(ψ_±\) peuvent donc être interprétés comme des similarités du plan (1,2). Ainsi, \(ψ_{Pauli}\) peut être interprété comme une similarité de l’espace \(ℝ^3\).

L’équation de Pauli devient alors :

\(0=(iℏ∂_tψ_{Pauli}-((iℏ∇_{sp}-A_{sp})²/2m+V)ψ_{Pauli})e_+\) , avec un carré toujours en tant qu’opérateur

La multiplication par \(e_+\) projette sur la moitié de l’algèbre géométrique. Les termes restants sont une combinaison linéaire de \(e_+,σ_1σ_2e_+,σ_1e_+,σ_2e_+\). Plusieurs bases équivalentes peuvent être retenues, comme par exemple \(1,σ_1σ_2,σ_1,σ_2\). On choisira plutôt les grades pairs \(1,σ_1σ_2,σ_1σ_3,σ_2σ_3\), puis on peut retirer \(e_+\) :

\(iℏ∂_tψ_{Pauli}=((iℏ∇_{sp}-A_{sp})²/2m+V)ψ_{Pauli}\) , avec un carré toujours en tant qu’opérateur

En ce qui concerne les observables, on a :

Donc \(ψ_{Pauli}\), qui est un spineur de l’espace et qui représente donc une similarité de l’espace, représente directement les observables de la façon suivante :

Rétrospectivement, on aurait pu représenter les valeurs de \(ψ\) sans spin par des similarités de \(ℝ²\), ce qui correspondrait à une particule dont le plan de spin est (1,2) en tout point de l’espace-temps.

Représentations relativistes avec spin

Représentation de Dirac

Dans l’espace-temps, avec spin, une particule est habituellement représentée par un champ de vecteurs complexes à 4 dimensions, noté \(ψ\). Les opérateurs liés aux grandeurs physiques observables (vitesse, plan de spin, densité de présence de la particule) sont des matrices complexes 4x4, notée \(γ_i\), et appelées matrices de Dirac.

Comme avec la représentation de Pauli, les composantes complexes du champ \(ψ\) peuvent être divisées en deux parties, notées \(ψ_1\) pour les deux premières composantes, et \(ψ_2\) pour les deux autres. Les champs \(ψ_i\) peuvent alors être interprétées comme des champs représentant des configurations de la particule dans la représentation de Pauli.

L’équation de Dirac, qui décrit l’évolution du champ \(ψ\) dans un potentiel de quantité de mouvement \(qA\), est :

\((γ·(iℏ∇-qA))ψ-mcψ=0\)

\(cγ^0\) = 1 0 , \(γ^i\) = 0 \(σ_i\)
0 -1 -\(σ_i\) 0

\(A=Vγ^0-A_{sp}=ΣA_iγ^i\), \(γ·v=Σv_iγ^i\), \(v_i\) sont les coordonnées du vecteur \(v\), et \(γ^i\) sont les matrices de Dirac avec un facteur \(1/c\) pour \(γ^0\).

Représentation de Dirac (algébrique)

De même que pour la représentation algébrique de Pauli, les matrices de Dirac génèrent une algèbre dans l’espace des matrices, et cette algèbre est une représentation de l’algèbre géométrique sur l’espace-temps, où les \(γ^i\) sont les vecteurs de base de l’espace-temps, avec \(γ^0²=1/c²\) et \(γ^i²=-1\) pour \(i≠0\). On va donc considérer que la base \(γ^i\) est la base de l’espace-temps, munie d’une action sur \(ψ\). C’est cette action qui est représentée par les matrices de Dirac, et elle respecte la structure de l’algèbre géométrique.

L’équation devient alors simplement :

\((iℏ∇-qA-mc)ψ=0\)

De même que pour l’équation de Pauli, on va maintenant représenter \(ψ\) de manière algébrique :

\(ψ=ψ_1+ψ_2\) , où \(ψ_i=ψ_{Pauli,i}e_{+,i}\)

D’abord, on note que, pour \(i,j≠0\), on a :

\(cγ^0γ^i\) = 0 \(σ_i\) ; \(γ^iγ^j\)=-\(σ_iσ_j\) ; \(iI\) = 0 1 \(I=cγ^0γ^1γ^2γ^3\) ; \(cγ^0γ^iiI=σ_i\)
\(σ_i\) 0 1 0

De plus, \(e_{+,2}=iIe_{+,1}\), \(cγ^0e_{+,1}=e_{+,1}\), \(σ_3e_{+,i}=e_{+,i}\).

Notablement, on peut supprimer \(i\) comme suit : \(ie_{+,1}=iσ_3e_{+,1}=cγ^0γ^3iIie_{+,1}=-γ_1γ_2e_{+,1}\)

Comme précédemment, \(i\) est la multiplication à droite par \(-γ_1γ_2=σ_1σ_2\).

\(ψ\) = \((ψ_{Pauli,1}+ψ_{Pauli,2}iI\) \()e_{+,1}\)
= \((ψ_{Pauli,1}+ψ_{Pauli,2}cγ^0γ^3\) \()e_{+,1}\)
= \(ψ_{Dirac}e_{+,1}\) \(ψ_{Dirac}=ψ_{Pauli,1}+ψ_{Pauli,2}cγ^0γ^3\)

L’équation de Dirac devient alors :

\((iℏ∇-qA-mc)ψ_{Dirac}e_{+,1}=0\).

Continuons à éliminer \(i\) et mettons l’équation sous une forme indépendante du repère de réference \(γ_i\).

\((iℏ∇\) \(-qA-mc\) \()ψ_{Dirac}e_{+,1}=0\)
\((iℏ(∇ψ_{Dirac})ψ_{Dirac}^{-1}\) \(-qA-mc\) \()ψ_{Dirac}e_{+,1}=0\)
\((iℏ(∇ψ_{Dirac})ψ_{Dirac}^{-1}\) \(-qA-mψ_{Dirac}γ_0ψ_{Dirac}^{-1}\) \()ψ_{Dirac}e_{+,1}=0\) car \((γ_0/c)e_{+,1}=e_{+,1}\)
\((iℏ(∇ψ_{Dirac})ψ_{Dirac}^{-1}\) \(-qA-mv\) \()ψ_{Dirac}e_{+,1}=0\) \(v=ψ_{Dirac}γ_0ψ_{Dirac}^{-1}\)
\((-ℏ(∇ψ_{Dirac})ψ_{Dirac}γ^1γ^2ψ_{Dirac}^{-1}\) \(-qA-mv\) \()ψ_{Dirac}e_{+,1}=0\) car \(iγ^1γ^2e_{+,1}=σ_3e_{+,1}=e_{+,1}\)
\((-2(∇ψ_{Dirac})ψ_{Dirac}^{-1}S\) \(-qA-mv\) \()ψ_{Dirac}e_{+,1}=0\) \(S=ψ_{Dirac}γ_1γ_2ψ_{Dirac}^{-1}(ℏ/2)\)
\(( 2(∇ψ_{Dirac})ψ_{Dirac}^{-1}S\) \(+qA+mv\) \()ψ_{Dirac}e_{+,1}=0\)

La multiplication par \(e_{+,1}\) projette sur une moitié au choix de l’algèbre géométrique réelle (par exemple pair, impair, spatial ou temporel). On peut retirer \(e_{+,1}\) de l’équation ci-dessus car ce qui reste appartient à l’algèbre géométrique réelle de grades impairs :

\(2(∇ψ_{Dirac})ψ_{Dirac}^{-1}S+(qA+mv)=0\)

\(ψ_{Dirac}\) est un spineur de l’espace-temps, de même que \(ψ_{Pauli}\) était un spineur de l’espace. 1

Représentation de Dirac (algébrique, observables)

\(ψ_{Dirac}\) contient toutes les informations concernant la particule, codées dans un spineur de l’espace-temps. Pour faire apparaître ces informations, on va décomposer le spineur en

\(ψ_{Dirac}=ρ^{1/2}R_vR_SR_φe^{Iβ/2}\), où \(R_v\), \(R_S\), et \(R_ψ\) sont des rotors, tels que \(R_φ=e^{Ω_φ/2}=e^{(φ/2)γ_1γ_2}\) tourne d’abord dans le plan \(γ_1γ_2\), puis \(R_S=e^{Ω_S/2}\) tourne le plan \(γ_1γ~2\) dans \(S_{123}\), le plan de spin de l’espace \((γ_1,γ_2,γ_3)\) (Attention, on obtiendra le plan de spin de l’espace-temps \(S\), qu’après avoir tourné le plan de spin de l’espace \((γ_1,γ_2,γ_3)\) par \(R_v\) !), et enfin \(R_v=e^{Ω_v/2}\) tourne l’espace \((γ_1,γ_2,γ_3)\) dans l’espace propre de la particule. \(R_v\) tourne donc aussi \(γ_0\) dans la vitesse \(v\) de la particule.

D’un point de vue géométrique, on a décomposé \(ψ\) en une dilatation \(ρ^{1/2}\), une succession de rotations \(R_φ\),\(R_S\),\(R_v\), et le terme \(e^{Iβ}\) qui tourne dans le “plan” (scalaire,pseudo-scalaire). La succession de rotations est elle-même une décomposition naturelle d’un point de vue géométrique, puisqu’elle définit d’abord une rotation dans le plan \(γ_1γ_2\), puis ce plan est tourné dans l’espace \((γ_1,γ_2,γ_3)\) pour former au total une rotation de l’espace \((γ_1;γ_2;γ_3)\), puis cet espace est tourné dans \((γ_0,γ_1,γ_2,γ_3)\) pour former au total une rotation de l’espace-temps \((γ_0,γ_1,γ_2,γ_3)\) : c’est simplement une construction hiérarchique où on ajoute une dimension à chaque nouvelle rotation.

D’un point de vue physique, on a fait apparaître les observables :

Seule la variable \(β\) ne correspond à aucune observable connue, et c’est précisément le degré de liberté qui ne correspond pas à l’espace des similarités de l’espace-temps. On peut l’interpréter en considérant l’opérateur \(γ_5=iI\) qui transforme la fonction d’onde d’une particule en son anti-particule. On constate alors que les observables restent inchangées à l’exception de \(v\) qui change de signe, ce qui est équivalent à changer le signe de la charge \(q\), comme on pourait s’y attendre pour une anti-particule. De plus, \(β\) devient \(β+π\). On peut donc supposer que \(β\) décrit la probabilité de trouver une particule dans l’état particule ou anti-particule. Comme cet état est en général déterminé, on pourra supposer \(β\) constant.

En utilisant cette décomposition, on obtient :

\(2∇ψ_{Dirac}ψ_{Dirac}^{-1}\) = \(∇ρ/ρ\) + \(2∇Ṙ_vR̃_v\) + 2\(∇R_vṘ_SR̃_SR̃_v\) + \(2∇R_vR_SṘ_φR̃_φR̃_SR̃_v\) + \(∇βΙ\)
= \(∇ρ/ρ\) + \(∇Ω̇_v\) + \(∇R_vΩ̇_SR̃_v\) + \(∇R_vR_SΩ̇_φR̃_SR̃_v\) + \(∇βΙ\) car \(2Ṙ_iR̃_i=Ω_i\)
= \(∇ρ/ρ\) + \(∇v̇v^{-1}\) + \(∇R_vṠ_{123}S_{123}^{-1}R̃_v\) + \(∇φ̇R_vR_Sγ_1γ_2R̃_SR̃_v\) + \(∇βΙ\) car \(Ω̇_i\) est le bivector instantané qui tourne \(i\).2
= \(∇ρ/ρ\) + \(∇v̇v^{-1}\) + \(∇R_vṠ_{123}R̃_vS^{-1}\) - \(∇φ̇(ℏ/2)S^{-1}\) + \(∇βΙ\)
= \(∇ρ/ρ\) + \(∇v̇v^{-1}\) + \(∇\)Ṡ_{sp}$ - \(∇φ̇(ℏ/2)S^{-1}\) + \(∇βΙ\) \(Ṡ_{sp}=R_vṠ_{123}R̃_v\) 3

L’équation de Dirac est alors

\(0 = (∇lnρ)S + ∇v̇v^{-1}S + ∇Ṡ_{sp} - (∇φ̇(ℏ/2)+qA+mv) + ∇βΙS\)

Note, cette forme est peut-être importante :

\(0 = ∇(ρS)/ρ + ∇(v̇v^{-1}∧S) - (∇φ̇(ℏ/2)+qA+mv) + ∇βΙS\)

Équations d’évolution des observables de Dirac

Pour faire apparaître les équations d’évolution temporelle, on décompose sur les grades 1 et 3 et sur les composantes parallèles ou orthogonales à v et/ou S.

Conservation de \(ρ\) (Grade 3 // v∧S)

0 = \((v·∇)ρ̇/ρ+∇·v̇\)
0 = \((v·∇)ρ̇+ρ∇·v̇\)

\(∇·(ρv)=0\)

C’est l’équation de conservation de \(ρ\).

Cette équation définit l’évolution temporelle de \(ρ\). Elle prouve également que \(v\) est un champs de vitesse possible. On pourrait y ajouter des champs circulatoires qui ne modifient pas la distribution \(ρ\).

Évolution de la vitesse (Grade 1)

\(0 = (∇lnρ)·S + (∇∧v̇)·(v^{-1}S) + ∇·Ṡ_{sp} - (∇φ̇(ℏ/2)+qA+mv) + (S∧∇β)·Ι\)

Or,

\((∇∧v̇)·(v^{-1}S) = ∇·(v̇·(v^{-1}S))\) \(=\)4 \(∇·Ṡ_{tp}\)

Donc le grade 1 est :

\(0 = (∇lnρ)·S + ∇·Ṡ - (∇φ̇(ℏ/2)+qA+mv) + (S∧∇β)·Ι\)
\(0 = ∇·(ρS)/ρ - (∇φ̇(ℏ/2)+qA+mv) + (S∧∇β)·Ι\)

On va négliger le terme en β̇.

\(∇φ̇(ℏ/2)+mv+Q+qA=0\)

\(Q=-∇·(ρS)/ρ\)

On a reconnu le potentiel quantique \(Q\) de l’équation de Dirac. Il n’y a pas d’autre choix possible car on a l’équation du mouvement

\(∇∧(mv+Q+qA)=0\).

Évolution du spin (Grade 3 //v ⟂S)

\(∂_τṠ_{sp}\) = \(-(∇_{sp}∧v̇)×S + (I_{sp}·∇β̇c)×S\)
= \((-∇_{sp}∧v̇ + (I_{sp}·∇_Sβ̇c))×S\) \(∇_S=S^{-1}(S·∇)\)
= \((∇_{sp}∧u̇_{sp} + qB/m + (I_{sp}·∇_Sβ̇c))×S\)

On va négliger le terme en \(β̇\).

Le terme \(B×(qS/m)\) décrit la précession de Larmor.

Il nous reste une precession supplémentaire due au potentiel quantique via le bivecteur \(∇_{sp}∧u̇_{sp}\). C’est une précession de Larmor due au moment magnétique induit par le spin dans un gradient de \(ρ\).

Contrainte entre \(lnρ\) et \(S\) (Grade 3 ⟂v)

\(0 = -∂_slnρ - ∂_τv̇·s/c² + (s∧S)^{-1}·(∇∧Ṡ_{sp})\) = \(- ∂_τv̇·s/c² + (s∧S)^{-1}·(∇_{sp}∧ρS_{sp})/ρ\)

Cela semble lier la courbure moyenne de la surface de spin au gradient de \(lnρ\) le long du rayon de courbure.

On peut négliger \(∂_τv̇·s/c²\) en pratique car on aura \(∂_τv̇·s << c²\), ce qui nous donne :

\(0 = ∇_{sp}∧(ρS_{sp}) = (∇∧(ρS))_{sp}\)

Pour que l’équation de Dirac soit cohérente, il faut que cette contrainte soit maintenue lors de l’évolution temporelle des variables \(ρ\) et \(S\). On peut le vérifier en calculant

\(∂_τ(ρS)/ρ = ∂_τṠ + (∂_τlnρ)S\) = \(-(∇_{sp}∧v̇)×S -v^{-1}(∂_τv̇·S) - ∇·v̇S\)

\((∂_τ(∇∧(ρS)))_{sp}\) = \(-∇_{sp}∧((∇_{sp}∧v̇)×ρS + v^{-1}(∂_τv̇·ρS) + ∇·v̇ρS)_{sp}\) = ??

Origine physique du potentiel quantique

On remarque que \(∇·(∇·(ρS))=(∇∧∇)·(ρS)=0\), donc en posant \(u=-∇·(ρS)/ρm=Q/m\), on a \(∇·(ρu)=0\). On peut donc supposer que \(ρ(v+u)\) est le véritable flux de densité de présence, et l’équation du mouvement prend alors la forme naturelle suivante :

\(∇∧(m(v+u)+qA)=0\).

Cela prouve que le potentiel quantique \(Q\) peut mathématiquement s’interpréter comme un champs de vitesse supplémentaire. Nous allons voir que cette intérprétation a aussi une justification physique.

Supposons que la particule décrive un mouvement circulaire supplémentaire à \(v\), dans le plan \(S\), à la vitesse \(c\). Pour un moment cinétique de spin \(ℏ/2\), cela correspondrait à un rayon de \(r_{spin}=ℏ/2mc\). Pour un spin constant \(Ṡ=0\), \(u=S·∇ρ/ρm=cr_{spin}S̃·∇ρ/ρ=\frac{\oint ρv_{spin}dθ}{πρ}\). C’est 2 fois la moyenne du vecteur \(v_{spin}\) pondérée par \(ρ\).

Lorsque la particule effectue son mouvement circulaire de spin, elle traverse des régions où \(ρ\) est variable, ce qui biaise sa moyenne qui n’est alors pas nulle ! À un facteur 2 près qui semble être le facteur gyromagnétique, \(u\) représente la vitesse supplémentaire moyenne due au spin dans un gradient de \(ρ\).

Lorsque \(S\) varie, le mouvement de spin n’est peut-être alors plus circulaire, mais suivrait le plan de spin au cours de sa circonvolution. On peut supposer que le terme \(∇·Ṡ/m\) dans \(u\) représente la vitesse supplémentaire moyenne due au spin dans un gradient de \(S\).

On va donc supposer que le champs de vitesse total de la particule est \(v'=v+u\). Voyons maintenant quelle est la dynamique de \(v'\).

Principe Fondamental de la Dynamique (Dirac)

L’équation des géodésique de la relativité générale est \((∇∧(mv))·v=0\).

Avec le champs électromagnétique, cela donne \((∇∧(mv+qA))·v=0\).

Ici, nous avons \(∇∧(mv'+qA)=0\). On va donc contracter par v’ :

\((∇∧(mv'+qA))·v'=0\)

\(m∂_{τ'}v̇'_{sp'} = qF·v' + ∇_{sp'}(\frac{1}{2}mv'²)\)

\(m∂_{τ'}v̇'_{sp'} = qF·v' + ∇_{sp'}(Q·v+Q²/2m)\)

\(Q²/2m\)

\(Q²\) $ =$ $ (∇·(ρS)/ρ)²$
\(=\) \((∇·Ṡ)² + ((∇lnρ)·S)²\)
\(=\) \((∇·Ṡ)² - ((∇_Slnρ)²S²\)

\(Q²/2m\) \(=\) \((∇·Ṡ)²/2m - ((∇_Slnρ)²S²/2m\)

Le terme \(-((∇_Slnρ)²S²/2m\) une partie du potentiel quantique de Madelung. Cela prouve que la nécessité du terme \(Q²/2m\), qui vient de la contraction par \(v'\) au lieu de \(v\). Cela constitue une argument fort de plus pour considérer \(v'\) au lieu de \(v\) comme le bon champs de vitesse de la particule.

\(Q·v\)

\(v·Q\) \(=\) \(-(v∧∇)·(ρS)/ρ\)
\(=\) \(-(v∧∇)·Ṡ\)
\(=\) \(+(∇∧v)·Ṡ\)
\(=\) \(-(∇∧v̇)·S\) car \(∇·(v·S)=0\)
\(=\) \((∇∧u̇)·S+F·(qS/m)\)

Le terme \(F·(qS/m)\) est le potentiel d’énergie du dipôle magnétique de la particule, de moment magnétique \(qS/m\), dans le champs électromagnétique externe \(F\).

On voit que le terme \(∇_{sp}∧u̇_{sp}\) intervient à la fois dans l’évolution de la vitesse et dans celle du spin. Dans les deux cas, ce terme s’ajoute à \(∇_{sp}∧qA_{sp}/m\), et agit en quelque sorte comme un champs magnétique supplémentaire.

\((∇∧u̇)·S\) \(=\) \(-(∇∧((∇lnρ)·S + ∇·Ṡ))·S/m\)
\(=\) \(-(∇_S²lnρ)S²/m - (∇_S∧(∇·\ddot{S}))·S/m\)

Le terme \(-(∇_S²lnρ)S²/m\) est la deuxième partie du potentiel quantique de Madelung.

Potentiel d’énergie total

En rassemblant les différents termes, on obtient :

\(m∂_{τ'}v̇'_{sp'} = qF·v' + ∇_{sp'}(V_{quantique} + V_{dipôle\_spin})\)

\(V_{dipôle\_spin}=F·(Sq/m)\)

\(V_{quantique}=-(\frac{1}{2}(∇_Slnρ)² + (∇_S²lnρ)S²/m + (∇·Ṡ)²/2m - (∇_S∧(∇·\ddot{S}))·S/m\)

Ceci est la généralisation de la deuxième équation de Madelung relativiste avec spin.

Le potentiel d’énergie quantique a deux termes supplémentaires dépendant de \(∇·Ṡ\), la torsion moyenne du champs de spin.

Les deux premiers termes sont ceux du potentiel quantique de Madelung, mais restreints au dérivées dans le plan de spin. Or, la composante \(s∧S\) de l’équation de Dirac est, dans la limite classique, \(0 = ∇_{sp}∧(ρS_{sp})\). En supposant \(∇_{sp}∧Ṡ_{sp}=0\), cela nous donne \(∂_{s}lnρ=0\). Donc les dérivées hors plan de spin sont manquantes car nulles dans le contexte des équations de Madelung. Cela termine la démonstration qu’on obtient bien les équations de Madelung dans la limite classique à spin constant.

Problèmes

Il semble étonant que la densité de probabilité soit constante dans la direction du spin. Cela impliquerait que \(ρ\) soit constant le long des lignes de spin. Pour que \(ρ\) soit localisée, les lignes de spin devraient donc être fermées, ce qui viole la supposition \(∇_{sp}∧Ṡ_{sp}=0\). Donc \(∇_{sp}∧Ṡ_{sp}≠0\) et \(∂_{s}lnρ≠0\).

De plus, l’effet tunnel est expliqué par le fait que le potentiel quantique annule la barrière de potentiel classique. Or, si les dérivées de \(lnρ\) sont restreintes au plan de spin, l’effet tunnel aussi. Cela ne semble pas correspondre à la réalité.

Il semble donc que le potentiel quantique d’énergie dans l’équation de Dirac soit incomplet : il faudrait rajouter les termes en \(∂_{s}lnρ\) comme dans le potentiel quantique de Madelung. Cependant, le fait de pouvoir interpréter \(u\) comme faisant partie du champs de vitesses dépend de la propriété \(∇·(ρu)=0\), qui vient de la projection sur \(S\) dans la définition de \(u\). Donc la définition de \(u\) semble correcte.

On peut donc chercher les termes manquants dans les termes en \(∇·Ṡ\). Il faudrait par exemple \(∇_S·Ṡ_{sp}=(ℏ/2)∇_slnρ\), pour compléter \((∇_Slnρ)²\). Cela serait suffisant pour rétablir l’effet tunnel dans toutes les directions.

Références

Ce travail a été inspiré par les précédents travaux de David Hestenes, pionnier dans le domaine, Anthony Lasenby et Chris Doran avec leur livre “Geometric algebra for physicists” que je recommande, ainsi que, dans une moindre mesure, G. Salesi avec son papier “Spin and Madelung fluid”.