Formalisme: les opérateurs

Site en travaux

Contenu

La notion d’opérateur linéaire sur un espace vectoriel

Un opérateur O est une application de l’espace vectoriel E sur lui même, autrement dit une application qui fait correspondre un vecteur |Ψ> à un vecteur |Φ>:

O|Ψ> = |Φ>

Un opérateur agit sur les éléments d'un espace vectoriel
Un opérateur agit sur les éléments d’un espace vectoriel

Pour |Ψ> donné, |Φ> est unique. Mais la réciproque n’est pas nécessairement vraie: le même opérateur O peut « envoyer » deux vecteurs différents sur le même vecteur de destination.

Cet opérateur O est dit linéaire si (pour tous les scalaires α et β et tous les vecteurs |Φ> et |Ψ>) on a

O( α|Φ> + β|Ψ> ) = α O|Φ> + β O|Ψ>

Si |Ψ> = Σj αj |j>, quelles sont les composantes βi de |Φ> = O|Ψ> ? Par définition, βi* = <i|Φ> et donc:

βi* = <i|Φ> = <i| O |Ψ> = <i| O ( Σj αj |j>) = Σj αj <i| O |j> =Σj αj Oij

En effet |j> est un vecteur, O|j> également, <i| une forme linéaire et donc <i|O|j> est un scalaire (un nombre) que l’on peut noter Oij. L’ensemble de toutes les valeurs Oij pour toutes les valeurs de i et de j définit l’opérateur O. Pour un espace vectoriel de dimension n, ces valeurs Oij se rangent dans un tableau carré à n lignes et n colonnes, autrement dit une matrice carrée.

Dans le vocabulaire des matrices, un vecteur est une matrice-colonne, une forme linéaire, une matrice-ligne, un opérateur une matrice carrée et la relation βi* = Σj αj Oij un produit matriciel.

Bien entendu, les composantes d’un vecteur comme les éléments matriciels d’un opérateur dépendent de la base choisie.

Un opérateur O peut agir sur un bra <Φ|. On définit son action de la manière suivante:

[<Φ|O] |Ψ> = <Φ| [O |Ψ>] = <Φ| O |Ψ>

En intercalant deux fois l’opérateur Identité   Σi |i><i|

<Φ| O |Ψ> = <Φ| Σi |i><i| O Σj |j><j| |Ψ> = Σi Σj <Φ|i><i| O |j><j|Ψ> = Σi Σj βi* Oij αj

Le résultat ne dépend pas du fait que l’on somme d’abord sur i ou d’abord sur j, ce qui justifie la définition.

Opérateurs conjugués

Si on a un opérateur O tel que O|Ψ> = |Φ>, existe-t-il un opérateur O† qui, appliqué sur le bra <Ψ| donne le bra <Φ| ? Oui, mais O† diffère en général de O. C’est le conjugué (hermitien) de O.

Ses éléments de matrice sont simples à calculer, connaissant ceux de O.

O |i> = |k>  ➛  Oij = <j| O |i> = <j|k>

➛ <i| O† = <k|

➛ O†ij = <i| O† |j> = <k|j> = <j|k>*   (conjugaison complexe)

➛ O†ij = Oji*

La matrice de O† est donc la transposée de la matrice de O (i⇌j) dont les éléments sont remplacés par le conjugué complexe (transconjuguée).

Il se peut que les opérateurs O et O† soient identiques, on dit alors que l’opérateur est hermitien. En ce cas, les éléments diagonaux de la matrice sont réels et les éléments non-diagonaux sont complexes conjugués. Si O = –O†, on dit que O est antihermitien. Les opérateurs hermitiens jouent un rôle central en physique quantique car ils correspondent aux observables (les quantités physiques que l’on peut observer et mesurer).

Opérateurs orthogonaux et unitaires

Un opérateur O est unitaire si OO† = I (et donc également OO = I).

Exemples:

  • Permutations
  • Rotations

Vecteurs propres et valeurs propres

Vecteurs propres

Un vecteur propre |λ> d’un opérateur O donné est un vecteur tel que cet opérateur appliqué à lui redonne le vecteur de départ, à une constante près:

O |λ> = λ |λ>

où le même nom a été donné au vecteur propre |λ> et à la constante de proportionnalité λ qui est un nombre complexe. On le fait souvent, quand il n’y a pas de risque d’ambigüité, mais cela n’a rien d’obligatoire. Cette constante de proportionnalité s’appelle la valeur propre de l’opérateur O relative au vecteur propre |λ>. Si |λ> est un vecteur propre de l’opérateur O, le vecteur α|λ> (où α est un nombre complexe quelconque) est aussi un vecteur propre de O, avec la valeur propre αλ.

Un opérateur donné peut avoir (et c’est en général le cas) plusieurs vecteurs propres différents, ou ne pas avoir de vecteur propre du tout. Des vecteurs propres différents peuvent correspondre à une même valeur propre, on dit alors qu’ils sont dégénérés.

Spectre des valeurs propres

Tout opérateur O tel que OO† = OO (on dit que l’opérateur est normal) est diagonalisable: cela signifie qu’il existe une base (orthonormée) de l’espace vectoriel formé par les vecteurs propres. L’ensemble des valeurs propres correspondantes (le spectre) est un ensemble de nombres

  • réels si O est hermitien,
  • imaginaires purs si O est antihermitien,
  • et complexes de module 1 si O est unitaire.

Il est immédiat de démontrer que les valeurs propres d’un opérateur hermitien sont toutes réelles: en effet, de façon générale: O |λ> = λ |λ> ⇒ <λ|O† = λ* <λ|

⇒ <λ| O |λ> = λ <λ|λ> d’une part,

et <λ| O† |λ> = λ* <λ|λ> d’autre part

Mais si O est hermitien, O = O† ⇒ λ = λ* ⇒ λ est réel.

C’est l’origine du rôle essentiel joué en mécanique quantique par les opérateurs hermitiens: leurs valeurs propres sont des nombres réels, pouvant correspondre à des résultats physiques.

Il est également immédiat de montrer que des valeurs propres différentes d’un opérateur hermitien correspondent à des vecteurs propres orthogonaux. Si on a O |λ> = λ |λ> et O |μ> = μ |μ> avec λ≠μ, alors:

<μ| O |λ> = λ <μ|λ>

<μ| O† |λ> = <μ| O |λ> = μ <μ|λ>

⇒ [λ – μ ] <μ|λ> = 0 ⇒ <μ|λ> = 0

Qubits

À faire

Espace vectoriel en 2 dimensions

  • Application K0 Ǩ0 vs. KL KS
  • Spin-isospin
  • Matrices de Pauli

Plusieurs qubits

  • Espace de Fock

État à deux qubits

Ils sont engendrés par le produit tensoriels des espaces d’états à un qubit, et la base est donc formée des états |00>, |01>, |10> et |11>.

Certains états sont des produits d’états à 1 qubit:

(a|0> + b|1>) ⊗ (c|0> + d|1>) = ac|00> + ad|01> + bc|10> + bd|11>

Mais d’autres ne sont pas des produits d’états à 1 qubit, par exemple:

(|00> + |11>)/√2

Un tel état est dit intriqué, ou non-séparable, et il est l’objet du paradoxe d’Einstein, Podolsky et Rosen.

La « mesure »

À faire

  • Projection d’un état
  • Observables
  • Commutateurs

Observables

À chaque propriété physique observable d’un système correspond un opérateur hermitien sur l’espace vectoriel des états. C’est un postulat de la mécanique quantique, dont la conséquence est d’assurer que toutes les quantités mesurées qui sont des valeurs propres des opérateurs) sont des nombres réels et non complexes.

Valeur moyenne <Ψ|O|Ψ>

Vecteurs propres et valeurs propres O|λi> = λi |λi>

|Ψ> = Σi |λi><λi||Ψ> = Σi pi |λi> ⇒ <Ψ|O|Ψ> = Σi Σj pj* pi <λj|O| |λi> = Σi Σj pj* pi λi <λj|λi> = Σi pi* pi λi

À faire

  • Amplitude de probabilité
  • Interférences
  • Ondes ?

Physique classique = états non superposables -> inconnu ⇔ probabilités. Ici amplitude probabibilité ≠ inconnu. Donc pas question d’incertitude (de qui d’ailleurs?)

  • Ex « paquet d’ondes »
  • Double fente?
  • Les « dés » d’Einstein = conséquence du fait que les états appartiennent à un espace vectoriel
  • Ensemble complet d’observables qui commutent: tout ce que l’on peut connaître simultanément d’un système quantique
  • Origine du quantum d’action h ?
  • Origine du commutateur [X,P]=ih et de cette égalité à l’inégalité de Heisenberg
  • Fonction d‘onde ψ(x) ⇔ <x|Ψ>

Questions sur les probabilités

Shut up and calculate!

  • « Limite classique »
  • Interprétation de de Broglie, Schrödinger et Bohm
  • Interprétation de Born
  • Interprétation « de Copenhague »

Influence sur Bohr de la philosophie de Kierkegaard (le philosophe ne peut être un observateur impartial détaché du monde sur lequel il construit sa philosophie, il est nécessairement un participant; la limite entre subjectivité et objectivité est purement arbitraire, et toute action est une suite de décisions modifiant le monde), ainsi que de la psychologie de William James (lequel souligne aussi l’absence de démarcation nette entre observateur et monde observé, ainsi que l’influence incontrôlable de l’observateur sur la situation qu’il observe). Influence également de Mach et des positivistes de l’École de Vienne: une assertion n’a de sens que si elle peut être vérifiée empiriquement (cf. Wittgenstein: « Ce dont on ne peut parler, il faut le taire »).

Heisenberg résuma ce point de vue dans son livre Physique et philosophie en 1958.

La mécanique quantique comme théorie des probabilités

[D’après Scott Aaronson] Voir aussi le théorème de Gleason.

Selon Aaronson , la mécanique quantique n’est pas une théorie de la matière ou de l’énergie, des ondes ou des particules, mais une théorie qui traite de l’information, de ce qui est observable et des (amplitudes de) probabilités. Il soutient qu’elle aurait pu être inventée par les mathématiciens du 19° siècle s’ils avaient voulu géénraliser les probabilités des nombres réels positifs aux nombres complexes. Mais faute de pression expériementale, ce pas n’a pas été accompli. Aaronson présente aussi la mécanique quantique comme l’équivalent d’un système d’exploitation d’un ordinateur, la mécanique classique en étant un autre, les théories de l’électromagnétisme ou la thermodynamique étant alors l’équivalent de logiciels adaptés à ce système d’exploitation, et le portage d’une théorie d’un système à l’autre étant la « qauntification ».

Les probabilités des événements 1, 2,… N étant p1, p2, …, pN, on peut construire (au moins) deux théories des probabilités selon la norme utilisée:

  • 1-norme |pi| ➛ normalisation: ∑i |pi| =1
  • 2-norme pi2 ➛ normalisation: ∑i pi2 =1

Pour 2 événements (qu’on appellera pile et face avec une pièce de monnaie, |+> et |-> en mécanique quantique et 0 et 1 en informatique), les probabilités sont p et 1-p avec la 1-norme, et a et b (avec a2+b2=1) avec la 2-norme. La différence entre 1-norme et 2-norme devient apparente quand on effectue des transformations dans l’espace des états.

Pour un espace des états à 2 dimensions, les transformations possibles sont représentées par des matrices 2×2. Dans la théorie classique des probabilités, qui utilise la 1-norme, la matrice la plus générale transformant un vecteur de 1-norme 1 en vecteur de 1-norme 1 (pour conserver la probabilité) est une matrice (dite stochastique) dont les coefficients sont des nombres réels positifs et dont la somme des colonnes = 1. La permutation est ainsi représentée par la matrice P=(0 1, 1 0). Une matrice stochastique n’est pas nécessairement inversible, ce qui traduit une irréversibilité (une perte d’information).

Avec la 2-norme, la matrice la plus générale transformant un vecteur de 2-norme 1 en vecteur de 2-norme 1 (pour conserver la probabilité) est une matrice orthogonale (une matrice égale à la transposée de sa matrice inverse) si les coefficients sont des nombres réels, ou une matrice unitaire (égale à la transconjuguée de sa matrice inverse).

En employant la notation de Dirac, un qubit quelconque (une pièce de monnaie dont les probabilités suivent une 2-norme) peut s’écrire:

a|0>+b|1>

Une rotation de 45° (la « moitié » d’une rotation de 90° qui est une permutation des rôles) est représentée par la matrice

U = (1 -1 , 1 1)/√2

⇒ U |0> = {|0> + |1>}/√2 ⇒ état indéterminé?

⇒ U U |0> = {|0> + |1> – |0> + |1>}/2 = |1> ⇒ état déterminé?

La situation peut se décrire en termes de superposition d’états et d’interférences entre ceux-ci: appliquer U à l’état |0> conduit à une superposition des états |0> et |1>, l’appliquer une deuxième fois conduit à une interférence destructrice entre les états |0> et une interférence constructrice entre les états |1>.

Cette situation ne peut jamais se présenter avec des probabilités classiques (1-norme) qui sont toujours des nombres (réels) positifs et ne peuvent donc jamais se compenser.

Question immédiate: pourquoi ne pas utiliser une 3-norme, ou une 4-norme? Les seules transformations linéaires conservant une n-norme (∑i [pi|n =1) sont, à une phase près, les permutations des vecteurs de base pour n≠1 et n≠2, conduisant à des théories sans intérêt (« triviales »). Ceci rappelle le théorème de Fermat (xn+yn=zn n’a de solution entière non triviale que pour n=1 et n=2). Généraliser à des transformations non-linéaires introduirait un comportement potentiellement chaotique où des vecteurs arbitrairement proches pourraient diverger de manière illimitée.

Autre question immédiate: pourquoi utiliser des nombres complexes? Pour que toute transformation linéaire unitaire U puisse être le produit de deux transformations linéaires unitaires V (i.e. V2=U), ce qui est l’équivalent d’une exigence de continuité des transformations, qu’elles puissent être éventuellement infinitésimales. La symétrie miroir U = (1 0, 0 -1) ne correspond à aucun V telle que V2=U, sauf à autoriser des coefficients complexes.

 

 


Contact: lettreani
Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

w

Connexion à %s