Dispense per il corso di Filosofia della Fisica (parte II): La struttura formale della teoria Mauro Dorato, Dipartimento di Filosofia, Università di Roma3 NB Le note che seguono sono per uso strettamente didattico e non sono state ancora controllate in modo accurato. Si prega quindi di non far circolare il materiale che segue e di non usarlo per citazioni. Aggiornate al 02/02/2014
Generalizzazione a infinite dimensioni Sia f n (x) lapprossimazione discreta alla curva continua f(x), che rappresenta lo spostamento di una corda fissata nei punti a e b. Gli n valori delle f n (x i ) coincidono con f(x) solo in n punti dellasse x e sono 0 tra i punti; lennupla f n (x i ) corrisponde alle componenti di un vettore ket | f n (x)> f n (x i ) x a b I vettori di base in questo spazio sono che corrispondono alla funzione a scala che vale 1 ad x = x i e 0 altrove. Immaginiamo uno spazio con n assi, tale che per ogni x i ci sia un asse coordinato perpendicolare a ogni altro x j f(x)
La funzione f n (x) è un vettore le cui componenti lungo gli assi coordinati x i sono f n (x i ), ovvero le proiezioni nella direzione individuata da quegli assi Per ogni approssimazione g n (x) cè un ket |g n > definito come sopra, e viceversa, e si può definire una somma di funzioni e un loro prodotto con uno scalare. Lo spazio di funzioni discrete risultante è uno spazio vettoriale lineare. Definiamo in esso un prodotto interno e una norma, assumendo f e g funzioni complesse: Se n tende allinfinito, la somma di n termini diventa una somma di infiniti termini, e diventa desiderabile che, per spazi vettoriali infinito-dimensionali, il prodotto interno e la norma siano finiti, ovvero che la successione (somma) corrispondente converga in modo opportuno a un elemento dello spazio medesimo
Se vogliamo calcolare in modo approssimato larea compresa dalla curva che rappresenta il prodotto delle due funzioni fg, dobbiamo sommare n aree di n rettangoli, ognuno di altezza f(x i )g(x i ) nei vari punti x i e di basi tutti uguali, date da (b-a)/n+1 Quando n va allinfinito, f = f, la sommatoria degli n termini diventa un integrale, e la base dei rettangoli (a-b)/n+1 diventa un infinitesimo dx fg(x i ) a fg(x) b Anche in questo caso, dobbiamo richiedere che lultimo integrale non sia infinito (non diverga), ma che sia a quadrato sommabile
Per trovare le condizioni di normalizzazione e la condizione di ortogonalità tra due basi in spazi infinito-dimensionali, scriviamo la relazione di completezza nel caso in cui x vari con continuità, ovvero decomponiamo loperatore di identità facendo infinite somme di tanti infinitesimi dx, passando dunque dalla somma finita di termini all integrale: Ora moltiplichiamo scalarmente entrambi i membri dellequazione qui sopra per qualche ket arbitrario |f >a destra, e per una base bra <x| a sinistra, e otteniamo Lultima uguaglianza si spiega con il fatto che la proiezione di f lungo lasse |x> è proprio f(x). Analogamente, = f (x). Si ponga il prodotto interno tra le due basi uguale a una funzione sconosciuta x, x) che dipende solo dalle due basi:
Riscriviamo ora lultimo integrale facendo le debite sostituzioni Ora lortogonalità tra due basi impone che = x, x) = 0 quando x è diverso da x. Dunque il secondo integrale è non nullo solo in un intorno infinitesimo di x = x. Lintervallo di lunghezza finita (b-a) in cui lintegrando è non nullo si restringe quindi a un intervallo infinitesimo centrato in x e di lunghezza 2 Nella regione infinitesima in questione, se f è sufficientemente liscia, f(x) può essere approssimata dalla funzione f(x), che per un x dato è costante, e può essere portata fuori dal segno di integrale
Se lintegrando fosse finito, essendo lintervallo di integrazione x+ – x– 2 infinitesimo, anche lintegrale sarebbe infinitesimo. Allora affinché lintegrale dia 1, nella regione compresa tra x+ e x- lintegrando deve avere valore infinito ed essere nullo al di fuori, a causa della condizione di ortogonalità. Poiché la funzione x, x dipende solo dalla differenza tra x e x, riscriviamola come x-x). La funzione con le seguenti due proprietà è detta delta di Dirac La condizione di normalizzazione in spazi infiniti è quindi (vedi il box blu due slides prima)
Per ottenere una formulazione alternativa della delta di Dirac, definiamo la seguente funzione, detta trasformata di Fourier (la prima delle due equazioni qui sotto) e la sua inversa (la seconda) Ora sostituiamo la prima equazione nella seconda: Limplicazione qui sopra vale perché avevamo visto che
Se D =df/dx, nello spazio vettoriale di funzioni lapplicazione delloperatore lineare D fornisce ancora una funzione, data dalla derivata della funzione data. Troviamo ora gli elementi della matrice che corrisponde alloperatore D nella base |x>, moltiplicando per <x| da ambo le parti dellequazione qui sopra, e ricordandoci che Mostriamo ora che vale la eguaglianza nel box rosso
Deriviamo anzitutto la funzione delta rispetto al suo primo argomento Confrontando i tre box rossi e tenendo conto che = f(x)si ha Lultima uguaglianza è spiegata nella pagina seguente! Ora moltiplichiamo ambo i membri per f(x) e poi integriamo su x, invertendo lordine dellequazione Questa uguaglianza vale perché avevamo mostrato che
Riprendendo lespressione nel primo box della scorsa pagina ricordando che e ponendo al posto di f la sua derivata, si ha Confrontando la prima e la terza equazione, si ha lultima uguaglianza della pagina precedente, che quindi va pensata come da moltiplicare per una funzione f(x) da ambo le parti e da integrare su x
Gli elementi della matrice infinito-dimensionale corrispondente alloperatore differenziale D nella base |x> sono quindi Come si vede, loperatore differenziale opera su funzioni f applicando ad esse d/dx. Se D xx fosse hermitiano, si dovrebbe avere D xx = D = D* xx Ma D xx = (x-x), mentre D * xx = [ (x-x)]*= (x- x)= - (x- x) Per recuperare una condizione necessaria allhermiticità consideriamo allora un nuovo operatore K=-iD Sostituendo al posto dellelemento D xx il valore appena trovato si ha
Non possiamo ancora essere sicuri che loperatore K sia hermitiano, perché in uno spazio vettoriale a dimensione infinita, si devono verificare condizioni di convergenza supplementari, per le quali rimandiamo ai testi in bibliografia (Byron e Fuller, per es.). Studiamo invece il problema agli autovalori per K =-iD= -idf/dx La soluzione di questa equazione è dove A è una costante da normalizzare in seguito: verifichiamo prima che la soluzione è corretta derivandola
Per ogni numero reale k si ha dunque un autovalore e l autofunzione data da Ae ikx può essere normalizzata scegliendo A= (1/2 ) -1/2 cosicché lautofunzione (autovettore) sia Funzioni f scritte nella base X, e che hanno quindi componenti = f (x), possono essere scritte nella nuova base k, con componenti Per tornare alla base X, si applica la trasformata inversa di Fourier Si passa al bra
Visto che si ha Introduciamo ora un operatore X con autovettori |x> e autovalore x ; per vedere come agisce X su funzioni f, X|f>= f scriviamo lelemento matriciale =x = x x-x) e poi calcoliamo la componente di f=X|f > in base x Leffetto di X su f è di moltiplicare f per x Inserendo lidentità I al posto giusto
Mostriamo ora che i due operatori K e X sono coniugati, ovvero, dopo aver visto che nella base X, X moltiplica per x la funzione f e K agisce su f come –id/dx, vediamo che nella base K, X agisce come id/dx mentre K agisce moltiplicando la f per k. Calcoliamo gli elementi matriciali di X nella base K. Ricordando che X|k>=x|k> Integrando la prima e la terza espressione dellultima formula e moltiplicando per f(k), si ottiene ciò che si voleva dimostrare, ovvero che lazione di K nella base k è data dalla moltiplicazione per k
Mostriamo infine che [X,K] = iI, ovvero che i due operatori coniugati non commutano Confrontando la prima e lultima espressione nel box si ha il risultato che si voleva dimostrare
Spazio di Hilbert Def. Uno spazio di Hilbert è uno spazio vettoriale infinito- dimensionale di funzioni a valori complessi che sia (i) dotato di prodotto scalare, (ii) completo e (iii) separabile Poiché in MQ le osservabili fisiche di un sistema sono operatori in uno spazio di Hilbert mentre gli stati fisici di un sistema sono vettori o funzioni in uno spazio di Hilbert, dobbiamo definire questultima entità matematica Def. Uno spazio vettoriale dotato di prodotto scalare si dice completo se ogni successione di suoi elementi che soddisfi al criterio di Cauchy converge a un elemento dello spazio Def. Uno spazio vettoriale V dotato di prodotto scalare si dice separabile se esiste un insieme numerabile di suoi elementi che sia ovunque denso in V
In generale, e intuitivamente, in presenza di spazi vettoriali infinito- dimensionali, ci dobbiamo assicurare che il limite S di somme parziali fatte su n elementi esista Una successione arbitraria di infiniti elementi a i soddisfa il criterio di Cauchy se, per ogni > 0 esiste un intero n( tale che si abbia | a r – a s | n e s > n. In altre parole, dopo un certo elemento della successione a n la distanza tra due elementi qualsiasi della successione che vengano dopo a n è piccola quanto si vuole (ovvero minore di ogni numero positivo ). Definiamo la completezza …
La completezza è importante per ragioni di chiusura: per esempio, successioni di numeri razionali convergenti nel senso di Cauchy, potrebbero convergere a numeri non razionali e quindi a numeri fuori dallo spazio: completare lo spazio dei razionali allora significa metterci dentro gli irrazionali. Uno spazio vettoriale V dotato di prodotto scalare si dice separabile se esiste un insieme numerabile di suoi elementi che sia denso in V Un insieme E di elementi appartenenti a uno spazio vettoriale dotato di prodotto scalare V si dice ovunque denso in V se ogni elemento di V è un punto di accumulazione di elementi di E, ovvero ogni elemento v di V è tale che, per ogni > 0 esiste almeno un elemento w di E tale che |v-w| < Ora definiamo la separabilità In una parola, la separabilità di V implica che ogni suo elemento v è limite di una successione convergente di elementi che appartengono a un insieme numerabile E di elementi di V
confronto mecc.classica m. quantistica Spazio degli stati Spazio delle fasi a 6n dimensioni (per n particelle) Spazio di Hilbert H Stato puroPunto nello spazio delle fasi Vettore normalizzato in H Osservabile A f A : R Operatore hermitiano A: H H Valori possibili di osservabili Codominio della funzione a valori reali f A (un continuum di valori) (i) A ha spettro discreto e ha autovettori: i valori possibili sono gli autovalori di A (ii) A ha spettro continuo Domanda sperimentale la misura di A è in Sottoinsieme di f A -1 ( Sottospazio L o proiettore di H L A H Risposta alla domanda sperimentale Risposta sì/no sì se e solo se f A ( Risposta probabilistica P v (A, v|P A
Mecc. ClassicaMeccanica quantistica Postulato di misura La misurazione della variabile lascia sostanzialmente inalterato lo stato e risulta nel valore x, p Se lo stato normalizzato del sistema è | la misurazione della osservabile associata alloperatore A, i cui autovettori ortonormali sono |v i >, fornisce solo la probabilità P (v i ) = |<v i | di ottenere lautovalore v i di |v i > La misura fa quindi passare dallo stato | allautostato |v i > di A Legge di evoluzione dinamica EQ. HAMILTON EQ. SCHROEDINGER
In meccanica classica lo stato di un sistema costituito da un insieme n di particelle che si muovono in uno spazio 3-dimensionale ad un certo tempo t è specificato completamente dalle 3n posizioni e dalle 3n velocità a quel tempo particolare (le osservabili del sistema). Poiché ogni particella nello spazio tridimensionale ha tre componenti per la posizione rispetto a un sistema di riferimento e 3 componenti per la velocità (che è un vettore), si ha bisogno di 6n numeri per descrivere completamente lo stato di un sistema al tempo t (ricordiamo che le masse delle particelle in meccanica prerelativistica sono considerate costanti, e i loro momenti sono dati da mv). In una parola, si ha bisogno di uno spazio 6n dimensionale, che si chiama spazio delle fasi. Un punto dello spazio delle fasi corrisponde allo stato della particella a un tempo t, ed è specificato da 6n numeri reali, mentre una curva in che passa per è COMPLETAMENTE specificata dalla leggi del moto e dallo stato e rappresenta levoluzione temporale del sistema (la successione temporale dei suoi stati). tempo Spieghiamo la tavola precedente: CENNI n DI MECCANICA CLASSICA
Per esempio, una particella costretta a muoversi in una dimensione avrà spazio della fasi bidimensionale: la velocità ha una sola componente lunga la retta e la posizione è individuata dalla distanza del punto dallorigine. Si ha quindi che lo spazio delle fasi è il piano reale, e il punto q, p è individuato quindi da una coppia di numeri, il primo dei quali è la posizione q e il secondo il momento p=mv. Se calcoliamo lenergia cinetica della particella in questione, E c = (1/2)mv 2 =p 2 /2m, unaltra osservabile, si vede che essa è una funzione a valori reali del punto anche se nel caso particolare della sola coordinata p), ovvero E c : R p f -1 ( 1 In generale, si può associare a ogni quantità osservabile A di un sistema classico una funzione a valori reali f A : R e la risposta alla domanda losservabile A ha valori in (con sottoinsieme di R ), è sempre sì o no, ed è positiva se f A ( ) In figura è rappresentato in arancione linsieme dei punti che rende affermativa la risposta alla domanda la posizione della particella è q=1?Ogni stato può quindi essere definito come una funzione a due valori (0,1) sullinsieme di domande sperimentali: la risposta è positiva, ovvero (A, ) = 1, se e solo se f A ( ) q Particella in 1 dimensione
I postulati della MQ (finalmente!) 1)A ogni sistema fisico è associato uno spazio di Hilbert H 2)Gli stati di un sistema individuale S sono vettori normalizzati di H che, nellipotesi di completezza della teoria, danno uninformazione massimale 3)Le osservabili fisiche (posizione, momento, energia..) sono operatori autoaggiunti NB (o hermitiani) di H. In particolare, la posizione X e il momento P = (h/ nella base X sono dati da queste due matrici: = x (x-x) = -i (h/ (x-x)d/dx= -i(h/(x-x) 4) I soli possibili esiti della misura di unosservabile A sono gli autovalori associati allo spettro delloperatore associato hermitiano A. NB Un operatore A è autoaggiunto se non solo vale A= A sul dominio in cui A è definito (hermiticità), ma si ha in più che i loro domini coincidono
Per risolvere un problema in MQ, si deve 1)trovare gli autovettori ortonormali |v i > e gli autovalori v i associati ad A nel modo che conosciamo. 2) esprimere il vettore di stato | in termini del nuovo sistema ortonormale trovato | |v i > è lelemento generico del ket della nuova base ortonormale di A, e la proiezione del vettore di stato sullautovettore corrispondente è il coefficiente 3) La probabilità di ottenere lautovalore v i associato a |v i > in una misura è proporzionale a |. Ricordando le proprietà del prodotto scalare complesso, si ha | = <v i | < P v | idemp. di P) < P v P v | P v | P v = |P v
Esiti delle misure di osservabili Se losservabile A ha spettro discreto quantizzazione. La misura può dare come risultato solo uno degli n autovalori v i associato allautovettore |v i > delloperatore hermitiano A, con la probabilità data dal modulo quadro della proiezione dello stato del sistema | sullautovettore |v i > Se linsieme dei valori (lo spettro) di A è continuo, tutti i punti dei reali sono valori possibili al massimo possiamo determinare la probabilità che il valore v dellosservabile misurato sia in un intervallo piccolo a piacere perché un procedimento di misura infinitamente accurato è impossibile
Preparazione Allistante t=0 si misura un insieme completo di osservabili commutanti A,B,C Allora lo stato iniziale del sistema è proprio (lautovettore) normalizzato comune alle osservabili commutanti in questione
Levoluzione deterministica, lineare, e unitaria dellequazione di Schroedinger t condizione iniziale Determinismo: la soluzione dellequazione differenziale esiste ed è unica: lo stato finale t f è fissato univocamente da La corrispondenza è 1-1
2) linearità: loperatore hamiltoniano H è lineare se la soluzione (t) corrisponde a (0) e la soluzione (t) corrisponde a (0), allora per ogni a e b in C, unarbitraria combinazione lineare delle condizioni iniziali a (0)+b (0) (1) evolve nella combinazione lineare dei loro singoli evoluti, ovvero a (t)+b (t). Questa è lunica soluzione corrispondente alle condizioni iniziali date. Detto altrimenti, levoluzione temporale di (1) è la combinazione lineare dellevoluzione degli stati componenti
unitarietà: Se U(0, t) è loperatore lineare che fa evolvere lo stato iniziale da (0) a (t), | (t)> = U(0, t)| (0)> Esso risulta unitario e preserva quindi la norma del vettore di stato Come vedremo, se H è losservabile energia, allora loperatore unitario è dato dalla seguente funzione nel senso di Dirac
Cenni preliminari sui problemi concettuali della misura Le due evoluzioni e il concetto di misura come fondamentale Generalizzazione al caso di un operatore con spettro degenere Generalizzazione al caso di un operatore con spettro continuo: la densità di probabilità Stati puri e miscele statistiche: prime osservazioni sulla probabilità
Alcune osservazioni concettuali: 1)Levoluzione temporale di un sistema quantistico che non sia disturbato (non misurato) è deterministica, visto che è regolata dallequazione di Schroedinger, che è deterministica. 2)Ma per conoscere qualcosa di un microsistema, troppo piccolo per essere osservato dallocchio umano, lo dobbiamo comunque sempre misurare con un rivelatore macroscopico. 3)Nel processo di misurazione, ogniqualvolta lo stato del sistema non è un autostato dellosservabile, interviene lalgoritmo fondamentalmente probabilistico (o indeterministico) della teoria. Ecco un primo problema della MQ. Non solo ci sono due evoluzioni, ma per una delle due (quella indeterministica) possediamo solo una ricetta di calcolo e non una descrizione fisica approfondita di che cosa accada 4)Tale ricetta (algoritmo) prescrive che per un osservabile B relativa a un operatore autoaggiunto B, per il quale B|v i >= b i |v i >, i possibili esiti di misura dellosservabile B sono gli autovalori b i relativi agli autovettori v i. Allora, se so che lo stato del sistema prima della misura (al tempo t) è t), tale stato mi da informazioni irriducibilmente probabilistiche: la probabilità condizionata P di trovare b i misurando B se lo stato è t), è P[B = b i | t)] = | | 2 = |P vi t)| 2 Ma che cosa descrive lo stato, oltre a essere uno strumento predittivo?
b1b1 b2b2 b3b3 t) 0) a 2 a3a3 a1a1 1.Un operatore autoaggiunto A in R 3 individua tre versori (autovettori) ortogonali i : se la misura dà a 2 allora prepariamo il sistema in 0) 2.Loperatore di evoluzione temporale è unitario (eq. di Schrodinger), e quindi preserva la norma del vettore di stato che compie una rotazione sulla superficie della sfera unitaria (la linea blu indicata in figura) 3 Se ora vogliamo misurare unaltra osservabile B, che ha autovettori la probabilità di trovare b i è il modulo quadro della proiezione di (t) sui tre nuovi, versori 4 Solo se (t) è allineato con uno dei tre nuovi assi la misura ha esito certo (lo stato è autostato dellosservabile B) salto quantico, o collasso di in j
b1b1 b1b1 b3b3 P 1 B t) el caso degenere, in cui per esempio lautovalore b 1 associato allosservabile B corrisponde ad un autospazio a 2 dimensioni (il piano ), la probabilità che B=b 1 è il modulo quadro della proiezione di t) sul piano in questione. P[B=b 1 | t)]=|P 1 B t)| 2 = Questo risultato si generalizza a autospazi di dimensione qualunque K La misura fa passare dallo stato alla sua proiezione normalizzata P 1 B t)/|P 1 B t)|: il cambiamento discontinuo del vettore di stato ci porta nellautospazio ( ) ma come rappresentante degli infiniti vettori del piano si sceglie proprio P 1 B t)/|P 1 B t)| t)
Se lo stato iniziale | fosse noto ed effettuassimo una misura trovando un autovalore degenere b 1, potremmo solo dire che la probabilità è P(B=b 1 | ) = |P 1 B | e che lo stato finale è nella varietà (piano) Usiamo la base ortonormale di autovettori |b 1, 1 >, | b 1, 2 >, | 3> per rappresentare | e supponiamo che si abbia Esercizio Lo stato finale normalizzato che dopo la misura dà b è quindi
Se invece non conoscessimo lo stato iniziale | nel caso di un autovalore degenere b 1, potremmo solo concludere che lautostato stato finale (dopo la misura) è
Supponiamo ora che lo spettro delloperatore autoaggiunto sia continuo Nel caso discreto e non degenere, sviluppavamo il vettore di stato in funzione della base di n autovettori ortonormali i nel modo seguente: Se il numero di autovalori è infinito, rimpiazziamo la sommatoria con lintegrale Al variare di con continuità, è una funzione continua Chiamiamo questa funzione la funzione donda nello spazio è anche chiamata ampiezza di probabilità di trovare la particella con losservabile
Nel caso continuo non possiamo aspettarci che |< i sia la probabilità di trovare che i, in quanto i valori possibili di sono infiniti: se al variare di i la somma dei prodotti scalari di |< i (le probabilità) deve dare 1, la probabilità che i deve essere infinitesima. La probabilità P( |< può essere allora interpretata come la densità di probabilità nel punto, ovvero, per es., se X, loperatore di posizione, P(x dx è la probabilità di trovare la particella tra x e x+dx Mostriamo ora che la definizione data è appropriata, ovvero che se operiamo con un vettore di stato normalizzato, lintegrale di P( d = 1 Se è lunica normalizzazione possibile, (vettori impropri) allora P( ) è solo la densità di probabilità relativa
Riassumendo, nel caso di spettro continuo delloperatore B, abbiamo che la probabilità che misurando losservabile si trovi un valore compreso tra c e c+ è Esito in (c,c+ Lo stato viene trasformato nella proiezione normalizzata sullautovarietà (c, c+ corrispondente allesito ottenuto Esito b j Caso discreto Caso continuo
|C c c La probabilità per un vettore di stato t) di ottenere un risultato (autovalore) compreso tra c e c+ appartenente allo spettro continuo di un osservabile B è larea sottesa dalla funzione |c( che esprime la proiezione del vettore di stato sulla varietà i cui assi coordinati sono compresi tra c e Questa formula rappresenta geometricamente larea sottesa dalla funzione c( nellintervallo (c, c+ Siano le autofunzioni improprie delloperatore
Stati puri e miscele La preparazione è una misura di unosservabile, che ci porta in unautovarietà che può essere (i) monodimensionale (autovettore) e allora abbiamo uninformazione massimale (preparazione accurata), ovvero uno stato puro, oppure (ii) degenere (autospazio) e allora non sappiamo esattamente in quale degli stati della varietà degenere il vettore di stato viene trasformato Esistono dunque probabilità che dipendono da mancanza di informazione sullo (ignoranza dello) stato iniziale del sistema e che nascono in connessione con la preparazione del sistema : chiamiamo tali probabilità epistemiche
Altre probabilità, quelle che caratterizzano la teoria in modo più proprio, non dipendono da informazioni colmabili in linea di principio: sistemi identicamente preparati (stati puri) e soggetti a misura danno esiti diversi con certe probabilità. Questi sistemi si chiamano quantisticamente omogenei e le probabilità ad essi relative si dicono non epistemiche o ontiche Se la preparazione di un sistema quantistico non può essere gestita in modo accurato, dobbiamo considerare diversi stati iniziali dove lindice corre su un certo insieme Ogni risultato di preparazione ha una certa probabilità p( Nel caso di sistemi identicamente preparati, p( è la frazione di sistemi descritti dallo stato iniziale.Questi diversi insiemi si chiamano miscele e non sono omogenei: sono somme pesate di stati puri Ogni stato viene poi fatto evolvere con lequazione di Schroedinger e le sue misure genuinamente probabilistiche (in senso non epistemico) vengono poi pesate con le varie probabilità epistemiche.
Supponiamo che un operatore autoaggiunto abbia uno spettro continuo ed eventualmente uno discreto, e abbia quindi autofunzioni proprie i e autofunzioni improprie Affinché linterpretazione probabilistica sia consistente si deve avere (G. p. 371) La prima condizione a sinistra discende dal fatto che si ha a che fare con un operatore autoaggiunto. Ricordiamo che c < e che
Abbiamo visto che in meccanica classica lo stato di un sistema si specifica completamente dando le 3n posizioni delle n particelle (ogni particella ha tre coordinate nello spazio tridimensionale) e i 3n momenti p i =m i v i (ogni v i ha tre proiezioni sugli assi). Esprimendo le posizioni e le velocità come due vettori tridimensionali, basta ovviamente dare 2n vettori, n per la posizione ed n per i momenti. Allora, lenergia totale E T del sistema delle particelle = energia cinetica + energia potenziale di ogni particella, si scriverà come una funzione a valori reali sullo spazio delle fasi 6n dimensionale
Indichiamo ora con X, Y, Z e P x P y P z i sei operatori autoaggiunti dallo spettro continuo che corrispondono alle componenti classiche della posizione (x, y, z) e del momento p x p y p z di una sola particella. Questi operatori obbediscono a un algebra non- commutativa: [X, P x ]= [Y, P y ] = [Z, P z ]= ih/2 [X,Y]= [X,Z] = [Y,Z] = [P x,P y ] = [P x,P z ] = [P y,P z ] = 0 [X, P y ] = [X, P z ] = [Y,P x ] = [Y,P z ] = [Z, P x ] = [Z, P y ] = 0 Momento quantità di moto = Componente lungo z
Consideriamo che X, Y e Z sono un insieme completo di osservabili commutanti (seconda riga della pagina scorsa) e scriviamo ogni vettore dello spazio di Hilbert (x,y,z) adottando come base lunico autovettore improprio x,y,z delle tre componenti della posizione | x,y,z |. In altre parole x,y,z è un autostato simultaneo delle osservabili commutanti X, Y e Z, con autovalori x, y, z, ciascuno passibile di assumere un valore reale qualunque Rappresentazione degli operatori (G.2.7) Gli autostati impropri si normalizzano a una di Dirac in ciascuna delle variabili (lo spazio di Hilbert delle tre componenti è il prodotto dei singoli spazi di Hilbert associati a ciascuna componente) sta per la x,y,z) su cui agisce loperatore
La rappresentazione della componente lungo k del momento angolare L sarà Loperatore hamiltoniano del sistema che corrisponde alla formula classica di p. 138 sarà: Poiché lenergia potenziale V è funzione degli osservabili posizione V(X,Y,Z), V agisce come una moltiplicazione per V V(X)=V(x);V(Y)=V(y); V(Z)=V(z) Ricordando che lequazione di Schroedinger è si ha, nel caso in cui lhamiltoniana è quella di p. 138
Momento della quantità di moto: si dimostra che vale (vedi G. 2.8) [L x L y ]=ih/2 L z ; [L y L z ]=ih/2 L x ; [L z L x ]=ih/2 L y Lequazione agli autovalori risulta invece L 2 lm = [L(L+1) h/ con L= 0,1,2, 3, n ; L z lm = (mh/2 / lm e mostra che le due osservabili hanno spettro discreto: ovvero, non tutte le velocità di un elettrone che orbita attorno al nucleo (una trottolina quantistica) sono possibili, ma solo quelle per le quali il modulo del momento angolare L è (L(L+1)) 1/2. Fissato un autovalore l, la proiezione lungo z dellasse della trottolina in questione non può formare un angolo arbitrario, ma deve assumere il valore mh/2, ovvero uno dei 2l+1 valori per cui m=-l, -l+1,.. 0, l-1,… l. Per esempio, per l =1, il modulo di L è e m può avere i z 1 valori –1, 0 e 1 in unità di h/2
Lo spin (1)Lo spin è un grado di libertà (proprietà) quantistico(a) che non ha equivalente classico, malgrado sia assimilabile al momento angolare intrinseco associato a certe particelle, viste come minuscole trottole (spin). Non essendo legato a posizione e velocità, è, insieme alla carica e alla massa, una proprietà intrinseca o non relazionale delle particelle che lo possiedono. (2) Lo spin non è associato al moto orbitale della particella, perché è possibile preparare un elettrone con quantità di moto nulla (mv=0) e dunque con momento angolare L = mvr che dovrebbe essere nullo nelle tre direzioni; sperimentalmente si trovano invece (per lelettrone, per es.) due soli valori possibili +/-(1/2)h/2 (e per questo si pensò inizialmente allo spin come alla rotazione di una trottolina che non trasla,ma tale immagine può essere fuorviante)
(3) Essendo analogo al momento angolare, assumeremo che loperatore di spin soddisfi a relazioni analoghe a quelle soddisfatte dalloperatore momento angolare: detti S x S y S z gli operatori delle tre componenti dello spin, vale per le prime due componenti: [S x, S y ]=(ih/ S z e per le altre la permutazione ciclica di questa. Ponendo S i =h/4 i con i=x,y,z, si ha i = /h S i [ x, y ] = h S x, S y ]= h [(ih/2 )]S z = 2i z Se i soli valori possibili delloperatore S sono +-½, gli autovalori di sono 1 e –1. Infatti supponiamo che S i |v>=(+1/2)h/2 |v> (4 /h) S i v> = (4 /h)(1/2)(h/2 |v> i v> =1|v>; lo spin ha autovalori 1 e -1 Considerando che loperatore di spin ha solo due autovalori, gli elementi dello spazio corrispondente saranno vettori a due componenti, mentri gli operatori di spin sono matrici 2x2
Facciamo ricorso alla base degli autovettori relativi alloperatore z Poiché losservabile corrisponde a un operatore hermitiano che può assumere forma diagonale e ha come elementi della diagonale i suoi autovalori, la matrice associata alloperatore in questione si può scrivere Gli autovettori normalizzati relativi agli autovalori 1 e –1 sono, rispettivamente, e, come si può verificare:
Il generico vettore dello spazio di spin si scrive Questa relazione mostra che z ha un sistema completo di autostati.
Esercizi: (1) Determinare le matrici corrispondenti a x e y tenendo conto delle relazioni di commutazione di due pagine fa (box rossi), della condizione di hermiticità e del fatto che gli autovalori associati sono –1 e +1. Il risultato è (2) Determinare gli autovettori normalizzati associati ai due operatori. Risultati:
Svolgimento del primo esercizio. Si sfrutta la relazione [ x y ]=2i z Chiamando con 11 il primo elemento delle varie matrici, si ha Sommando e sottraendo membro a membro le due espressioni dopo la freccia si ottiene a = c e f = d. Infatti sommando si ha 2i(c-a)= 0 e sottraendo 2(f-d) = 0. Richiedendo che le due matrici abbiano gli stessi autovalori di z si ha a=c=d=f =0
Svolgiamo il calcolo solo per uno dei due autovettori associati a y trovati i due autovalori, determino lautovettore Sottraiamo la seconda equazione dalla prima Normalizziamo il vettore in modo da trovare lautovettore di y cercato Il procedimento per l altro è del tutto analogo
Esercizi sulle matrici di spin: 1)Verificare che i tre operatori o matrici di Pauli i non commutano e che gli autovettori trovati per ogni singolo operatore verificano lequazione agli autovalori. 2) Verificare che i 6 autovettori sono tutti normalizzati e che autovettori corrispondenti ad autovalori distinti sono ortogonali a due a due per ognuna delle tre matrici di Pauli. 3) Chiamando con x + e x - gli autovettori di x x rispettivamente, e con y + e y - quelli associati a y y (i)trovare i proiettori che proiettano sui 4 autovettori (ii) mostrare che P x- x_ = x_ e P y+ y + =y + (iii)determinare il vettore P y+ y_ _ (iv) calcolare P x+ P x+ e P y+ P y+ = P y+ 2 (perché il risultato è prevedibile?) 4) Calcolare,, e e confermare che questi prodotti scalari sono uguali a |P y + x + | 2, |P y + x - | 2, |P y + y + | 2 |P y + y - | 2 5) Dato S y P y + usare il teorema di decomposizione spettrale per trovare P y- 6) Calcolare ½ P x+ -1/2P x- e spiegare perché il risultato è prevedibile.
Svolgimento di 3(i). Scriviamo i 4 autovettori associati agli operatori di spin
In alternativa, e in modo più rapido, si sfrutta la definizione alternativa di proiettore su i, P i =| i > <i|, applicandola a y +, y - etc.
Valor medio di un operatore, operatore statistico o di densità Supponiamo al solito di avere unosservabile B, per semplicità non degenere e dallo spettro discreto, e tale che Bv k =b k v k e supponiamo anche che non sia un autostato dellosservabile. Allora si può espandere nella base ortonormale costituita dagli autovettori v j Ricordando la linearità e lantilinearità del prodotto scalare e lortonormalità della base v k si calcola il valor medio di B Media degli esiti di misura pesata con la loro probabilità Sandwich di B
Nel caso di un dado, la media degli esiti pesata con la loro probabilità (la distribuzione) è (1/6)1+(1/6)2+ (1/6)3+(1/6)4+ (1/6)5+(1/6)6=21/6 = 3,5 Calcoliamo ora il valor medio di un proiettore associato a unautospazio di unosservabile con la regola del sandwich, e mostriamo che esso è uguale alla probabilità di ottenere il relativo autovalore in un processo di misura Consideriamo ora un operatore hermitiano A su uno spazio di Hilbert H. Si dice che A è positivo se, per ogni v di H, Esercizio: Dimostrare che dalla condizione nel box blu, omettendo lhermiticità di A, segue che A è hermitiano e che i suoi autovalori sono positivi
Prendiamo ora una base di v ortonormali e ridefiniamo la funzione traccia di A, Tr(A) Si noti che scrivendo lequazione agli autovalori, per lortonormalità di v si ha che coincide con la definizione che avevamo dato precedentemente, ovvero con la somma di elementi diagonali in cui si può mettere la matrice di A quando A è hermitiano; come si vede, gli elementi diagonali sono gli autovalori di A. Inoltre, siccome A è hermitiano, la traccia di A è un numero reale.
Ovviamente la traccia di un operatore può divergere, cioè dare somma infinita. Diciamo ora che un operatore appartiene alla classe traccia se (i) A è positivo e (ii) se la sua traccia è finita, cioè A è di classe traccia (i) (ii) Prendiamo ora un proiettore P su un raggio di H (che è un sottospazio monodimensionale di H ) e sia v i il vettore che giace nel raggio in questione. Allora si ha Pv i =v i e Pv j =0 se Siccome P è di classe traccia e la sua traccia =1, allora è detto operatore statistico
Esercizi: dimostrare le seguenti tre proprietà della traccia: (i) Tr(aA) = a Tr(A) ; (ii) Tr(A+B) = Tr(A)+Tr(B) (iii) Tr(A) dipende solo da A e non dalla base prescelta Svolgimento di (ii). (i) è stato svolto in classe Svolgimento di (iii); Sia Tr(A) la traccia di A in base v= c i v i con v base ortonormale esprimibile come combinazione lineare della base ortonormale originale v i Si ha quindi Tr(A)=Tr(A).QED
W è detto operatore di densità o operatore statistico o matrice di densità se (i) W è un operatore di classe traccia (e quindi W è positivo e la sua traccia è finita) e inoltre (ii) è di traccia unitaria Tr(W)= 1. Abbiamo visto nella pagina precedente che ogni operatore di proiezione P che proietti su un raggio è un operatore statistico o di densità (infatti si ha Tr(P) =1). Dimostrare che se [P i ] è una famiglia di proiettori che operano su raggi di H, allora per la (i) e la (ii) di questa pagina, si ha W è un operatore di densità Operatore di densità (statistico)
Dimostrazione. La condizione di positività è soddisfatta quando per ogni v in H, si ha Infatti se lequazione agli autovalori è Wv i =a i v i, con v i base ortonormale, allora ogni v in H si esprime come combinazione lineare di v i e quindi si ha La condizione di finitezza della traccia è soddisfatta perché la traccia di W è unitaria e quindi a fortiori finita:- (i) e (ii) qui sotto si rif. alle proprietà della traccia trattate negli esercizi della p.157 con fattori che moltiplicano le a per il modulo quadro c*c dei coefficienti dellespansione di v= i c i v i e che dunque non influiscono sulla positività del prodotto scalare
Si può dimostrare che è sempre possibile decomporre un operatore di densità W in una somma pesata di proiettori a i P i, anche se la decomposizione di W non è unica (vedi sez. 5.2 R. I. G. Hughes S.I. of QM). Ogni operatore di densità che non sia esso stesso un proiettore può esprimersi in un numero infinito di modi come somma pesata di proiettori su raggi (varietà monodimensionali dello spazio di Hilbert) Date queste quattro matrici su C 2 e un operatore hermitiano A su C 2 mostrare che (i)Esistono quattro numeri reali r 1, r 2,r 3, r 4 tali che A= r 1 x + r 2 y +r 3 z + r 4 I (ii)Se A è un operatore di densità, allora r 4 =1/2 (iii)Se A è di proiezione, allora r 4 =1/2, e (r 1 ) 2 +(r 2 ) 2 + (r 3 ) 2 = ¼ (per lidempotenza). Allora scrivendo 2 r 1 etc. si ha che: (iv)Se A è un operatore di proiezione, si può scrivere nella forma A=1/2( x + y + z +I) con ( 1 ) 2 +( 2 ) 2 + ( 3 ) 2 =1
Svolgimento di (ii): Tr(A) = 1 per def. di matrice di densità Tr(A)=Tr(r 1 x + r 2 y +r 3 z + r 4 I)= r 1 Tr( x )+ r 2 Tr( y )+r 3 Tr( z )+r 4 Tr(I)= r 4 2 = 1 r 4 =1/2 Svolg. di (iii): 1= Tr (A)= Tr (A 2 )= Tr[(r 1 s x + r 2 s y +r 3 s z + r 4 I) 2 = 1 1=2r r r (r 4 ) + 0 +……+ 0 1/2= (r 1 ) 2 +(r 2 ) 2 + (r 3 ) 2 +1/4 (r 1 ) 2 +(r 2 ) 2 + (r 3 ) 2 =1/4
Abbiamo visto che se si considera loperatore di proiezione P sulla varietà monodimensionale individuata da loperatore P è di classe traccia con traccia unitaria. Se prendiamo unosservabile B il cui operatore B sia limitato (ovvero cè un numero reale b tale che per ogni v di H si ha |Bv| < b|v|), allora P B è di classe traccia, e la sua traccia è il valor medio di B. Infatti, possiamo trovare una base ortonormale il cui primo elemento = mentre gli altri elementi k sono ad esso ortogonali: se supponiamo che P e P k = 0 per k diverso da 1, si ha (Ghirardi, 387): Il valor medio di un operatore limitato B è la traccia del prodotto delloperatore per il proiettore sulla varietà generata dallo stato
Definiamo ora lo scarto quadratico medio (detto anche secondo momento della distribuzione) come la radice quadrata della media pesata dei quadrati degli scarti dalla media. Se p i è la probabilità di ottenere lesito a i, la quantità ci permette di dire che la maggior parte degli esiti sono concentrati nellintervallo [ - + Per esempio, se = =1/2 possiamo solo dire che la frazione di pollo che ogni italiano mangia sta tra 0 = - e 1 = + mentre se e =1/2, allora quasi tutti gli italiani mangiano mezzo pollo a testa (Ghirardi p. 388) SCARTO QUADRATICO MEDIO
Data unosservabile B e il relativo operatore autoaggiunto B, si ha Assumendo infatti che i c i i ; e che B i =b i i Ovvero il valor medio delloperatore (B - ) 2 è la media pesata con la probabilità |c j | 2 del quadrato dello scarto tra lesisto b j e il valor medio di B.
Si noti che poiché B è hermitiano, e =|c i | 2 b i è reale, anche loperatore (B - ) 2 è simmetrico, cosicché Se un sistema scelto a caso da un insieme quantisticamente non omogeneo (miscela) E in cui una percentuale di sistemi E a è nello stato puro a con probabilità p a = N a / si ha, sommando su tutte le opzioni possibili E a e moltiplicando per il valor medio di B relativamente allo stato a considerato…
Notiamo ora che se A è di classe traccia e B è limitato, si ha che AB e BA sono entrambi di classe traccia e Tr(AB) = Tr (BA). Sia P v il proiettore che proietta sul raggio contenente un vettore normalizzato v e sia Q un qualunque proiettore sullo spazio H. Sia p v (A, la probabilità che losservabile A sia in relativamente allo stato v Se [v i ] è una base normalizzata di H che contiene v, allora P v v=v e Pv i =0 se v i è diverso da v Se rappresentiamo lo stato puro con P v piuttosto che con il vettore v, e con P A il proiettore che proietta sul sottospazio che rappresenta la domanda sperimentale A è in ?, allora p v (A, è la traccia del prodotto tra lo stato puro P v e il proiettore P A. Sia L linsieme dei sottospazi di H. Allora per ogni L in H, con il corrispondente P L, P (L) Tr(P v P L ) è una misura di probabilità e le somme pesate i a i sono ancora misure di probabilità, purché valga a i >0 e i a i =1.
Ora si consideri un operatore statistico W= i a i P i con i proiettori P i che proiettano su raggi di H, a ciascuno dei quali corrisponde una misura di probabilità i. Allora per ogni sottospazio L e ogni proiettore P L si ha Alloperatore W corrisponde così la misura di probabilità W = i a i i sullinsieme di sottospazi di H, a patto che per ogni a i, si abbia a i >0 e i a i =1. Rappresentando con W lo stato del sistema, generalizziamo lalgoritmico probabilistico della teoria scrivendo se W=stato puro P v questa relazione si riduce al già visto