UNA FORMULAZIONE ALGEBRICA E PROBABILISTICA DELLA MECCANICA CLASSICA

Davide Pioggia, novembre 2003

Sinossi. Costruisco una formulazione probabilistica della meccanica classica basata sulla correlazione di coppie o catene di eventi. Introduco poi degli spazi di Hilbert su campo reale, e mostro che tale meccanica può essere ricondotta ad un’algebra in quegli spazi purché si introduca il concetto di “evento virtuale” inteso come combinazione lineare (o “sovrapposizione”) di eventi reali. Illustro poi come il calcolo delle probabilità possa essere ottenuto supponendo che gli eventi reali iniziali evolvano nel tempo diventando “eventi virtuali”. Infine prendo in considerazione la possibilità di sostituire il concetto di “evento” con quello di “stato”, ed osservo che in tal caso possiamo recuperare il concetto di evoluzione deterministica degli stati, purché si accetti l’idea di “sovrapposizione degli stati”, ed inoltre tutta la componente probabilistica della teoria venga ricondotta ad un “collasso” degli stati contestualmente alla osservazione di un qualunque evento reale. Lo scopo di tutto ciò è dimostrare che si adotta una certa prospettiva teorica e se non si tratta con la dovuta cautela epistemologica il concetto di “stato fisico” anche una teoria non problematica come la meccanica classica può implicare dei “principi” (che poi tali non sono) paradossali e problematici come la “sovrapposizione degli stati” e il loro “collasso”. Dal momento che tutto questo schema concettuale può essere sempre ricondotto alla meccanica classica, ne segue che quei “principi” non possono corrispondere al alcuna realtà fisica, e devono essere considerati “apparenti” in quanto prodotti dalla prospettiva teorica adottata.

Coppie di eventi e probabilità condizionata

Come è noto la meccanica classica consente di associare ad uno stato iniziale perfettamente noto, dato ad esempio dalla posizione e velocità di un punto materiale al tempo t₀, lo stato dello stesso punto materiale al tempo t. Tutto ciò in modo deterministico.

Proviamo ora a vedere questa cosa da un punto di vista diverso, un po’ più “concreto”.

Come facciamo a verificare la validità della meccanica classica? Osserviamo la posizione e la velocità di un punto materiale al tempo t₀, e al tempo t andiamo a misurarle di nuovo.

Dal punto di vista concreto quindi si sono verificati due eventi:

I (evento iniziale) = il punto materiale è osservato (o posto) in una certa posizione con una certa velocità, al tempo t₀

F (evento finale) = il punto materiale è osservato in un’altra posizione con una certa velocità al tempo t.

Fino a qui questo passaggio dal concetto di “stato” a quello di “evento” lascia un po’ il tempo che trova, e sembra una inutile complicazione.

Tuttavia esso consente di affrontare una serie di casistiche in cui la meccanica classica si dimostra inefficace.

Ad esempio l’evento I potrebbe non coincidere con lo “stato” vero e proprio, ma contenere semplicemente delle informazioni parziali su di esso.

Se abbiamo un punto materiale noi non potremo mai conoscere la sua posizione e velocità con precisione assoluta, perché ci troveremo sempre ad avere a che fare con l’imprecisione sperimentale.

Possiamo pensare di ridurre indefinitamente questa imprecisione, tuttavia ci sono anche dei sistemi fisici che presentano la cosiddetta “sensibilità alle condizioni iniziali”, nel qual caso per avere una previsione del moto occorre avere una precisione infinita sulle condizioni iniziali.

Oppure potremmo avere a che fare con complicati dispositivi macroscopici, per i quali non si può escludere a priori l’importanza di tutti i dettagli microscopici. In questo caso è chiaro che non potremo che avere una informazione “riassuntiva” sullo stato del sistema.

In tutti questi casi si avrà una “ignoranza parziale” di tutta l’informazione che definisce lo stato del sistema, e quindi verrà meno la nostra possibilità di effettuare delle previsioni esatte, per quanto si possa tranquillamente continuare a pensare che la meccanica classica è “intrinsecamente deterministica”.

Ebbene, non avendo la possibilità di effettuare delle osservazioni esatte noi saremo costretti ad introdurre delle valutazioni probabilistiche.

Diremo, ad esempio, qualcosa del genere:

«Se al tempo t₀ abbiamo osservato il punto materiale in un certo intorno del punto (x₀,v₀) dello spazio delle fasi, allora la probabilità di trovarlo al tempo t in un determinato intorno del punto x è …»

Nell’esempio appena fatto abbiamo questi due eventi:

I = il punto materiale è osservato (o posto) in un certo intorno del punto (x₀,v₀), al tempo t₀

F = il punto materiale è osservato in un certo intorno di x al tempo t.

Si osservi, come avevamo accennato, che un evento non deve necessariamente coincidere con lo “stato” del sistema, ma –più semplicemente- potremo pensare che esso contenga delle informazioni sullo stato. Nell’esempio appena fatto siamo in grado di calcolare la probabilità dell’evento F pur essendo esso una informazione parziale dello stato del punto materiale, poiché si è deciso di osservare solo la posizione e non la velocità, che pure servirebbe per definire interamente lo stato.

Possiamo anche fare degli esempi sono solo vagamente “descrittivi”.

Supponiamo ad esempio di lanciare un dado da 50 cm di altezza rispetto ad un piano rigido (con un errore di 1 mm) col la faccia [1] rivolta verso l’alto. Vogliamo sapere qual è la probabilità che, dopo aver finito di rimbalzare, “esca” il [5], il dado mostri verso l’alto la faccia [5].

I due eventi da correlare probabilisticamente sono ora i seguenti:

I = il dado si trova a 50 cm (con una imprecisione di 1 mm) sul piano e mostra la faccia [1] verso l’alto;

F = “esce” il [5].

In questo caso l’evento I contiene solo una piccola parte di tutta l’informazione necessaria per definire lo stato del dado. Ad esempio non sappiamo collocarlo orizzontalmente. E’ vero che ho avuto l’accortezza di definire l’imprecisione sperimentale sull’altezza, ma d’altra parte non ho detto se la faccia [1] è perfettamente rivolta verso l’alto, e qual è l’imprecisione sperimentale nella misura dell’angolo che esso forma rispetto alla direzione orizzontale. Non ho nemmeno detto che viene lanciato con una certa velocità o semplicemente lasciato cadere.

Potrà sembrare che sia stato tremendamente negligente, ma in realtà non è vero. Tanto sappiamo che il dado è estremamente sensibile alle condizioni iniziali, e non potremmo mai avere la precisione necessaria per fare delle previsioni certe, sicché dovremo avere comunque a che fare con delle probabilità, pur essendo il sistema –in linea di principio- deterministico. Una volta che si sia stabilito che questo è un problema al quale possiamo fornire solo una risposta probabilistica, tutte quelle informazioni (poche) che avevamo fornito diventano superflue, poiché sappiamo che gli stati iniziali che fanno “uscire” un qualunque risultato sono uniformemente densi nello spazio delle fasi, e quindi la probabilità che esca [5], come qualunque altro numero, è sempre 1/6.

Insomma, a pensarci bene questo “accoppiamento di eventi”, per quanto poco usuale, è assai più vicino alla pratica concreta della fisica di quanto lo siano le “traiettorie” di cui si parla in tutti i corsi teorici.

Ad esempio il fatto che l’imprecisione sperimentale sia di fatto inevitabile, ci dice che noi -concretamente- non abbiamo mai a che fare con delle traiettorie, ma –nella migliore delle ipotesi- con dei “tubi” nello spazio delle fasi. Applicando la meccanica classica noi ricaviamo quei tubi come “fasci di traiettorie”, ma una “vera traiettoria” nessuno l’ha mai osservata, così come nessuno ha mai disegnato un “vero punto”.

E adesso introduciamo un po’ di notazione.

Per indicare la probabilità dell’evento A noi dovremmo usare una espressione come P(A). Tuttavia l’uso di questa espressione sarà talmente frequente che è preferibile scrivere semplicemente (A) per indicare la probabilità dell’evento A.

Con A|B indicheremo l’evento “condizionato”, ovvero il verificarsi dell’evento B dopo che si è verificato A.

E’ questo tipo di eventi che interessa la fisica, poiché la fisica può solo stabilire delle relazioni fra coppie di eventi.

Dobbiamo inoltre ricordarci che per ogni evento occorre specificare l’istante in cui è accaduto, e quindi le probabilità che intendiamo calcolare sono del tipo (I,t₀|F,t), ovvero la probabilità che si verifichi l’evento F al tempo t dopo che si è verificato l’evento I al tempo t₀.

Insiemi completi di eventi e sviluppi in serie

Supponiamo ora di avere osservato l’evento I al tempo t₀, e di sapere che al tempo t₁ < t al nostro sistema deve necessariamente accadere uno degli eventi A₁, A₂, …, A_n.

Ad esempio se si tratta di un dado, conoscendo la sua altezza iniziale sappiamo che ad un certo tempo t₁ esso deve rimbalzare in qualche punto del piano. In questo caso gli eventi A saranno tutti del tipo A_x = “il dado è rimbalzato nel punto x del piano”.

Oppure possiamo pensare ad una pallina lungo un percorso che ad un certo punto deve passare in un foro o in un altro…

L’importante è che gli eventi A formino un insieme completo di eventi mutuamente esclusivi: ne accade uno ed uno solo.

A questo punto abbiamo una catena di eventi “condizionati”:

I,t₀ | A_k,t₁ | F,t

(dove per comodità siamo tornati all’indice discreto i al posto dell’indice continuo bidimensionale x)

Ebbene, come è noto dalla teoria delle probabilità, si ha:

Formulazione algebrica: vettori “par”, vettori “entesi”, eventi virtuali e sovrapposizioni di eventi

A questo punto possiamo divertirci un poco con il formalismo matematico.

Innanzi tutto introduciamo due insiemi di oggetti: un insieme V di oggetti |…) ed un insieme V* di oggetti (…|

Potremmo chiamare “par” gli oggetti (…| e “entesi” gli oggetti |…)

Vogliamo che V e V* siano due spazi vettoriali, e che V* sia il duale di V. Quindi vogliamo che sia possibile fare delle combinazioni lineari degli elementi di V e di V* (vedremo che ci basterà lavorare sul campo dei numeri reali) e vogliamo anche che sia definito un prodotto scalare del tipo (…| |…)

Cosa hanno a che vedere V e V* col calcolo delle probabilità condizionate?

Dobbiamo essere noi a deciderlo, per ottenere uno strumento matematicamente utile. Poniamo allora le seguenti condizioni:

1) ad ogni evento A può essere associato un elemento di V, che indichiamo con |A) ed un elemento di V*, che indichiamo con (A|

2) dati due eventi A e B, i vettori associati (A| e |B) sono tali che il loro prodotto scalare è pari alla probabilità dell’evento condizionato (A|B), ovvero (A||B) = (A|B)

3) dato un insieme completo di eventi A_k (disgiunti e indipendenti), gli elementi associati |A_k) ed (A_k| formano sempre una base di V e V*

(Qui c’è il problema costituito dal fatto che le basi non hanno tutte lo stesso numero di elementi, bisognerebbe quindi introdurre gli spazi di Hilbert, parlare di proiettori sui sottospazi, eccetera. Ma per il momento mi affiderò all’intuizione.)

Già da ora possiamo fare alcune osservazioni:

1) dato un qualunque evento A è sempre (A||A) = (A|A) = 1 (infatti la probabilità che accada A quando è accaduto A è 1, per definizione), quindi i vettori associati ad un evento hanno tutti modulo unitario;

2) se A_k1 e A_k2 si escludono a vicenda, allora (A_k1||A_k2)=0, sicché le basi sono ortogonali;

3) se |A) e |B) sono i vettori associati agli eventi A e B, in genere una loro combinazione lineare non sarà associata al alcun evento; questo significa che la funzione che ad ogni evento associa un vettore di V (e di V*) non è suriettiva

Abbiamo appena detto che ci sono degli elementi di V e V* che non corrispondono al alcun evento.

Potremmo però tentare di generalizzare il formalismo che stiamo costruendo adottando la nozione di “evento virtuale”, e riservando il termine di “evento reale” per gli eventi “veri”.

Consideriamo ad esempio i due eventi A e B ed i vettori associati |A) e |B). Prendiamo ora una combinazione lineare di |A) e |B):

b] |…) = a |A) + b |B)

A questo punto immaginiamo di ampliare l’insieme E degli eventi reali includendo –come dicevamo- degli “eventi virtuali”, e ottenendo così un insieme E’, tale da rendere suriettiva l’applicazione che ad ogni evento associa un “par” ed un “entesi”.

Possiamo allora affermare che esiste in E’ un “evento virtuale” Ψ tale che:

c] | Ψ) = a |A) + b |B)

Volendo fare uso di metafore, potremmo dire che Ψ è la “sovrapposizione” di due eventi reali.

Quando A e B non si escludono a vicenda potremmo ipotizzare che Ψ coincida con l’unione o l’intersezione di A e B (ma poi si dimostra facilmente che non è così). Ma che dire di Ψ quando A e B si escludono a vicenda?

Se lanciamo un dado ed A corrisponde a “è uscito il [5]” mentre B corrisponde a “è uscito il [2]”, che razza di evento è una “sovrapposizione” di [5] e [2]? Su quale faccia è caduto il dado?

E quando andiamo a scrivere gli elementi di V e V* come combinazioni lineari delle loro basi ci troviamo sistematicamente in queste condizioni!

Per verificarlo torniamo alla nostra formula per la probabilità condizionata.

Adottando le notazioni introdotte, possiamo porre, nella a]:

E così abbiamo definito un “evento virtuale” che è una “sovrapposizione” di eventi reali che si escludono a vicenda! Non abbiamo la minima idea di quale sia il “significato fisico” di questa grandezza, ma ad ogni modo decidiamo di continuare ad usarla, per vedere dove si va a finire.

Con queste sostituzioni la a] diventa così:

Evoluzione deterministica degli eventi

Confrontiamo ora la f] con una generica espressione analoga, come può essere la seguente:

g] (A|B) = (C|B)

Questa ci dice che la probabilità di osservare B dopo aver osservato A è la stessa che si ha di osservare B dopo aver osservato C. Un po’ come se A e B, ai fini dei loro effetti, fossero equivalenti.

Possiamo dirlo in modo più formale. Supponiamo che quando accade A accada anche C:

h] (A|C) = 1

allora

i] (A|B) = (A|C)(C|B) = (C|B)

che è quanto volevasi dimostrare.

Insomma, in questa circostanza la correlazione fra A e C non c’è più una probabilità, ma una certezza. Dal punto di vista fisico siamo quindi passati da una formulazione probabilistica ad una deterministica.

Se ora torniamo alla nostra equazione, dobbiamo dedurre che fra |I,t₀) e |Ψ,t₁) c’è, appunto, una correlazione deterministica.

Possiamo allora pensare che l’evento virtuale associato a |Ψ,t₁) sia l’evoluzione deterministica nel tempo dell’evento reale associato a |I,t₀)

Possiamo allora introdurre in V un operatore H(t₀,t₁) che trasforma |I,t₀) in |Ψ,t₁).

Lo chiameremo, che so, “propagatore temporale”.

Conoscendo questo operatore (o le equazioni per ricavarlo) avremo così recuperato l’aspetto deterministico all’interno della nostra teoria probabilistica.

Abbiamo così degli oggetti |Ψ,t) tali che:

1) evolvono in modo deterministico nel tempo;

2) hanno un significato fisico probabilistico, perché essi ci consentono solo di calcolare la probabilità che si verifichi un certo evento;

3) a parte quelli associati agli “eventi reali”, essi per lo più devono essere concepiti come “eventi virtuali”, ovvero “sovrapposizioni” di eventi reali.

“Stati” e “collassi”

Abbiamo visto che il prezzo da pagare per poter introdurre una evoluzione deterministica nel nostro formalismo è stato assai pesante dal punto di vista concettuale.

Ma avremmo potuto fare di peggio.

Fin qui abbiamo sempre detto che un evento fornisce delle informazioni sullo stato del sistema che stiamo osservando.

Supponiamo ora di convincerci che una certa collezione di eventi I ci fornisca la massima informazione possibile sullo stato del sistema in un certo istante di tempo.

Ora, il concetto di “stato” è un assai delicato, perché coinvolge quello di “proprietà”, le quali devono poter essere “assegnate” ad un sistema, altrimenti non si può definire il concetto di stato.

Tuttavia a noi potrebbe venire la tentazione di evitare queste sottigliezze epistemologiche, e dire che la massima informazione sullo stato di fatto è lo stato del sistema.

Come dire che se fotografo una persona da tutte le angolazioni possibili l’insieme di quelle fotografie sono la persona.

Potremmo essere tentati di fare questo perché in questo modo nella nostra formulazione probabilistica della meccanica classica potremmo affermare che c’è uno “stato” che evolve deterministicamente nel tempo.

E questo può essere piacevole. Solo che ci troviamo ad affrontare un paio di problemi concettuali enormi.

Prendiamo il solito dado, con una variante. Lo mettiamo in una scatola chiusa, e agitiamo la scatola, poi aspettiamo che il dado si sia fermato.

Mettiamo in |I,t₀) tutte le osservazioni che abbiamo fatto sul dado, e diciamo che quello è lo “stato iniziale” del dado.

A questo punto facciamo evolvere nel tempo quello “stato”, ed al tempo t₁ abbiamo un nuovo stato |Ψ,t). Ora, se sviluppiamo questo “stato” nella “base” di tutti i risultati possibili [1], [2], ecc. esso sarà in generale una “sovrapposizione” di tutti questi “stati”, poiché sappiamo che tutti i risultati sono equiprobabili.

Quindi al tempo t₁, quando il dado ha finito di rotolare e noi non abbiamo ancora aperto la scatola, si avrà:

|Ψ,t₁) = 1/6 |1) + 1/6 |2) + 1/6 |3) + 1/6 |4) + 1/6 |5) + 1/6 |6)

Immaginiamo allora di aprire la scatola e di osservare quale dei sei eventi possibili si è verificato.

Mettiamo che sia uscito il [3].

Ora, se noi a partire da quella osservazione vogliamo costruire un’altra catena di eventi, come “stato iniziale” dovremmo prendere il [3]. Dal che se ne deduce che nell’istante in cui osserviamo il dado lo “stato” del sistema, che era una “sovrapposizione di stati reali”, “collassa” su un unico stato, con una probabilità 1/6 di “collassare” su ognuno degli stati possibili.

Non solo, ma dal momento che nel nostro spazio vettoriale quegli stati formano una base, potremo anche costruire un operatore ortogonale che abbia quegli stati come autostati, e poi dire che ogni osservazione del sistema fa “collassare” lo stato del sistema su un autostato di un certo operatore ortogonale associato a quella particolare osservazione.

Ci troviamo così con un dado che prima di essere osservato poggia su “una sovrapposizione di facce” e, nell’istante in cui lo si osserva, “collassa” su una faccia particolare.

Potremmo usare lo stesso metodo anche per tenere i gatti contemporaneamente vivi e morti, e tutto ciò usando semplicemente la meccanica classica.