Come lavora SETI@home

Partnership

Come lavora SETI@home
di Ron Hipschman
Titolo originale "How SETI@home works"
Traduzione di Bruno Moretti Turri IK2WQA, SETI ITALIA G. Cocconi

Il Problema: Montagne di dati

La maggior parte dei programmi SETI in atto oggi, incluso quello dell’ Università di Berkeley,
utilizzano grandi computer che analizzano i dati provenienti dai radiotelescopi in tempo reale.
Nessuno di questi computer analizza i dati veramente a fondo alla ricerca di segnali deboli,
nè verifica la presenza di una grande classe di segnali (di cui parleremo in seguito…).
La ragione è la limitata potenza di calcolo dei computer disponibili per l’analisi dei dati.
Per rilevare la presenza dei segnali più deboli, è necessaria una grande potenza di calcolo.
Ci vorrebbe un supercomputer enorme per eseguire i calcoli necessari.
I programmi SETI, solitamente, non hanno a disposizione i fondi necessari per costruire o comprare
questi supercomputer. Tuttavia si può raggiungere un compromesso; invece di utilizzare uno di questi
mostri, è possibile utilizzare un computer più piccolo, che impiegherà più tempo a svolgere il lavoro.
Così facendo, però, si accumulerebbero moltissimi dati da analizzare.
Cosa succederebbe se si utilizzassero miriadi di piccoli computer che lavorassero contemporaneamente
su differenti porzioni dei dati da analizzare? Dove lo staff del SETI potrebbe trovare migliaia di
computer di cui ha bisogno per analizzare i dati che arrivano continuamente dal radiotelescopio di Arecibo?

Lo staff del SETI dell’Università di Berkeley ha scoperto che ci sono già migliaia di computer pronti
per l’utilizzo. La maggior parte di questi computer rimane inutilizzato la maggior parte del tempo, facendo
girare degli screensaver inutili e sprecando elettricità. E qui entra in gioco SETI@home (e anche voi!).
Il progetto SETI@home spera che tu ci consenta di utilizzare il tuo computer quando non lo utilizzi tu
e ci aiuti a “…cercare nuove forme di vita e nuove civiltà.” Questo sarà possibile grazie ad uno screensaver
capace di prendere una porzione di dati attraverso Internet, analizzarli, e spedirci i risultati dell’elaborazione.
Quando avrai bisogno del tuo computer, il nostro screensaver rilascerà istantaneamente il computer
e riprenderà l’elaborazione solamente quando avrai finito di utilizzarlo.

E’ un compito interessante e difficile. Ci sono talmente tanti dati da analizzare che sembra impossibile!
Fortunatamente, i dati possono essere facilmente divisi in piccole parti da analizzare separatamente
e parallelamente. Nessuna di queste parti dipende dalle altre. Inoltre, solo una limitata porzione di cielo è
visibile da Arecibo. Nei prossimi due anni l’intero cielo così come è visto dal radiotelescopio verrà
scandagliato tre volte. Pensiamo che sia abbastanza per questo progetto. Quando avremo scrutato il cielo
per tre volte, ci saranno nuovi telescopi, nuovi esperimenti, e nuovi tipi di approccio alla ricerca SETI.
Speriamo di coinvolgerti anche in quel tipo di ricerca!

La divisione dei dati

I dati vengono registrati su nastri ad alta densità al radiotelescopio di Arecibo (Puerto Rico), arrivando
a riempire un nastro DLT da 35 Gbyte ogni giorno. Poiché ad Arecibo non è disponibile una connessione
a larga banda ad Internet, i nastri vengono spediti per posta ordinaria a Berkeley.
Successivamente i dati vengono divisi in pezzi da 0,25 Mbyte (che chiameremo “work-units”, unità di lavoro).
Questi pezzi, che devono essere analizzati, vengono spediti tramite Internet dal server Seti@Home
alle persone che partecipano al progetto sparse in tutto il mondo.

Come viene diviso il flusso di dati

SETI@home scandaglia una banda di 2,5 MHz, centrata sui 1420 MHz.
Tuttavia questo spettro è troppo ampio per essere spedito agli utenti per essere analizzato, così viene
diviso in 256 parti, che misurano 10 kHz ognuna (per la precisione 9766 Hz).
Questa operazione viene eseguita via software grazie ad un programma chiamato “splitter”.
I pezzi da 10 kHz sono sicuramente più maneggevoli come dimensioni.
Per registrare un segnale a 10 kHz bisogna registrare 20.000 bits al secondo (kbps), (frequenza di Nyquist).
Ad ogni utente vengono spediti circa 107 secondi di questo segnale a 10 kHz.
100 secondi per 20.000 bits al secondo equivalgono a 2.000.000 di bits, ovvero 0,25 megabyte,
essendoci 8 bits per byte. Questo pezzo di circa 0,25 megabyte viene appunto chiamato “work-unit”
(unità di lavoro). All’utente vengono inoltre spediti molti dati addizionali sulla “work-unit”,
arrivando così ad un totale di circa 340 kbytes di dati.

Trasmissione dei dati

Il client SETI@home si connette solamente quando deve trasferire dei dati.
Questo accade quando lo screensaver ha finito di analizzare la work-unit (unità di lavoro) e vuole
spedire indietro i risultati (e prendere un’altra work-unit). Questo viene fatto solamente con
il permesso dell’utente, permettendogli di controllare quando il computer si connette al server,
o dando la possibilità allo screensaver di connettersi automaticamente una volta terminata l’analisi
della work-unit corrente. La trasmissione dei dati dura meno di 5 minuti con la maggior parte dei
modem e viene chiusa non appena il trasferimento dei dati è completato.

All’Università di Berkeley c’è un grande database che tiene traccia di ogni work-unit che viene
completata; queste work-unit vengono riunite insieme nel database e marcate come “done” (fatta).
I computers di Berkeley prendono una nuova work-unit, la spediscono all’utente, e la segnano nel
database come “in progress” (in elaborazione). Ogni work-unit viene spedita a più utenti per essere
sicuri che i dati vengano processati correttamente. Anche sistemi funzionanti correttamente possono
compiere errori di tanto in tanto. Se un sistema non è in grado di completare l’elaborazione,
o il computer “crasha” perdendo i risultati dell’elaborazione, i dati non andranno comunque perduti.

Cosa sta cercando SETI@home?

Quindi, cosa puoi fare per noi? Che cosa dovrai cercare esattamente tra i dati?
Il modo più semplice per rispondere a questa domanda è chiederci cosa ci aspettiamo che ci venga
trasmesso da un' intelligenza extraterrestre. Ci si aspetta che mandino un segnale nel modo più
efficiente possibile per LORO, e che permetta a NOI di rilevare il messaggio in modo semplice.
Ora, si è notato che spedire un messaggio su molte frequenze non è molto efficiente.
E' dispendioso in termini di energia. Se si concentra l'energia che serve per spedire un messaggio
entro un ristretto range di frequenza (ampiezza di banda stretta) è più facile distinguere il segnale
dal rumore di fondo (noise). Questo è particolarmente importante, dal momento che si ipotizza
che essi siano lontani abbastanza da far sì che i loro segnali siano molto deboli quando arriveranno
fino a noi. Perciò, non cerchiamo un segnale a banda larga (esteso per molte frequenze),
ma cerchiamo un messaggio ad una ben specifica frequenza. Il salvaschermo del SETI@home
si comporta come il sintonizzatore della vostra radio che cambia diversi canali, controllando il
segnale sul potenziometro. Se il potenziometro si alza, attirerà la nostra attenzione.

Un altro fattore che ci aiuta a scartare i segnali locali (terrestri o satellitari) è che le sorgenti locali
sono più o meno costanti e quindi mantengono la loro intensità costante nel tempo.
D'altra parte, il radiotelescopio di Arecibo è in posizione fissa.
Quando SETI@home è in funzione, il telescopio non segue il movimento delle stelle.
Per questa ragione, il cielo si sposta fuori dal fuoco del telescopio.
Solitamente, affinchè il bersaglio attraversi il fuoco del disco ci vogliono 12 secondi (il "campo dell'obiettivo").
Perciò ci si aspetta che un segnale extraterrestre diventi forte e poi debole in un periodo di 12 secondi.
Dal momento che stiamo cercando questo segnale "gaussiano" di 12 secondi, noi ti mandiamo circa
100 secondi di dati. Inoltre viene fatto in modo che i dati contenuti in ogni unità di lavoro si sovrappongano
un poco in modo tale da non perdere un eventuale segnale importante tagliandolo troppo presto durante l'analisi

Vedi la sezione sulla RFI (Interferenza da Radio Frequenza) per ulteriori dettagli.

Vediamo alcuni esempi. Se hai RealAudio, puoi anche ascoltare le simulazioni del suono che potrebbe
avere (tuttavia ricorda che questi segnali sono onde radio non onde sonore...).

Clicca sul grafico per sentire un suono in RealAudio
Questo grafico (come gli altri più avanti) mostra il tempo in progressione sull'asse orizzontale (asse X).
L'asse verticale (asse Y) rappresenta la frequenza, o picco, del segnale.
Qui puoi veder un segnale a banda larga. Si trovano mescolate assieme molte frequenze.
Nota che il segnale inizia debolmente (fioco) sulla sinistra, e si fa sempre più forte (luminoso) fino a
raggiungere un massimo al centro del grafico 6 secondi più tardi, per scomparire nei 6 secondi successivi.
Questo è quello che ci si aspetterebbe da un segnale extra-terrestre nel momento in cui passasse davanti
al telescopio. Sfortunatamente, non siamo alla ricerca di fonti a banda larga.
Questo sarebbe probabilmente il modo in cui si manifesterebbe una stella oppure qualche altra fonte
astronomica naturale. Le fonti a banda larga non vengono prese in considerazione.

E' piuttosto questo quello che noi cerchiamo. Qui si vede che il segnale è molto più stretto in quanto
a gamma di frequenza. Inoltre si fa più forte e poi più debole in un periodo di tempo di 12 secondi.
Non sappiamo quanto stretta sarà la larghezza di banda, pertanto procederemo ad un controllo
di parecchie larghezze di banda. Clicca sul grafico per sentire un suono in RealAudio

Se i nostri amici dallo spazio tenteranno di inserire nel loro segnale delle informazioni vere e proprie
(il che è altamente probabile), il segnale sarà quasi sicuramente pulsato.
Anche questo sarà nostro compito cercare. Clicca sul grafico per sentire un suono in RealAudio

Poiché i pianeti ruotano, tanto il trasmettitore extraterrestre quanto il nostro telescopio si muovono
su percorsi circolari attorno all'asse del proprio pianeta. Questo movimento si manifesta con un
relativo cambiamento di velocità durante il corso dell'osservazione. Per questa ragione, è probabile
che si verifichi uno "spostamento Doppler" o un cambiamento di frequenza del segnale a causa
dei nostri rispettivi moti. Questo potrebbe fare in modo che il segnale si alzi o si abbassi leggermente
di frequenza durante i 12 secondi. Questi vengono chiamati segnali-chirped.
Anche questi sarà nostro compito controllare. Clicca sul grafico per sentire un suono in RealAudio

Naturalmente controlleremo anche un segnale interessato da uno spostamento Doppler (chirped)
che contenga anche delle pulsazioni! Clicca sul grafico per sentire un suono in RealAudio

Sezione aggiuntiva: Ulteriori dettagli relativi all'analisi

Il software relativo a SETI@home ricerca segnali all'incirca 10 volte più deboli di quelli ricercati
dal SERENDIP IV di Arecibo, poiché si serve di un algoritmo a calcolo intensivo chiamato
"integrazione coerente". Nessun altro (compreso il programma SERENDIP) è riuscito finora ad
avere una capacità di calcolo tale da rendere possibile l'impiego di questo metodo.
Il tuo computer esegue velocemente sui dati Trasformate rapide di Fourier, alla ricerca di segnali
forti a varie combinazioni di frequenza, larghezza di banda e indici di chirp.
Su ciascuna unità di lavoro che riceverai da noi verranno prese le seguenti misure.

Guardiamo prima la porzione di calcolo più intensiva da un punto di vista computazionale.
Il primo compito da eseguire è quello di togliere il chirp ai dati, vale a dire rimuovere tutti gli effetti
dell'accelerazione Doppler. Alla più alta risoluzione, bisognerà fare questa operazione per un totale
di 20.000 volte, da -10 Hz/sec fino a +10 Hz/sec a intervalli di 0,002 Hz/sec.
Ad ogni indice di chirp, i 107 secondi di dati vengono de-chirpati e poi suddivisi in 8 blocchi da
13,375 secondi ciascuno. Ciascun blocco da 13,375 secondi viene poi preso in esame secondo
una larghezza di banda da 0,07 Hz per i picchi (il che significa 131.072 controlli per ogni blocco
ad ogni indice di chirp!) Si tratta di moltissimi calcoli! In questo primo passo, il tuo computer
compie all'incirca 200 miliardi di calcoli! Non eseguiamo alcuni test tra i 10 Hz/sec e i 50 Hz/sec.

Non abbiamo ancora finito, perché dobbiamo ancora verificare le altre larghezze di banda.
Il passo successivo raddoppia la larghezza di banda fino a 0,15 Hz. Dobbiamo soltanto esaminare
1/4 del numero di indici a causa dell'aumento della larghezza di banda. Finiamo col fare all'incirca
un quarto dell'intero lavoro che abbiamo compiuto sopra alla larghezza di banda stretta con
la risoluzione più alta, o circa 50 miliardi di calcoli. Un gioco da ragazzi...

Il passo successivo raddoppia di nuovo la larghezza di banda (da 0,15 fino a 0,3 Hz) e riduce
di nuovo i chirp di 1/4. Questo passo (e tutti quelli successivi) richiede un quarto del calcolo
del passo precedente. In questo caso soltanto 12,5 miliardi di calcoli.
Questo va avanti per un totale di 14 raddoppiamenti di larghezza di banda
(0,07 - 0,15 - 0,3 - 0,6 - 1,2 - 2,5 - 5 - 10 - 20 - 40 - 75 - 150 - 300 - 600 e 1200 Hz)
fino ad arrivare ad un totale di un po' più di 275 miliardi di operazioni nei 107 secondi di dati.
Come puoi vedere, il nostro lavoro viene compiuto, per la gran parte, nella larghezza di banda
più stretta (all'incirca il 70% del lavoro).
Infine, i segnali che indicano una forte intensità in qualche particolare combinazione di frequenza,
larghezza di banda e chirp sono soggetti ad un controllo relativo all'interferenza terrestre.
Solo se l'intensità sale e poi scende nel giro di 12 secondi (il tempo impiegato da un punto
nel cielo per passare nel campo del telescopio) il segnale può essere provvisoriamente considerato
di natura extraterrestre. Vengono registrati anche i picchi (spikes, brevi lampi radio)
al di sopra di un dato valore di soglia.

Trovare segnali pulsati

Tutto quanto detto sopra viene fatto solo per trovare un segnale extraterrestre continuo -
uno che sia "sempre acceso", oppure pulsazioni intense. E se i nostri amici alieni tentassero
di mandarci dei segnali tramite una serie di impulsi distanziati tra loro secondo una certa regolarità?
Significa che dobbiamo cercare anche un segnale che abbia una variazione regolare di intensità
nel tempo. SETI@home applica due tipi di controllo. Uno ricerca triplette (triplets) pulsate
relativamente forti. L'altro cerca pulsazioni (pulses) equidistanti, ma deboli.

Il test sulle triplette è piuttosto semplice. Per ogni porzione di frequenza nello spettro, il computer
ricerca impulsi al di sopra di un determinato valore di soglia. Questa soglia viene stabilita ad un valore
tale da rivelare un numero ragionevole di impulsi senza sopraffarci col rumore (noise)
che ci provocherebbe tutta una serie di calcoli inutili.
Per ogni coppia di pulsazioni al di sopra della soglia, il salvaschermo ricerca un impulso che si trovi
tra le due. Se riesce a trovarne uno, il salvaschermo lo registra e rispedisce i dati a Berkeley.
Il salvaschermo compie questa operazione in modo intelligente, così da non ripetersi nel tentare TUTTE le coppie.
Ricorda che deve fare questo per OGNI porzione di frequenza nel tuo campione da 10kHz!

Il secondo metodo di ricognizione di impulsi è un po' più complicato.
E' stato progettato dal team di SETI@home proprio a questo scopo.
Si chiama "algoritmo a ripiegamento veloce" ("fast folding algorithm"). Ancora una volta compiamo
questa analisi su ciascuna porzione di frequenza nel tuo campione di dati da 10kHz. Questo metodo
è stato progettato per individuare tutta una serie di piccoli impulsi che si ripetono nei dati.
Questi piccoli impulsi potrebbero anche essere talmente deboli da sembrare dispersi in mezzo
al rumore ed essere impossibili da individuare. Cominciamo selezionando una porzione di frequenza
dai dati messi ad esaminare. Adesso osserviamo questa intensità in relazione ai dati temporali
degli impulsi stessi. Il salvaschermo suddivide i dati in blocchi dotati della stessa estensione temporale
e aggiunge i blocchi l'uno all'altro. Se l'estensione del blocco temporale è la stessa (o un multiplo)
del periodo degli impulsi, tutti gli impulsi ne aggiungeranno uno sopra l'altro e vedremo gli impulsi
venir fuori dal rumore. La parte difficile qui sta nel fatto che dobbiamo indovinare l'esatta estensione
per la porzione di tempo presa in esame. Dal momento che non abbiamo alcuna idea di quale
potrebbe essere la frequenza degli impulsi, dobbiamo provare TUTTI i vari periodi di tempo.
Di nuovo, l'algoritmo fa questo in modo tale che non venga ripetuto il lavoro già compiuto.
Se si trovano degli impulsi ripetuti, essi vengono registrati e rispediti a Berkeley.
Quanto tempo richiedono tutti questi calcoli? Un computer medio dovrebbe impiegarci dalle 10
alle 50 ore per completare un' unità di lavoro.
Ammesso però che il computer lavori SOLTANTO su SETI@home.

A seconda di come il telescopio si stava muovendo quando l'unità di lavoro è stata registrata,
il tuo computer compirà tra i 2.4 e i 3.8 trilioni di operazioni matematiche
(flops, floating point operations od operazioni a virgola mobile in gergo tecnico)
per completare il proprio lavoro.

Adesso sai perché abbiamo bisogno del tuo aiuto!

Torna alla home

Copyright © 2004 University of California
Versione Italiana Copyright © 2004 Bruno Moretti Turri