Partnership
Come lavora SETI@home
di Ron Hipschman
Titolo originale
"How
SETI@home works"
Traduzione di Bruno
Moretti Turri IK2WQA, SETI ITALIA G. Cocconi
Il
Problema: Montagne di dati
La maggior parte dei programmi SETI in atto oggi, incluso quello
dell’ Università di Berkeley,
utilizzano grandi computer che analizzano i dati provenienti dai
radiotelescopi in tempo reale.
Nessuno di questi computer analizza i dati veramente a fondo alla
ricerca di segnali deboli,
nè verifica la presenza di una grande classe di segnali (di
cui parleremo in seguito…).
La ragione è la limitata potenza di calcolo dei computer
disponibili per l’analisi dei dati.
Per rilevare la presenza dei segnali più deboli,
è necessaria una grande potenza di calcolo.
Ci vorrebbe un supercomputer enorme per eseguire i calcoli necessari.
I programmi SETI, solitamente, non hanno a disposizione i fondi
necessari per costruire o comprare
questi supercomputer. Tuttavia si può raggiungere un
compromesso; invece di utilizzare uno di questi
mostri, è possibile utilizzare un computer più
piccolo, che impiegherà più tempo a svolgere il
lavoro.
Così facendo, però, si accumulerebbero moltissimi
dati da analizzare.
Cosa succederebbe se si utilizzassero miriadi di piccoli computer che
lavorassero contemporaneamente
su differenti porzioni dei dati da analizzare? Dove lo staff del SETI
potrebbe trovare migliaia di
computer di cui ha bisogno per analizzare i dati che arrivano
continuamente dal radiotelescopio di Arecibo?
Lo staff del SETI dell’Università di Berkeley ha
scoperto che ci sono già migliaia di computer pronti
per l’utilizzo. La maggior parte di questi computer rimane
inutilizzato la maggior parte del tempo, facendo
girare degli screensaver inutili e sprecando elettricità. E
qui entra in gioco SETI@home (e anche voi!).
Il progetto SETI@home spera che tu ci consenta di utilizzare il tuo
computer quando non lo utilizzi tu
e ci aiuti a “…cercare nuove forme di vita e nuove
civiltà.” Questo sarà possibile grazie
ad uno screensaver
capace di prendere una porzione di dati attraverso Internet,
analizzarli, e spedirci i risultati dell’elaborazione.
Quando avrai bisogno del tuo computer, il nostro screensaver
rilascerà istantaneamente il computer
e riprenderà l’elaborazione solamente quando avrai
finito di utilizzarlo.
E’ un compito interessante e difficile. Ci sono talmente
tanti dati da analizzare che sembra impossibile!
Fortunatamente, i dati possono essere facilmente divisi in piccole
parti da analizzare separatamente
e parallelamente. Nessuna di queste parti dipende dalle altre. Inoltre,
solo una limitata porzione di cielo è
visibile da Arecibo. Nei prossimi due anni l’intero cielo
così come è visto dal radiotelescopio
verrà
scandagliato tre volte. Pensiamo che sia abbastanza per questo
progetto. Quando avremo scrutato il cielo
per tre volte, ci saranno nuovi telescopi, nuovi esperimenti, e nuovi
tipi di approccio alla ricerca SETI.
Speriamo di coinvolgerti anche in quel tipo di ricerca!
La
divisione dei dati
I dati vengono registrati su nastri ad alta densità al
radiotelescopio di Arecibo (Puerto Rico), arrivando
a riempire un nastro DLT da 35 Gbyte ogni giorno. Poiché
ad Arecibo non è disponibile una connessione
a larga banda ad Internet, i nastri vengono spediti per posta ordinaria
a Berkeley.
Successivamente i dati vengono divisi in pezzi da 0,25 Mbyte (che
chiameremo “work-units”, unità di
lavoro).
Questi pezzi, che devono essere analizzati, vengono spediti tramite
Internet dal server Seti@Home
alle persone che partecipano al progetto sparse in tutto il mondo.
Come viene diviso il
flusso di dati

SETI@home scandaglia una banda di 2,5 MHz, centrata sui 1420 MHz.
Tuttavia questo spettro è troppo ampio per essere spedito
agli utenti per essere analizzato, così viene
diviso in 256 parti, che misurano 10 kHz ognuna (per la precisione 9766
Hz).
Questa operazione viene eseguita via software grazie ad un programma
chiamato
“splitter”.
I pezzi da 10 kHz sono sicuramente più maneggevoli come
dimensioni.
Per registrare un segnale a 10 kHz bisogna registrare 20.000 bits al
secondo (kbps), (frequenza di Nyquist).
Ad ogni utente vengono spediti circa 107 secondi di questo segnale a 10
kHz.
100 secondi per 20.000 bits al secondo equivalgono a 2.000.000 di bits,
ovvero 0,25 megabyte,
essendoci 8 bits per byte. Questo pezzo di circa 0,25 megabyte viene
appunto chiamato “work-unit”
(unità di lavoro). All’utente vengono inoltre
spediti molti dati addizionali sulla “work-unit”,
arrivando così ad un totale di circa 340 kbytes di dati.
Trasmissione
dei dati
Il client SETI@home si connette solamente quando deve trasferire dei
dati.
Questo accade quando lo screensaver ha finito di analizzare la
work-unit (unità di lavoro) e vuole
spedire indietro i risultati (e prendere un’altra work-unit).
Questo viene fatto solamente con
il permesso dell’utente, permettendogli di controllare quando
il computer si connette al server,
o dando la possibilità allo screensaver di connettersi
automaticamente una volta terminata l’analisi
della work-unit corrente. La trasmissione dei dati dura meno di 5
minuti con la maggior parte dei
modem e viene chiusa non appena il trasferimento dei dati è
completato.
All’Università di Berkeley
c’è un grande database che tiene traccia di ogni
work-unit che viene
completata; queste work-unit vengono riunite insieme nel database e
marcate come “done” (fatta).
I computers di Berkeley prendono una nuova work-unit, la spediscono
all’utente, e la segnano nel
database come “in progress” (in elaborazione). Ogni
work-unit viene spedita a più utenti per essere
sicuri che i dati vengano processati correttamente. Anche sistemi
funzionanti correttamente possono
compiere errori di tanto in tanto. Se un sistema non è in
grado di completare l’elaborazione,
o il computer “crasha” perdendo i risultati
dell’elaborazione, i dati non andranno comunque perduti.
Cosa
sta cercando SETI@home?
Quindi, cosa puoi fare per noi? Che cosa dovrai cercare esattamente tra
i dati?
Il modo più semplice per rispondere a questa domanda
è chiederci cosa ci aspettiamo che ci venga
trasmesso da un' intelligenza extraterrestre. Ci si aspetta che mandino
un segnale nel modo più
efficiente possibile per LORO, e che permetta a NOI di rilevare il
messaggio in modo semplice.
Ora, si è notato che spedire un messaggio su molte frequenze
non è molto efficiente.
E' dispendioso in termini di energia. Se si concentra l'energia che
serve per spedire un messaggio
entro un ristretto range di frequenza (ampiezza di banda stretta)
è più facile distinguere il segnale
dal rumore di fondo (noise). Questo è particolarmente
importante, dal momento che si ipotizza
che essi siano lontani abbastanza da far sì che i loro
segnali siano molto deboli quando arriveranno
fino a noi. Perciò, non cerchiamo un segnale a banda larga
(esteso per molte frequenze),
ma cerchiamo un messaggio ad una ben specifica frequenza. Il
salvaschermo del SETI@home
si comporta come il sintonizzatore della vostra radio che cambia
diversi canali, controllando il
segnale sul potenziometro. Se il potenziometro si alza,
attirerà la nostra attenzione.
Un altro fattore che ci aiuta a scartare i segnali locali (terrestri o
satellitari) è che le sorgenti locali
sono più o meno costanti e quindi mantengono la loro
intensità costante nel tempo.
D'altra parte, il radiotelescopio di Arecibo è in posizione
fissa.
Quando SETI@home è in funzione, il telescopio non segue il
movimento delle stelle.
Per questa ragione, il cielo si sposta fuori dal fuoco del telescopio.
Solitamente, affinchè il bersaglio attraversi il fuoco del
disco ci vogliono 12 secondi (il "campo dell'obiettivo").
Perciò ci si aspetta che un segnale extraterrestre diventi
forte e poi debole in un periodo di 12 secondi.
Dal momento che stiamo cercando questo segnale "gaussiano" di 12
secondi, noi ti mandiamo circa
100 secondi di dati. Inoltre viene fatto in modo che i dati contenuti
in ogni unità di lavoro si sovrappongano
un poco in modo tale da non perdere un eventuale segnale importante
tagliandolo troppo presto durante l'analisi
Vedi la sezione sulla RFI
(Interferenza da Radio Frequenza) per ulteriori dettagli.
Vediamo alcuni esempi. Se hai
RealAudio, puoi
anche ascoltare le simulazioni del suono che potrebbe
avere (tuttavia ricorda che questi segnali sono onde radio non onde
sonore...).
Clicca sul grafico per sentire un suono in RealAudio
Questo grafico (come gli altri più avanti) mostra il tempo
in progressione sull'asse orizzontale (asse X).
L'asse verticale (asse Y) rappresenta la frequenza, o picco, del
segnale.
Qui puoi veder un segnale a banda larga. Si trovano mescolate assieme
molte frequenze.
Nota che il segnale inizia debolmente (fioco) sulla sinistra,
e si fa sempre più forte (luminoso) fino a
raggiungere un massimo al centro del grafico 6 secondi più
tardi, per scomparire nei 6 secondi successivi.
Questo è quello che ci si aspetterebbe da un segnale
extra-terrestre nel momento in cui passasse davanti
al telescopio. Sfortunatamente, non siamo alla ricerca di fonti a banda
larga.
Questo sarebbe probabilmente il modo in cui si manifesterebbe una
stella oppure qualche altra fonte
astronomica naturale. Le fonti a banda larga non vengono prese in
considerazione.
E' piuttosto questo quello che noi cerchiamo. Qui si vede che il
segnale è molto più stretto in quanto
a gamma di frequenza. Inoltre si fa più forte e poi
più debole in un periodo di tempo di 12 secondi.
Non sappiamo quanto stretta sarà la larghezza di banda,
pertanto procederemo ad un controllo
di parecchie larghezze di banda. Clicca sul grafico per sentire un
suono in RealAudio

Se i nostri amici dallo spazio tenteranno di inserire nel loro segnale
delle informazioni vere e proprie
(il che è altamente probabile), il segnale sarà
quasi sicuramente pulsato.
Anche questo sarà nostro compito cercare. Clicca sul grafico
per sentire un suono in RealAudio

Poiché i pianeti ruotano, tanto il trasmettitore
extraterrestre quanto il nostro telescopio si muovono
su percorsi circolari attorno all'asse del proprio pianeta. Questo
movimento si manifesta con un
relativo cambiamento di velocità durante il corso
dell'osservazione. Per questa ragione, è probabile
che si verifichi uno "spostamento Doppler" o un cambiamento di
frequenza del segnale a causa
dei nostri rispettivi moti. Questo potrebbe fare in modo che il segnale
si alzi o si abbassi leggermente
di frequenza durante i 12 secondi. Questi vengono chiamati
segnali-chirped.
Anche questi sarà nostro compito controllare. Clicca sul
grafico per sentire un suono in RealAudio

Naturalmente controlleremo anche un segnale interessato da
uno spostamento Doppler (chirped)
che contenga anche delle pulsazioni! Clicca sul grafico per sentire un
suono in RealAudio
Sezione
aggiuntiva: Ulteriori dettagli relativi all'analisi
Il software relativo a SETI@home ricerca segnali all'incirca 10 volte
più deboli di quelli ricercati
dal SERENDIP IV di Arecibo, poiché si serve di un algoritmo
a calcolo intensivo chiamato
"integrazione coerente". Nessun altro (compreso il programma SERENDIP)
è riuscito finora ad
avere una capacità di calcolo tale da rendere possibile
l'impiego di questo metodo.
Il tuo computer esegue velocemente sui dati Trasformate rapide di
Fourier, alla ricerca di segnali
forti a varie combinazioni di frequenza, larghezza di banda e indici di
chirp.
Su ciascuna unità di lavoro che riceverai da noi verranno
prese le seguenti misure.
Guardiamo prima la porzione di calcolo più intensiva da un
punto di vista computazionale.
Il primo compito da eseguire è quello di togliere il chirp
ai dati, vale a dire rimuovere tutti gli effetti
dell'accelerazione Doppler. Alla più alta
risoluzione, bisognerà fare questa operazione per un totale
di 20.000 volte, da -10 Hz/sec fino a +10 Hz/sec a intervalli di 0,002
Hz/sec.
Ad ogni indice di chirp, i 107 secondi di dati vengono de-chirpati e
poi suddivisi in 8 blocchi da
13,375 secondi ciascuno. Ciascun blocco da 13,375 secondi viene poi
preso in esame secondo
una larghezza di banda da 0,07 Hz per i picchi (il che
significa 131.072 controlli per ogni blocco
ad ogni indice di chirp!) Si tratta di moltissimi calcoli! In questo
primo passo, il tuo computer
compie all'incirca 200 miliardi di calcoli! Non eseguiamo alcuni test
tra i 10 Hz/sec e i 50 Hz/sec.
Non abbiamo ancora finito, perché dobbiamo ancora verificare
le altre larghezze di banda.
Il passo successivo raddoppia la larghezza di banda fino a 0,15 Hz.
Dobbiamo soltanto esaminare
1/4 del numero di indici a causa dell'aumento della larghezza di banda.
Finiamo col fare all'incirca
un quarto dell'intero lavoro che abbiamo compiuto sopra alla larghezza
di banda stretta con
la risoluzione più alta, o circa 50 miliardi di calcoli. Un
gioco da ragazzi...
Il passo successivo raddoppia di nuovo la larghezza di banda (da 0,15
fino a 0,3 Hz) e riduce
di nuovo i chirp di 1/4. Questo passo (e tutti quelli successivi)
richiede un quarto del calcolo
del passo precedente. In questo caso soltanto 12,5 miliardi di calcoli.
Questo va avanti per un totale di 14 raddoppiamenti di larghezza di
banda
(0,07 - 0,15 - 0,3 - 0,6 - 1,2 - 2,5 - 5 - 10 - 20 - 40 - 75 - 150 -
300 - 600 e 1200 Hz)
fino ad arrivare ad un totale di un po' più di 275 miliardi
di operazioni nei 107 secondi di dati.
Come puoi vedere, il nostro lavoro viene compiuto, per la gran parte,
nella larghezza di banda
più stretta (all'incirca il 70% del lavoro).
Infine, i segnali che indicano una forte intensità in
qualche particolare combinazione di frequenza,
larghezza di banda e chirp sono soggetti ad un controllo relativo
all'interferenza terrestre.
Solo se l'intensità sale e poi scende nel giro di 12 secondi
(il tempo impiegato da un punto
nel cielo per passare nel campo del telescopio) il segnale
può essere provvisoriamente considerato
di natura extraterrestre. Vengono registrati anche i picchi (spikes,
brevi lampi radio)
al di sopra di un dato valore di soglia.
Trovare
segnali pulsati
Tutto quanto detto sopra viene fatto solo per trovare un segnale
extraterrestre continuo -
uno che sia "sempre acceso", oppure pulsazioni intense. E se
i nostri amici alieni tentassero
di mandarci dei segnali tramite una serie di impulsi distanziati tra
loro secondo una certa regolarità?
Significa che dobbiamo cercare anche un segnale che abbia una
variazione regolare di intensità
nel tempo. SETI@home applica due tipi di controllo. Uno ricerca
triplette (triplets) pulsate
relativamente forti. L'altro cerca pulsazioni (pulses)
equidistanti, ma deboli.
Il test sulle triplette è piuttosto semplice. Per ogni
porzione di frequenza nello spettro, il computer
ricerca impulsi al di sopra di un determinato valore di soglia. Questa
soglia viene stabilita ad un valore
tale da rivelare un numero ragionevole di impulsi senza sopraffarci col
rumore (noise)
che ci provocherebbe tutta una serie di calcoli inutili.
Per ogni coppia di pulsazioni al di sopra della soglia, il salvaschermo
ricerca un impulso che si trovi
tra le due. Se riesce a trovarne uno, il salvaschermo lo registra e
rispedisce i dati a Berkeley.
Il salvaschermo compie questa operazione in modo intelligente,
così da non ripetersi nel tentare TUTTE le coppie.
Ricorda che deve fare questo per OGNI porzione di frequenza nel tuo
campione da 10kHz!
Il secondo metodo di ricognizione di impulsi è un po'
più complicato.
E' stato progettato dal team di SETI@home proprio a questo scopo.
Si chiama "algoritmo a ripiegamento veloce" ("fast folding
algorithm"). Ancora una volta compiamo
questa analisi su ciascuna porzione di frequenza nel tuo campione di
dati da 10kHz. Questo metodo
è stato progettato per individuare tutta una serie di
piccoli impulsi che si ripetono nei dati.
Questi piccoli impulsi potrebbero anche essere talmente deboli da
sembrare dispersi in mezzo
al rumore ed essere impossibili da individuare. Cominciamo selezionando
una porzione di frequenza
dai dati messi ad esaminare. Adesso osserviamo questa
intensità in relazione ai dati temporali
degli impulsi stessi. Il salvaschermo suddivide i dati in blocchi
dotati della stessa estensione temporale
e aggiunge i blocchi l'uno all'altro. Se l'estensione del blocco
temporale è la stessa (o un multiplo)
del periodo degli impulsi, tutti gli impulsi ne aggiungeranno uno sopra
l'altro e vedremo gli impulsi
venir fuori dal rumore. La parte difficile qui sta nel fatto che
dobbiamo indovinare l'esatta estensione
per la porzione di tempo presa in esame. Dal momento che non abbiamo
alcuna idea di quale
potrebbe essere la frequenza degli impulsi, dobbiamo provare TUTTI i
vari periodi di tempo.
Di nuovo, l'algoritmo fa questo in modo tale che non venga ripetuto il
lavoro già compiuto.
Se si trovano degli impulsi ripetuti, essi vengono registrati e
rispediti a Berkeley.
Quanto tempo richiedono tutti questi calcoli? Un computer medio
dovrebbe impiegarci dalle 10
alle 50 ore per completare un' unità di lavoro.
Ammesso però che il computer lavori SOLTANTO su SETI@home.
A seconda di come il telescopio si stava muovendo quando
l'unità di lavoro è stata registrata,
il tuo computer compirà tra i 2.4 e i 3.8 trilioni di
operazioni matematiche
(flops, floating point operations od operazioni a virgola mobile in
gergo tecnico)
per completare il proprio lavoro.
Adesso sai
perché abbiamo bisogno del tuo aiuto!
Torna
alla home
Copyright © 2004 University of California
Versione Italiana Copyright © 2004 Bruno Moretti Turri