codice binario e proteine

IL CODICE BINARIO E LE PROTEINE (Andrea Signorini)

Dagli elementi raccolti sembra che anche le proteine tendono a strutturarsi secondo una logica binaria, ad esempio:

1) l'organizazzione schematica di una catena polipeptidica mostra risonanza e dunque diversi "momenti di dipolo" che possono essere interpretati come altrettanti 0 e 1 (cfr. figura 1.8 a p. 9 di G.A. PETSKO - D. RINGE, "Struttura e funzione delle proteione", Zanichelli, Bologna, 1996 considerando le frecce verso l'alto come 1 e le frecce verso il basso come 0);

2) alla logica binaria risponde anche la struttura secondaria delle proteine come dimostrato dal successivo semplicissimo schema, utilizzabile per la formulazione degli algoritmi genetici, che descrive le proteine come una stringa di bit codificando i valori degli angoli di torsione f e y attorno al legame peptidico C-N

f	y	numero	codifica binaria
0°-120°	0°-120°	1	0001
0°-120°	120°-240°	2	0010
0°-120°	240°-360°	3	0011
120°-240°	0°-120°	4	0100
120°-240°	120°-240°	5	0101
120°-240°	240°-360°	6	0110
240°-360°	0°-120°	7	0111
240°-360°	120°-240°	8	1000
240°-360°	240°-360°	9	1001

Un frammento di proteina può dunque essere codificato, ad esempio*, come

amminoacido	Ala	Ser	Ser	Leu	Gly	Ala
f	118°	300°	270°	250°	40°	260°
y	250°	300°	306°	130°	50°	300°
numero	3	9	9	8	1	9
bit	0011	1001	1001	1000	0001	1001

cioè:

0011-1001-1001-1000-0001-1001

Il tutto tenendo conto, petaltro, che anche la struttura primaria di una proteina può essere tradotta secondo una codifica binaria basata sulla tavola binaria del codice genetico:


	A	B	C	D

A	UUU - 1000000 Phe (0) UUC - 1000001 Phe (1) UUA - 1000010 Leu (2) UUG - 1000011 Leu (3)	UCU - 0000100 Ser (4) UCC - 0000101 Ser (5) UCA - 0000110 Ser (6) UCG - 0000111 Ser (7)	UAU - 1001000 Tyr (8) UAC - 1001001 Tyr (9) UAA - 1001010 Stop (10) UAG - 1001011 Stop (11)	UGU - 1001100 Cys (12) UGC - 1001101 Cys (13) UGA - 1001110 Stop (14) UGG - 1001111 Try (15)	U C A G
B	CUU - 0010000 Leu (16) CUC - 0010001 Leu (17) CUA - 0010010 Leu (18) CUG - 0010011 Leu (19)	CCU - 0010100 Pro (20) CCC - 0010101 Pro (21) CCA - 0010110 Pro (22) CCG - 0010111 Pro (23)	CAU - 1011000 His (24) CAC - 1011001 His (25) CAA - 1011010 Gln (26) CAG - 1011011 Gln (27)	CGU - 0011100 Arg (28) CGC - 0011101 Arg (29) CGA - 0011110 Arg (30) CGG - 0011111 Arg (31)	U C A G
C	AUU - 1100000 Ile (32) AUC - 1100001 Ile (33) AUA - 1100010 Ile (34) AUG - 1100011 Met/ Start (35)	ACU - 0100100 Thr (36) ACC - 0100101 Thr (37) ACA - 0100110 Thr (38) ACG - 0100111 Thr (39)	AAU - 1101000 Asn (40) AAC - 1101001 Asn (41) AAA - 1101010 Lys (42) AAG - 1101011 Lys (43)	AGU - 1101100 Ser (44) AGC - 1101101 Ser (45) AGA - 1101110 Arg (46) AGG - 1101111 Arg (47)	U C A G
D	GUU - 0110000 Val (48) GUC - 0110001 Val (49) GUA - 0110010 Val (50) GUG - 0110011 Val (51)	GCU - 0110100 Ala (52) GCC - 0110101 Ala (53) GCA - 0110110 Ala (54) GCG - 0110111 Ala (55)	GAU - 1111000 Asp (56) GAC - 1111001 Asp (57) GAA - 1111010 Glu (58) GAG - 1111011 Glu (59)	GGU - 0111100 Gly (60) GGC - 0111101 Gly (61) GGA - 0111110 Gly (62) GGG - 0111111 Gly (63)	U C A G

Pertanto una doppia stringa binaria può servire a fornirci indicazioni sulla struttura primaria e secondaria di una proteina e, nell'esempio preso in considerazione, possiamo così immaginare:

Amminoacido	Ala	Ser	Ser	Leu	Gly	Aka
struttura primaria	0110100	1101100	0000100	1000010	0111111	0110111
struttura secondaria	0011	1001	1001	1000	0001	1001

Questo semplice esempio sembra peraltro dimostrare che il processo di autoassemblaggio delle proteine (e più in generale la descrizione completa della cellula) è spiegabile attraverso l'uso di più codici (e non solo quello genetico) tutti capaci di realizzare una grammatica generativa di tipo chmoskyano e molti di questi codici (se non tutti) sono basati su una codifica di tipo binaria. Quanto questa conclusione possa avere delle ripercussioni sul cosiddetto 'dogma' di Anfinsen è tema che esula da questo scritto [NOTA DI LAVORO: andrebbe sviluppato il problema delle chaperones come possibili sorgenti di informazioni binarie nell'assemblaggio delle proteine]

3) molte importanti proteine si comportano come operatori "on / off" (in altre parole come operatori logici booleani del tipo 0 e 1) di importanza fondamentale nei processi biologici: "Non tutti i processi biologici si svolgono con continuità all'interno di una cellula vivente. Molti processi alternano ciclicamente stati "on" e stati "off" ("aaceso" e "spento"), al fine di controllare la crescita, la divisione cellulare e le risposte ai segnali extracellulari... Questo genere di ciclizzazione è controllata da uno speciale gruppo di proteine che agiscono come veri e propri interruttori molecolari. Sebbene queste proteine variano per struttura e per il tipo di processi che controllano, essi presentano alcune caratteristiche comuni. L'elemento comune più importante è il meccanismo di 'interruttore' stesso" (G.A. PETSKO - D. RINGE, op. cit, p. 98);

4) a principi di logica binaria (e dunque a un possibile codice organico di tipo binario) sembrano uniformarsi anche le particelle prioniche, infatti: a) la forma infettica ha forte propensione a formare aggregati, è ricca di struttura secondaria di tipo beta, è parzialmente resistente alla proteolisi ed è insolubile in detergenti non ionici; b) la forma cellulare ha uno scarso contenuto di struttura beta, è sensibile alla digestione da parte delle proteasi ed è solubile in detergenti non ionici.
In altre parole, ed attribuendo i valori binari di '0' e '1' a ciascuna dellecaratteristiche che distinguono la forma cellulare dalla forma infettiva dei prioni, possiamo dire:

	forma cellulare	forma infettiva
propensione a formare aggregati	0	1
ricchezza di struttura secondaria beta	0	1
sensibilità alla digestione da parte delle proteasi	1	0
solubilità in detergenti non ionici	1	0

Da notare chele strutture prioniche cellulari sono speculari alle strutture prioniche infettive.

L'esempio delle particelle prioniche consente così di interpretare il concetto di specularità (molto spesso trovato nell'esame di saccaridi, codici genetici, legge mendeliane, proteine, etc.**) come un evento di natura binaria: zero e uno, infatti, possono rappresentare vari concetti come assenza/presenza, vero/falso, bianco/nero ma anche come dritto/rovescio, sinistro/destro ed altre metafore fondate sul concetto di specularità.
Passando quasi di palo in frasca, ma ponendo sempre l'accento sulla nostra ricerca, ci pare opportuno evidenziare come le particelle prioniche sembrino dimostrare l'esistenza, nel dominio della biologia, di una vera e propria serie di rimandi speculari infatti... così come certi acidi nucleici sono capaci di azione catalitica (funzione propria delle proteine) come per logica speculare si scopre quasi in contemporanea che i prioni sono agenti capaci di replicarsi pur essendo di natura esclusivamente proteica: "La possibilità che proteine possano 'replicarsi' senza l'intervento di acidi nucleici ha destato un grande interesse e conserva un grande fascino, anche perché, e forse non a caso, è stata proposta nel momento in cui è stato scoperto che gli acidi nucleici, in particolare l'RNA, sono capaci di azioni catalitiche di idrolisi (ribozimi), 'usurpando' quella che sembrava una capacità funzionale esclusiva delle proteine" (G. ROTILIO, "Struttura e funzione delle proteine", Nuova Italia Scientifica, Roma, 1993, pp. 170-171). In effetti sembra quasi che la natura abbia con i prioni realizzato la funzione speculare (replicativa) degli acidi nucleici visto che gli acidi nucleici hanno realizzato la funzione speculare (catalitica) delle proteine.

___________________________________________________________________________________
(*) Usiamo l'espressione "ad esempio" perché sono possibili altre soluzioni, una delle quali (per angoli di 90°) prevede: fi 0-90 / psi 0-90 = 0000; fi 0-90 / psi 90-180 = 0001; fi 0-90 / psi 180-270 = 0010; fi 0-90 / psi 270-360 = 0011; fi 90-180 / psi 0-90 = 0100; fi 90-180 / psi 90-180=0101; fi 90-180/ psi 180-270 = 0110; etc.

(**) Il requisito della specularità sembra davvero un elemento fondamentale del codice genetico a tutti i livelli, ad esempio: a) l'uracile si lega con l'adenina e la citosina con la guanina secondo il principio della specularità. Infatti, come abbiamo visto, da un punto di vista chimico, l'uracile (timina nel DNA) e la citosina sono piramidine mentre l'adenina e la guanina sono purine (inoltre l'adenina in posizione 6 ha un NH2 mentre l'uracile e la timina in posizione 6 hanno un C=O mentre la guanina in posizione 6 ha un C=O e la citosina in posizione 6 ha un NH2). Dal punto di vista binario abbiamo visto che a uracile 00 (+0) corrisponde adenina 10 (-0) mentre a citosina 01 (+1)corrisponde guanina 11 (-1); b) la doppia elica del DNA è una struttura speculare nella quale un polinucleotide corre in direzione 5'-3' mentre l'altro corre in direzione 3'-5'; c) l'informazione biologica portata dall'elica stampo DNA viene letta in direzione 3'-5' mentre la sintesi della nuova molecola RNA viene letta in direzione 5'-3'.
In un certo senso possiamo considerare un ulteriore esempio di specularità nei geni sovrapposti di alcuni virus: a livello di genoma si nota, infatti, come alcuni virus (ad esempio il virus dell'epatite B) tendono a leggere la stessa sequenza nucleotidica secondo schemi diversi per sintetizzare due o più differenti proteine. Questi schemi diversi rappresentano uno speciale tipo di specularità. Ad esempio NEI GENI E e D di ΦX174 (vedi p. 266 di T.A.BROWN, "Genetica: un abbroccio molecolare", Piccin, Padova, 2001):

          METVAL                LYSGLUSTOP                                  GENE E
GTTTATGGTA              GAAGGAGTGATG
VALTYRGLY                 GLUGLYVALMET                             GENE D

Quest'ultima strategia estremamente utile negli organismi più semplici, perché consente di ridurre al minimo la quantità di DNA / RNA necessaria per codificare le proteine, è poi stata in gran parte abbandonata nel corso dell'evoluzione in quanto, quando una mutazione altera un singolo nucleotide, le proteine virali o cellulari coinvolte possono essere non più solo una, ma due o più. A nostro avviso è, dunque, probabile che alcuni tra i primi organismi viventi (sfruttando il principio della specularità che risponde altresì anche ad esigenze di economicità) presentassero lo schema della doppia lettura del genoma per, successivamente, abbandonarlo in favore di una meno efficiente, ma assai più sicura, codifica univoca.

_______________________________________________________________________________________

Clicca sotto per tornare alla pagina principale

http://it.geocities.com/kenoms3/codice_degenerato_dna.html

Hosted by www.Geocities.ws