Il progetto Genoma

Materie:Appunti
Categoria:Biologia

Voto:

1 (2)
Download:121
Data:26.07.2001
Numero di pagine:12
Formato di file:.doc (Microsoft Word)
Download   Anteprima
progetto-genoma_4.zip (Dimensione: 23 Kb)
trucheck.it_il-progetto-genoma.doc     87 Kb
readme.txt     59 Bytes


Testo

Il Progetto Genoma

Introduzione

[...] Qualcuno paragona il sequenzionamento del genoma umano allo sbarco sulla Luna. Personalmente non amo le iperboli, ma è certo che l'impresa apre orizzonti nuovi, pone le premesse di sviluppi che occuperanno la biologia e la medicina nei prossimi decenni e anche oltre. La pare più importante del progetto, infatti, deve ancora venire. Dopo averli descritti, vogliamo ora sapere che cosa fanno i singoli geni o gruppi di geni. Quello che attualmente ci interessa è il secondo livello, rappresentato dalle proteine. Le proteine sono il risultato dell'espressione dei geni e la loro conoscenza apre la strada delle ricadute pratiche del Progetto Genoma. Ogni proteina ha una sua struttura particolare e modificando la struttura si altera la funzione della proteina. I farmaci agiscono appunto per interazione strutturale sulle proteine. Ma le ricadute non si fermano qui: sull'onda del Progetto Genoma sono in corso di sviluppo potenti tecnologie come quella denominata snip che consente di setacciare grandi quantità di campioni di Dna alla ricerca delle sottili varianti genetiche che distinguono una persona da un'altra; o quello che permette di accertare lo stato dei geni delle cellule cancerose, cioè dei geni che per ragioni varie non funzionano o funzionano troppo. E' qui il segreto del cancro. La solennità con la quale è stato dato l'annuncio dell'avvenuto sequenzionamento, l'avvallo di due potenti leader politici (Clinton e Blair), la promessa di pubblicità totale delle mappe dei geni, sono altri motivi di soddisfazione. Sono tra coloro che ritengono la protezione brevettuale necessaria per stimolare gli investimenti nella ricerca scientifica e per far circolare l'informazione, ma l'idea di un copyright sui geni non mi riusciva di accettarla. Ora sembra che siamo sulla strada giusta: libertà per quanto riguarda l'uso delle conoscenze sui geni e brevettabilità dei prodotti ottenuti utilizzando tali conoscenze, ovvero protezione del valore aggiunto.[...]

Dna
Gli studi che portarono all'identificazione del materiale ereditario iniziarono negli anni Venti con gli esperimenti di F. Griffith sulla trasformazione batterica.Griffith, nei suoi esperimenti, osservò che i topi uccisi dai pneumococchi di ceppo S (smooth) sopravvivevano, invece, all'iniezione di coloni R (rough) vive e di colonie S uccise con il calore. Se iniettavano insieme colonie R e S uccise, i topi contraevano la polmonite e quindi morivano: dal loro sangue venivano isolati battri S vivi. La conclusione era che qualcosa, presente nelle cellule S uccise, era in grado di trasferirsi nei batteri R trasformandoli da ceppo non virulento in virulento. Di qui il nome di trasformazione batterica dato al fenomeno. E' nel 1944 che O. T. Avery, C. M. MacLeod e M. McCarty dimostrarono che l'agente trasformatore deglii esperimenti di Griffith era il DNA e non invece proteine o polisaccaridi, come fino a quel momento si riteneva. L'esperienza di Griffith permise, quindi, la definitiva identificazione del DNA quale materiale ereditario; da quel momento i progressi della genetica derivarono proprio dallo studio della molecola del DNA, molecola uniformemente distribuita in tutto il mondo vivente. La genetica mendeliana o formale (quella che si occupava esclusivamente della trasmissione dei caratteri da una generazione all'altra) si trasformò così in genetica molecolare.La composizione chimica del DNA era già stata chiarita da Miescher, però non si conosceva nulla circa la disposizione dei singoli atomi e quindi della struttura spaziale della molecola di acido desossiribonucleico. Solamente agli inizi degli anni Cinquanta (1953) M. Wilkins, R. Franklin e R. G. Goslin iniziarono una serie di studi si diffrazione dei raggi X su micro cristalli di DNA fornendo basilari informazioni a J. D. Watson e F. H. Crick sulla struttura dell'acido nucleico, una molecola regolare, costituita da due filamenti associati tra di loro e avvolti ad elica. Il DNA (insieme con l'RNA) è un acido nucleico (composto da carbonio C, idrogeno H, ossigeno O e azoto N), così chiamato perché si trova, anche se non unicamente, nel nucleo delle cellule. Il DNA è un polimero costituito dall'unione di numerosissimi nucleotidi, la cui impalcatura è costituita dal polidesossiribosiofosfato (fosfato + desossiribosio + base purinica o base pirimidinaca). Ciascun nucleotide è costituito dall' insieme di una base azotata, di una molecola di acido fosforico (o gruppo fosfato) e di uno zucchero pentoso (desossiribosio per il DNA, ribosio per l'RNA). L'acido desossiribonucleico è una molecola a doppia elica, formata da due filamenti uniti l'uno all'altro da legami fra quattro subunità (ripetute in sequenza variabile), che sono chiamate basi azotate e comprendono l'adenina (A), la guanina (G) (basi puriniche), la citosina (C) e la timina (T) (basi pirimidinache). Esse sono sostanze costituite, oltre che da idrogeno e ossigeno, da atomi di carbonio e azoto legati insieme in strutture ad anello. Nella timina, nella citosina e nell'uracile (presente solo nell'RNA a sostituzione della timina) vi è un anello semplice, mentre nell'adenina e nella guanina vi è un anello doppio. Uno degli aspetti caratteristici del modello di Watson e Crick è quello della complementarietà delle basi: cioè le basi azotate che si vengono a trovare una di fronte all'altra nel modello a doppia elica sono sempre le stesse. All'adenina si oppone sempre la timina e alla guanina la citosina. Nelle catene di DNA e RNA i nucleotidi si uniscono tra loro mediante un legame tra il gruppo fosfato e il carbonio in posizione 3' dello zucchero. Come già anticipato le molecole di DNA consistono in realtà di due filamenti o catene avvolte a elica: i nucleotidi di ciascuna catena sono orientati in modo tale che le basi siano rivolte all'interno, cioè si trovino una di fronte all'altra, mentre i gruppi fosfati sono rivolti all'esterno.La stabilità della doppia elica è assicurata dalla formazione di legami a idrogeno tra le basi azotate delle due catene e dalla stessa struttura elicoidale. Questa particolare strutture a doppia elica, con i due scheletri portanti saldamente uniti e "avvitati" e con le basi rivolte verso l'interno, quasi a proteggerle da ogni interazione con l'ambiente esterno al nucleo che potrebbe alterarne la sequenza e quindi il messaggio informazionale, dà un'impressione di rigidità e di inerzia. Il DNA, invece, si è rivelato una molecola molto flessibile, capace di reagire con altre molecole presenti nella cellula deformando un po' la propria struttura per meglio accoglierle. Ciò è di estrema importanza poiché la cellula si avvale della plasticità strutturale del DNA per regolare il modo in cui l'informazione contenuta nel DNA deve essere espressa. Uno dei punti salienti emersi dall'analisi dei meccanismi ereditari è la necessità di disporre di "sostanze" in grado di autoriprodursi e di passare, in tale modo, da una generazione all'altra. La certezza che simili "sostanze" capaci di autoriprodursi non solo esistevano, ma coincidevano con il DNA, si ebbe quando Watson e Crick proposero, altre al modello a doppia elica anche un modello di replicazione del DNA stesso. Secondo tale modello la molecola a doppia elica del DNA si srotola e le catene complementari si allontanano. Ciascuna di esse si comporta, poi, come una matrice per la sintesi di una nuova catena ad essa complementare: si attengono, in tal modo due nuove catene identiche a quella di partenza, ciascuna formata da una catena "vecchia" e una catena "nuova". Questo tipo di replicazione viene chiamato semiconservativo, proprio ed una nuova.
Questa immagine mostra la struttura del Dna a doppia elica definita anche B-DNA, il DNA puo' assumere diverse conformazioni o strutture a 3 dimensioni (3D). Le catene rosse e blu sono i pentosi fosfati che costituiscono lo scheletro del Dna e le basi nucleotidiche sono visibili in verde.
Ciascuna base nucleotidica lega via legame ad idrogeni alla sua complementare base (A con T, G con C) per formare un accoppiamento di basi planare. Ciascun appaiamento di basi nucleiche non complementare distorce la struttura regolare del Dna.
Il solco maggiore (Major groove) formato da questa molecola e' il sito dove molte proteine si legano al DNA e riconoscono regioni di specifiche di sequenza nucleotidica.

La sintesi proteica
La specificità delle molecole di Dna risiede nella sequenza specifica di quattro diverse basi azotate: adenina, timina, guanina e citosina. Ciascun segmento di Dna che caratterizza il processo di codificazione della sintesi di una proteina specifica, determinando l'ordinata sequenza di aminoacidi nella catena polipeptidica in ragione della propria sequenza di basi, costituisce un gene. Il genoma, insieme di geni di una cellula contiene l'informazione per la sintesi di tutte le proteine dell'organismo.
Il primo evento nel processo di sintesi proteica consiste nella sintesi, su ogni gene, di molecole di Rna messaggero, avente una sequenza di basi complementare a quella del Dna. In tale processo, detto di trascrizione le molecole di Dna funzionano da modello: la catena di mRna che si forma contiene quindi al posto delle basi adenina, timina, citosina e guanina, presenti nel Dna, rispettivamente le basi uracile, adenina, guanina e citosina. Le molecole di mRna, copie complementari multiple di ogni gene, sono trasferite sui ribosomi (organuli submicroscopici costituiti dall'associazione di una speciale classe di Rna, detto Rna ribosomico o rRna, con un complesso di proteine), dove la sequenza di basi dell'mRna viene tradotta in una specifica sequenza di aminoacidi. Il processo di sintesi proteica richiede l'intervento di una terza classe di Rna, l'Rna di trasporto o tRna anch'essa sintetizzata su geni specifici, che trasportano sul ribosoma gli aminoacidi corrisspondenti ai messaggi contenuti nella molecola di Rna messaggero. I gruppi di nucleotidi che codificano un corrispondente amminoacido vengono detti codoni. Un codone è formato da tre nucleotidi vicini che danno univocamente l'indicazione dell'amminoacido da utilizzare nella sintesi proteica. Ad esempio la sequenza AAA sull'Rna messaggero corrisponde alla lisina, mentre AUG alla metionina. Esistono poi delle triplette molto importanti che sono chiamate di stop perchè in loro corrispondenza si ha l'arresto della sintesi: UAA, UGA o UAG. E' chiaro che una mutazione su di un codone o addirittura la sua assenza o duplicazione possono generare effetti distruttivi sulla sintesi che si può fermare (nel caso in cui il codone si muti in un uno di stop) o dare origine ad errori sulla proteina generata. Le possibili mutazioni sono: duplicazione, dove un pezzo di catena viene erroneamente ripetuto. Può essere sia singola che multipla.
Dalle considerazioni precedenti risulta chiaro come la diagnosi di malattie genetiche attraverso l'analisi del Dna possa consistere per buona parte nell'individuazione delle mutazioni che ne sono la causa. La talassemia, ad esempio, è legata a mutazioni nel gene , contenuto nel cromosoma 11. Le mutazioni associate sono ben 50 e danno origine ad alcuni fenotipi diversi. Questa situazione è molto frequente, per cui spesso l'analisi di una malattia richiede l'esame di diversi punti del patrimonio genetico dell'individuo. Il Dna è la molecola che costituisce i cromosomi. Ogni uomo possiede 23 coppie di cromosomi di cui 22 coppie sono omologhe (cioè i due cromosomi sono uguali), mentre la ventitreesima è quella che stabilisce il sesso ed ha i due cromosomi identici solo nelle femmine (coppia XX invece di XY per i maschi). Può ovviamente accadere che solo uno dei due cromosomi contenga il Dna mutato. Questo è il caso dei portatori, che possono non avere manifestazioni evidenti nel loro fenotipo, ma potranno dare origine a persone malate.

Gli amminoacidi
Gli amminoacidi costituiscono un'importante classe di composti organici, caratterizzati dalla presenza di un gruppo amminico (---NH2) e di un gruppo carbossilico (--COOH). Venti di questi composti (alanina, arginina, asparagina, acido aspartico, cisteina, acido glutammico, glutammina, glicina, istidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptofano, tirosina e valina) sono chiamati alfa-amminoacidi e costituiscono i mattoni di costruzione delle proteine. La loro formula generale è:

Il gruppo amminico e quello carbossilico sono entrambi legati allo stesso atomo di carbonio, detto carbonio alfa, che porta un gruppo (R) variabile. Nel più semplice degli amminoacidi, la glicina, il gruppo R è costituito da un solo atomo di idrogeno, mentre tutti gli altri amminoacidi presentano gruppi R più complessi, che possono contenere atomi di carbonio, idrogeno, ossigeno, azoto e zolfo.
Durante la sintesi delle proteine, che avviene all'interno delle cellule, il gruppo carbossilico di un amminoacido reagisce con il gruppo amminico di un altro, formando il cosiddetto legame peptidico. Questa reazione avviene per un gran numero di amminoacidi, che formano così una lunga catena, detta polipeptide. Un polipeptide può contenere un numero di amminoacidi variabile fra 50 e varie centinaia. Le proteine sono in genere costituite da una singola catena polipeptidica o da più catene, unite fra loro da deboli legami molecolari; la sequenza degli amminoacidi di ciascuna catena viene specificata da precise istruzioni localizzate nel materiale genetico delle cellule. I gruppi R presenti in una catena polipeptidica determinano la forma tridimensionale della proteina e le sue proprietà chimiche.

Le proteine
La parola "proteina" deriva dal greco proteios, "primario", e costituisce un ampio gruppo di composti organici, formati da una sequenza di molecole, chiamate amminoacidi, legate l'una all'altra da legami peptidici. Presenti in tutti gli organismi viventi, le proteine sono gli elementi costitutivi predominanti delle cellule e sono indispensabili per il loro funzionamento. Tra le varie macromolecole presenti nella cellula, le proteine sono tra le più versatili, potendo svolgere una molteplicità di funzioni che non trova riscontro per altre molecole biologiche. Esse, infatti, partecipano all'architettura molecolare, si occupano del trasporto delle sostanze diverse tra la cellula e il suo ambiente, catalizzano le reazioni chimiche cellulari, intervengono nel movimento della cellula e nella comunicazione tra le diverse cellule, controllano il funzionamento dei geni, ricevono e trasmettono messaggi, rappresentano i marcatori dell'identità di ciascun individuo.
Ciascuna proteina è definita da quattro livelli strutturali.

Struttura primaria
Indica la semplice successione, o sequenza, degli amminoacidi. Lo scheletro della catena polipeptidica non rimane però lineare: esso è come un nastro che si avvolge ripetutamente su se stesso in modo sempre più complesso, fino ad assumere una struttura finale globulare come negli enzimi e negli anticorpi, o fibrosa come nel collagene (la principale proteina strutturale presente nei tendini). La catena tende a ripiegarsi su se stessa in seguito alla particolare natura delle catene laterali e dalle interazioni di queste con il mezzo acquoso circostante. Infatti alcuni amminoacidi sono polari, qualcuno è addirittura ionizzato, altri invece non sono polari, mentre l'acqua è molto polare: ne deriva che lo scheletro proteico, nell'ambiente acquoso, si avvolgerà in modo da favorire la naturale tendenza delle catene idrofobe a sfuggire l'H2O ammassandosi.
Struttura secondaria
Lo scheletro proteico, quindi, si ripiega in strutture regolari dette a- eliche e lamine b stabilizzate da legami a idrogeno. Le a- eliche consistono in regolari avvolgimenti a spirale delle catene polipeptidiche, mentre le lamine b si ottengono quando più segmenti di una stessa catena polipeptidica si dispongono uno vicino all'altro. Se costituite da molti polipeptidi, le lamine b possono diventare strutture molto rigide, capaci di fornire a certe proteine strutturali la necessaria durezza e resistenza come nel caso della fibroina della seta. Un'ulteriore complicazione della struttura secondaria consiste nella formazione dei domini, insieme di a- eliche e lamine b costituenti unità funzionali ben distinte. Nel punto di congiungimento di due domini si crea una specie di incavo che molto frequentemente serve come sito di legame, come luogo dove andrà ad inserirsi la molecola che si deve legare alla proteina.
Struttura terziaria
L'insieme di più domini che si dispongono geometricamente porta alla configurazione tridimensionale completa della catena, detta struttura terziaria. La proteina che così si ottiene è una struttura robusta, ma nel contempo flessibile. La stabilità le viene conferita dai legami covalenti che uniscono i diversi amminoacidi nella struttura primaria, la flessibilità dal gran numero di legami deboli che obbligano la proteina ad assumere la sua tipica configurazione secondaria e terziaria.
Struttura quaternaria
Essa deriva dall'associazione spaziale di più catene polipeptidiche distinte, dette subunità, prodotte separatamente e poi assemblate e tenute assieme da una moltitudine di interazioni deboli. Sul ripiegamento e quindi sulla forma della proteina può influire anche la presenza di un gruppo prostetico, una piccola molecola non peptidica che si lega alla proteina dopo la sua sintesi e che svolge un ruolo cruciale per il suo funzionamento.
La stretta correlazione che esiste tra l'attività biologica e la struttura spaziale di una proteina può essere evidenziata attraverso il fenomeno chiamato denaturazione. Se, infatti, una proteina viene scaldata o sottoposta a forti variazioni di pH, essa si denatura, cioè perde la sua struttura spaziale diventando inattiva.

Le tecniche di sequenziazione
La catena del Dna e' costituita da deossiribonucleosidi fosfati il tutto visibile sotto forma di formula chimica o sotto forma di superconformazione (distinta in tipo A, B o Z) a 3 dimensioni. Il metodo del sequenziamento del Dna permette di identificare l'ordine sequenziale delle basi nucleotidiche all' interno di un frammento di Dna.
Ad oggi sono solo due i maggiori metodi scoperti per ottenere sequenza del Dna.
Il primo metodo consiste nell'utilizzo della degradazione parziale del Dna via reagenti chimici ( metodo Maxam and Gilbert: Proc. Natl. Acad. Sci. 1977; 74(2): 560-564).
Il secondo metodo invece prevede una terminazione della sintesi tramite l'utilizzo di dideossinucleosidi fosfati (metodo Sanger: Proc. Natl. Acad. Sci. 1977;74 (12):5463-5467). Il metodo necessita di una molecola di Dna che fa da stampo, un oligonucleotide antisenso che riconosce una delle due eliche del Dna, di una Dna polimerasi, di 4 deossinucleosidi triphosfati (dATP, dCTP, dGTP, dTTP= dNTPs) e di ciascun dideossinucleoside fosfato (ddATP, ddTTP, ddCTP, ddGTP). Le molecole di DDna sintetizzate a singola elica vengono poi caricate su gel di acrylammide e separate via elettroforesi.
Il metodo Sanger, e' il solo utilizzato da tutti i laboratori genomici per fare sequenza, dal 1977 ad oggi.
Successivamente, grazie all'analisi della sequenza del Dna sono stati definiti i limiti tra regioni nucleotidiche che codificano per proteine (geni costituiti da esoni) e regioni invece non codificanti o silenti nel genoma (introni).
Nel 1987 e' stato introdotto nel mercato dall' Applied Biosystems Inc. il primo "sequenziatore" strumento laser semiautomatico capace di sequenziare ed analizzare il Dna utilizzando il metodo della sequenza ciclica "cycle sequencing" e la tecnologia di sequenza a terminazione con fluorescenza. Da allora l'utilizzo degli isotopi radiattivi (P32 o S35) utilizzati per identificare la molecola marcata sintetizzata nel metodo di sequenza sono stati completamente sostituiti dall'utilizzo di queste molecole a fluorescenza.
La produzione di nuove Dna Polimerasi geneticamente modificate adatte a sintetizzare Dna ad alte temperature (

Esempio