10 GenomaFRN

El GENOMA
Carlos Enrique Pelozo
EL GENOMA
Carlos Enrique Pelozo Ctedra de Gentica
Facultad de Recursos Naturales UNIVERSIDAD NACIONAL DE FORMOSA Noviembre 2006
El GENOMA
EL GENOMA
El genoma se podra comparar con un libro de uso mltiple pues es un libro de historia con la narracin del viaje de nuestra especie a travs del tiempo, un manual con todos los detalles de cada clula humana y un libro de medicina que proporciona potentes herramientas para el tratamiento, prevencin y curacin de las enfermedades. Francis Collins(director de NHGRI)
con el fin de completar el mapa y funcin de los genes humanos(genoma) para comprender el funcionamiento a nivel molecular del organismo, producir mejores medicamentos y diagnosticar y curar enfermedades hereditarias. Y como lneas de trabajo a la secuenciacin de todas las bases del ADN (orden de ubicacin de los pares de bases), realizacin de mapas fsicos de ubicacin de los genes en los cromosomas, mapas de ligamientos(linkage maps) y de la transmisin de los caracteres complejos. Dicho proyecto inicia sus actividades oficialmente en 1990. Independientemente, a nivel mundial, y con el fin de no superponer esfuerzos se esboza HUGO(Human Genomic Organization), un Consorcio Publico donde participaron investigadores de EE UU, Gran Bretaa, Francia, Alemania, Japn y China, organismo que ser el encargado de dictar la directrices ticas del proyecto. En los aos siguientes(1990-1994) se profundizan las actividades de desarrollo y creacin de mapas genticos y fsicos para precisar la localizacin de los genes. Con la aparicin de los primeros secuenciadores automticos de ADN(basados originalmente en el sistema de Sanger), lo que mecaniza los procesos de anlisis, los microarrays(micromatrices) y el desarrollo de la bioinformtica, tanto en mejor hardware como software, permite analizar gran una inmensa cantidad de informacin con un mnimo de esfuerzo humano de una manera hasta el momento impensable. Estas acciones investigan tecnologas que busquen la secuenciacin de grandes cantidades de DNA con alta precisin y bajo coste. Recin en 1996 se inicia el proyecto piloto con resultados satisfactorios, logrando los laboratorios automatizar y acelerar los procesos de secuenciacin del ADN. Entre las grandes decisiones tomadas entonces aparece la necesidad de depositar la informacin de las secuencias ledas en bases de datos pblicas sin ninguna limitacin de uso, a travs de Internet. Ya para 1997 el proyecto piloto haba secuenciado aproximadamente el 2% del ADN de genoma humano. Con
BREVE HISTORIA Desde el descubrimiento de la estructura del ADN (Watson y Crick, 1953) el objeto de los genetistas, bilogos y qumicos fue conocer mas sobre sus mecanismos de accin. Con el descubrimiento del cdigo gentico, de los procesos de clonacin gnica (vectores y reaccin de la polimerasa) y las tcnicas de secuenciacin(mtodos de Maxam y Gilbert o qumico y de Sanger o de didesoxido) se dispuso de las herramientas para leer el lenguaje con que se escriba la informacin gnica. Habindose ledo inicialmente algunos genes(el primero fue el de la lactosa) y organismos pequeos(ya en 1979 se haba secuenciado el bacterifago fX174 y en 1980 la mitocondria humana), con una visin ambiciosa, se estableci la necesidad de leer la secuencia del genoma humano. En la decada del ochenta del siglo pasado, en Estados Unidos, el DOE(Departament of Energy) motivado por las investigaciones atmicas y su relacin con las mutaciones; y el NIH(National Institutes of Health) motivado por las afecciones de origen hereditario, se cristaliza la necesidad y se establece un cronograma y se propone la lectura en un plazo de 15 Aos. En 1989 se crea el National Human Genome Research Institute(NHGRI, EEUU) que dirige el proyecto genoma humano(HGP)
El GENOMA
la tecnologa disponible, los Centros del HGP secuencian gran cantidad informacin a un costo nfimo si comparamos con los valores de tres aos antes. En 1996 Craig Venter sale del NIH y crea el TIGR(The Institute for Genomics Research), un consorcio de capital mixto que logra descifrar la secuencia de Haemophilus influenciae.En 1998 Venter en una alianza del TIGR y Applied Corp. crea Celera Genomics planteando una nueva aproximacin al genoma sin realizar el mapeo fsico. Contando con 300 superordenadores, el 6 de abril de 2000 anunci su primer borrador. El Consorcio Internacional (HUGO) constituido por 16 laboratorios y 1100 especialistas de 6 pases, no se queda a la zaga. Y el 26 de Junio de 2000 anunciaba junto a los gobiernos estadounidense e ingls un borrador con el 90% de genoma secuenciado. En febrero de 2001, el consorcio pblico y el sector privado publican la secuencia: El 15 de febrero en la revista Nature el consorcio pblico da el informe del borrador, dirigido por el NHGRI y el 16 de febrero en Science, el borrador de Celera Genomics. El 13 de abril de 2003, los pases de Consorcio Publico del Genoma Humano, anuncian el desciframiento completo del libro de instrucciones de la vida y dan por finalizado el trabajo, dos aos antes del estipulado inicialmente. La rapidez de los avances en el conocimiento de los genomas se deben bsicamente a la automatizacin de los procesos de anlisis y al aumento de la capacidad de procesamiento de datos. El mejor ejemplo de esto lo constituye Celera, que inicia el anlisis de los BACs el 8/9/1999 y termina en 9 meses utilizando el metodo del didesoxi o terminacin en cadena(Sanger) automatizado, haciendo 175.000 lecturas diarias(Cada una de secuencias de 500 a 750 pb).; haciendo en dicho perodo 27.271.853 lecturas completando 5,11 veces el genoma humano. Sumadas a las 2,9 veces que el NHGRI, hace una redundancia de 8 veces (Necesaria para el posterior armado)
QUE ES El genoma de una especie lo constituye todo el material gentico que se encuentra en los cromosomas que lo caracterizan o dicho de otra manera las secuencias de nucletidos de una especie determinada que son responsable de la transmisin hereditaria. En las clulas procariotas es el ADN del nucleoide y en las clulas eucariotas lo conforma el ADN de la cromatina.
El ADN extracromosomico de los eucariotas (mitocondrias y cloroplastos) no es considerado parte del genoma(El genoma mitocondrial constituye un organoide autorreproducible con informacin propia que asemeja a una clula procariota). Al describirlo no se trata de analizar las diferencias intra especficas (polimorfismos que posibilitan identificar a individuos o familias), sino las caractersticas que identifican a una especie.
La genmica (Termino acuado por Roderick en 1986) es el estudio de la secuenciacin de los genes(Genmica estructural), su fisiologa(Genmica funcional) y las relaciones entre especies diversas(Genmica comparada). El estudio de la manera como se expresa la informacin genomica, o sea de las protenas que se expresan y modifican en la vida celular(expresin del dogma central de la biologa, ADN a protena) lo constituye la protemica, que dicho de otra manera sera la expresin de la genmica funcional. Debemos recordar que la informacin del ADN se utiliza para codificar proteinas(genes estructurales, genes de enzimas, etc.) y los ARN mensajero, ribosomal y de trasferencia. La informacin que se transcribe constituye el transcriptoma. GENOMICA ESTRUCTURAL: CARTOGRAFIA GENOMICA La secuenciacin de los nucletidos en el ADN de una especie conforma la cartografa del genoma de la misma (mapas).
El GENOMA
Existen dos tipos de mapas: mapas de ligamiento(o de enlace y comnmente llamados mapas genticos), cuya unidad de medida es el centimorgan(cM) y mapas fsicos, medido en distancias entre pares de bases(pb). Los primeros se basan en la ubicacin de los genes conocidos por los cambios de las frecuencias en los cruzamientos.
El mtodo clsico de encarar el problema por los genetistas de mediados del siglo pasado era de estudiar las frecuencias de recombinacin y de ligamiento de los genes y establecer mapas de ligamiento. Estos mapas en el hombre eran bastante rudimentarios en cuanto que por razones ticas no se podan realizar cruzamientos dirigidos. Los primeros mapas se basaban en comparacin de fenotipos normales y mutantes (bsicamente enfermedades). Tambin era til el uso de anlisis familiar de varias generaciones. Cuando a fines de la dcada del 70 se introducen los estudios de polimorfismos del ADN(microsatlites, etc) y la multiplicacin por la PCR, estos fueron utilizados como marcadores para localizar genes relacionados con enfermedades. Esto llev a resoluciones alrededor de 1 cM(centiMorgan) y menos. Muchas zonas del ADN son muy polimrficas (zonas no codificadoras: VNTR, RFLP, microsatlites, etc) conformando de esa manera alelos que son utilizados para la confeccin de mapas. Genothon(Francia), por ejemplo, en 1996, elabor un mapa con marcadores microsatlites de una resolucin de 0,7 cM.
especie estudiada) por lo que fueron reemplazados paulatinamente por los BACs(cromosomas artificiales de bacterias), que a pesar de poseer menor capacidad de carga de ADN(entre 100.000 y 300.000 pb) son mas fiables. Tambin se han realizado mapas basados en STS, que son trozos cortos de ADN, nicos e identificables. La gran ventaja constituye el conocimiento de su secuencia que puede ser reproducida por sntesis In Vitro, constituyendo indicadores o balizas para guiar anlisis de zonas aledaas. Para 1998 El NHGRI complet un mapa de 52.000 STSs, concluyendo de esa manera un paso importante en la construccin del mapa fsico del genoma, permitiendo la integracin con los mapas genticos. Una nueva estrategia es planteada por Celera Genomics(Vetner) que consiste obtener genotecas de BACs con repeticiones de 15 veces, sin identificar secuencias previas(mapeados de contig o de STS). A cada BAC(de unos 150.000 pb) se les identifican los extremos(de 500 pb), lo que se obtiene una frecuencia de extremos conocidos de uno cada 5.000 pb(lo que constituye el 10 % del genoma). Estas porciones denominadas STC se las procesa y analiza informticamente para identificar su lugar en el genoma. No olvidar que Celera basa su sistema en evitar el paso por el mapeado previo y recurre al uso de superordenadores para recomponer el rompecabezas. El avance de dicha empresa se debe precisamente a esta metodologa y al uso de la informacin de secuencias ya conocidas y aportada por el Consorcio Publico, que se encuentra en forma gratuita en Internet. DIMENSION DE LOS GENOMAS: Suponiendo que la escala evolutiva se encuentra en relacin directa con la complejidad de los genomas, los organismos mas simples y antiguos tendran un tamao menor. Es evidente que los procariotas
Con el avance en los mtodos de anlisis de ADN los mapas de ligamiento fueron paulatinamente reemplazados por los mapas fsicos, que tratan de medir las distancias en pares de bases. El mejor mapa fsico, de dicha manera, sera la secuencia total del genoma y el de menor resolucin es el propio cariotipo con sus bandeos caractersticos. Los primeros que se realizaron se basaban en elaborar bibliotecas de YACs(cromosomas artificiales de levadura) con fragmentos de cromosomas humanos y estableciendo su orden a travs de los contigs que solapan la informacin contenida(Un YAC puede contener inserto entre 100.000 y 2.000.000 pb). En 1995 el NHGRI publico en Nature un mapa de contigs de YACs del 75 % del genoma humano. La ventaja que presentan los YACs es la capacidad de albergar hasta 2 Mb, pero su mayor problema es el reordenamiento y la formacin de quimerismo (mezcla la informacin propia con la de la
El GENOMA
en general tienen genomas menores que los eucaritoras, con excepciones en algunas bacterias gigantes y eucariotas muy pequeos. Segn lo estudiado en bacterias y archaea(procariotas) sus dimensiones van de 450.000 de pares de bases(pb) en Buchnera sp hasta mas de 10.000.000 pb en varias cianobacterias, pero en general rondan en algo menos de 5 millones de pb. El Bacillus megaterium posee un genoma de 30.000.000 pb, siendo el mayor conocido. En genera el tamao de los genes en los mismos es de 900 a 1000 pb. La Escherichia coli posee un genoma de aproximadamente 4.600.000 pb y unos 4288 genes. Una caracterstica importante de estos genomas es su conformacin de una nica molcula de ADN circular sin protenas asociadas(desnudo), siendo los genes muy sencillos: a semejanza de los virus poseen una secuencia de induccin(promotor), un codn de inicio(ATG), el marco de lectura(la zona que codifica el gen) y un codn de finalizacin(TGA, TAG o TAA). Por su parte en los eucariotas se debe recordar que adems de poseer un genoma nuclear tambin portan mitocondrias y cloroplastos que tienen su propio genoma y cuando se habla del genoma de un eucariota se refiere nicamente al genoma nuclear. En los mismos se ha definido el valor C(la cantidad de ADN nuclear de una clula haploide). Esta cantidad es caracterstica o constante(de all la letra C) dentro de la especie. Las diferencias mas notorias entre los eucariotas y procariotas son que los primeros poseen ms de una molcula de ADN(cromosomas), que son lineales y se encuentran ligadas a las
protenas bsicas (histonas) formando los nucleosomas. Los cromosomas durante las divisiones se descomprimen constituyendo la cromatina: Esta a su vez se presenta como
El GENOMA
heterocromatina(o cromatina densa ADN no funcional) y eucromatina(o laxa, ADN en actividad). Estos poseen genomas mayores que los procariotas, a excepcin de algunas algas verdes parsitas, siendo el menor conocido el de Guillardia theta(alga roja simbionte) de 550.000 pb y el de Amoeba spp el mayor de 686.000.000.000 pb(mayor en 200 veces que el de los mamferos). Los mamferos poseen aproximadamente 3 picogramos de ADN, o sea 3 x 109 pb, siendo la estimada para el hombre en 3.164.700.000 pb., con una longitud total de aproximadamente 1,74 centmetros. El primer eucariota estudiado es Saccharomyces cerevisiae(levadura de cerveza) con 12.068.000 pb, repartido en 16 cromosomas, donde se describieron 6.241 genes. Tambin se ha secuenciado a Caenorhabditis elegans(nematodo) con 97.000.000 pb y 18.424 genes; a Arabidopsis Tatiana(planta crucfera); a Drosophila melanogaster(mosca de la fruta) de 180.000.000 pb y 13.601 genes; a Fugu rubripes(Pez globo) de 400.000.000 pb y 35.000 genes; a Oryza sativa(arroz) de 450.000.000 pb; a Allium cepa(cebolla) 18.000.000.000 pb; a Hommo sapiens(hombre), a Mus musculus(ratn) y Rattus norvegicus(rata), existen borradores de Zea maiz(de 2.400.000.000 pb), de Gallus gallus(gallina), Pan troglodytes(chimpanc), Bos taurus (vacuno), Canis familaris(perro), Apis mellfera(abeja) de 300.000.000 pb. y Musa sp (Banano). El genoma se distribuye en cromosomas, que en el hombre son 23(haploide) de longitudes de ADN(extendido) entre 5 y 7 centmetros, siendo el mayor el cromosoma 1 con 246.127.941 pb( y 2.968 genes) y el menor el cromosoma 21 con 46.976.097 pb(y 355 genes). El cromosoma con menos genes es el cromosoma Y con 255 genes( su tamao es de 50.286.555 pb, algo mayor que los cromosomas 21 y 22).(Segn NHGRI).
DISTRIBUCION De acuerdo a lo estudiado en el genoma humano(al que se le da mayor importancia entre los eucariotas), y del que se supone composicin semejante en los mamferos, su ADN se puede clasificar en: ADN de copia nica, ADN medianamente repetido y ADN de alto grado de repeticin(ADN altamente repetitivo). 1.- ADN de copia nica: se conforma por los genes y secuencias que se encuentran relacionadas con ellos. Su composicin abarca en 37,5 % del genoma humano segn Venter y NHGRI(Ambos en forma independiente en 2001). La mayor parte del mismo lo conforman las secuencias relacionadas a los genes(el 36 %) y nicamente del 1,1 al 1,4 % son porciones codificantes(genes). Los genes en los eucariotas adopta una complejidad mayor que los procariotas: es discontinuo, existen zonas codificantes que sern traducidas a protenas(zonas codificantes, codantes o exones) y zonas que sern quitada en el ncleo(Zonas no codificantes o intrones). Al transcribirse la informacin al ARN se leen ambos, pero en un proceso posterior de maduracin se eliminan los intrones y se unen los exones(splicing). Adems el gen posee zonas cortas que anteceden al primer exon en posicin 5(Leader: Secuencia Anterior No Traducida) que indica la iniciacin del proceso, de igual manera luego del ultimo exon(en posicin 3) presenta una secuencia(a veces larga) con indicaciones de poliadenilacion(Agrega adeninas al final). Tambin se
El GENOMA
debe considerar las secuencias reguladoras inmediatas(Promotor) y alejadas(Intensificadores-Enhancers- y Silenciadores)
duplicaciones) que modifican el marco de lectura. Tambin entre estos se ubican pseudogenes procesados que son comunes en el genoma humano y se forman por retroproposicin de un ARN mensajero(semejan al ADNc pues no poseen inductores, ni intrones, se asemejan a las secuencias LINEs(ver mas adelante). La distribucin de genes en el hombre es altamente irregular, habiendo zonas densamente pobladas y zonas pobres, los cromosomas que mayor densidad de genes tienen son el 17, 19 y 22 y los que poseen muy baja cantidad son el Y, 4, 18, 13 e X. El cromosoma 1 tiene 2968 genes(el que posee ms genes) y el cromosoma Y tiene 255 genes, con la menor carga.
El tamao de los genes es muy variable, en el hombre, por ejemplo, el gen de la distrofina(responsable de la enfermedad de Deuchene que altera la funcin muscular, puede causar deficiencia mental, alopecia y cataratas) posee un gen de 2.400.000 pb con ms de sesenta intrones. Sin embargo, el gen promedio humano ronda entre 3000 a 10.000 pb, con unos siete exones(de 100 a 200 pb) e intrones(de 200 a 2000 pb). El nmero total de genes se estim en el hombre en 32924, un valor significativamente menor que el predicho anteriormente(se estimaban nmeros superiores a los 140.000 genes). De los genes descriptos ms de la mitad se desconoce su funcin. Adems como fraccin no codante del ADN de copia nica encontramos a los intrones que van a copiar su informacin al ARN trascripto primario que luego del splicing son separados del ARN mensajero y constituyen el ARNsn(small nuclear o ARN pequeo nuclear) y UTR(UnTranslated Region) Los intrones siempre comienzan con dos bases: GT y terminan en AG. Otra fraccin del ADN de copia nica son los pseudogenes con intrones y fragmentos de genes, que son genes no funcionales (incompletos), que posiblemente en el proceso evolutivo han perdido su funcin por alteracin de la estructura del cromosoma(delecciones o
2.-ADN repetitivo(o medianamente repetido): est conformado por elementos que se han integrado al genoma humano en el proceso evolutivo. La mayora de ellos estn relacionados con actividades virales, bsicamente de la retrotranscriptasa(Enzima tpica de los retrovirus) y que dirige la sntesis de ADN a partir del ARN. A estas secuencias tambin se las denomin como ADN egosta porque parasita al genoma usandolo para su multiplicacin. Segn posean actividad actual los podemos clasificar en transposones(que no utilizan un intermediario de ARN) y retroposones(o retrotransposones sin movilidad actual y que utilizan un intermediario ARN). Cuando no forman tandem pueden ser cortos(SINE) o largos(LINE) y algunos autores incluyen a los pseudogenes procesados en el grupo. Estos elementos, tambin llamados elementos mviles, fueron descriptos en 1950 en el maz, por Brbara Mc Clinton como los genes saltarines. Si bien no tiene actividad actual(antigedades mayores a los 100 millones de aos) se los postulas como elementos importantes en el proceso evolutivo . Las secuencias SINEs(Short INterspersed Elements) son porciones cortas de 130 a 500 pb, que cubren mas del 10 % del genoma que se encuentran dispersas y en zonas ricas de genes(bandas clara en el cariotipo). Las mas notorias son las denominadas Alu(pues
El GENOMA
sobre ella acta la Enzima de restriccin AluI, caracterstico en el genoma humano con medio milln de copias de 300 pb) ricas en C+G. Son las nicas activas en el hombre. Todos estos han perdido la capacidad de codificar las enzimas necesarias.
otras(tandem). El ms simple de todos es el ADN telomrico donde 6 pares de bases, dispuestas en el orden 5-TTAGGG-3, se repiten de 2.000 a 10.000 veces. El ADN centromerico caracterstico del centrmero cromosmico y ocupa hasta 1 Mb del genoma. El mas conocido es el ADN alfoide(-ADN) con unidades de 171 pb(de secuencias con variantes) que se repiten en tndem. Es parte de la heterocromatina. Los ADN microsatlites son de diverso tipo pero siempre se ubican en los centrmeros. La nominacin de satlite proviene por haberse identificado por centrifugacin, de distinta densidad, como una parte satlite. Son repeticiones en tndem de un motivo de 1 a 5 pb (10 o 20 repeticiones, como mximo). En el genoma humano se pesentan hasta 650.000 copias y su funcin es desconocida. En la eucromatina Los Minisatlites son unidad de repeticin de hasta 25 pb y ocupa regiones de hasta 20 kb. Normalmente se ubica en la eucromatina. Se pensaba que las sucesiones repetitivas no tienen ninguna funcin directa, pero a medida que se va conociendo mejor el funcionamiento del genoma se entendi que su papel es importante en su reestructura, modificando los genes existente, o multiplicndolos o creado genes nuevos
Los retrotransposones no-LTR o secuencias LINEs(Long INterspersed Elements), son secuencias de mas de 5000 pb que se encuentran dispersos en todo el genoma, por lo comn son mviles (trasponibles), y cubren un 20 % del genoma humano. Las mas notorias son las L1(6500 pb) con unas 20.000 a 50.000 copias representando del 2 al 9 % del genoma. Su ubicacin en el cariotipo es inverso a las anteriores.
Los retrotransposones LTR(Long terminal repeat o elementos LTR) ocupan en 8 % del genoma y los transposones ADN un 2%, ambos inactivos pero de semejanza a homlogos bacterianos. 3.-ADN altamente repetitivo: Por ltimo existen porciones cortas de ADN repetidas y agrupadas(en tandem) a las que denominamos ADN satlite(minisatlite y microsatlite). El ADN altamente repetitivo es frecuente en los centrmeros y los telmeros cromosmicos conformando la heterocromatina y conforman unidades simples(de pocos pares de bases) seguidas unas
En el genoma humano, en los ltimos 50 millones de aos, parece haber ocurrido una disminucin muy importante en la proporcin de acumulacin de ADN repetitivo. GENOMICA COMPARADA: Debido a los avances constantes en el conocimiento de la genmica diariamente se agregan especies nuevas a la lista de aquellas cuyo genoma fue ledo. Para comienzos de noviembre de 2006 ya se
El GENOMA
han secuenciado mas de un millar virus y viroides, mas de 500 plasmidos, 200 ADN mitocondriales y de cloroplastos (organoides) adems de 383 bacterias, 29 arqueobacterias y 44 eucariotas(entre hongos, animales y plantas). Entre las que debemos destacar especies mamferas como: el hombre (15/2/2001), el ratn(12/12/2003) y la rata(1/4/2004), el chimpanc(11/12/2003), de la vaca(12/10/2005), del perro(8/9/2005) y estn muy avanzados los anlisis de la cabra. En aves se analiza el genoma de la gallina (9/12/204), en peces fue ledo el del pez globo (23/8/2002) y se encuentra avanzado el pez cebra (5/7/2005). En los vegetales se han descrito los genomas de Arabidopsis(14/12/2000), el arroz(5/4/2002)y el lamo(15/9/2006), hay un borrador del maz y est muy avanzado del banano. Entre los insectos destacamos al genoma del gusano de seda(Bombix mori:29/2/2004) y la abeja (Apis melifera (26/10/2006)). En general se puede concluir que el tamao de los genomas eucariotas es muy variable y no se corresponde con la complejidad del organismo que lo lleva. De los datos anteriores, por ejemplo, podemos concluir que la ameba posee unas 200 veces mas de ADN que el hombre u otro mamfero, siendo un animal menos complejo que los mamferos. Pero no es nico caso, el humano posee la sexta parte de ADN que una cebolla (18.000.000.000 pb), la tercera parte de la langosta(9.300.000.000pb), la mitad del sapo(6.900.000.000) y el paramecio. A esto se ha dado llamar paradoja del valor c. Los genomas descriptos en otros organismos (tanto procariontes como eucariontes) presentan una distribucin de genes espaciados uniformemente, en forma diferente al genoma humano que posee zonas ricas en genes y otras aparentemente desiertas. El humano presenta mayor cantidad de protenas descriptas que otros mamferos, pero la cantidad de genes no es precisamente
mayor. Tenemos solamente un 25 % ms genes que Arabidopsis, dos veces y media los de la mosca, algo menos de la mitad del nematodo y menos que el pez globo. La mayor cantidad de protenas se debera a las transformaciones consecuencia del splicing, alternativas de asociacin de los exones, los pptidos originales y las modificaciones qumicas posteriores, de tal manera que de un mismo gen se puedan sintetizar diferentes protenas. El humano comparte la mayora de la familias de protenas con C. Elegans(nematodo), D. Melanogaster (insecto) y A. tatiana(vegetal), pero la cantidad de genes es superior en el hombre, fundamentalmente en los correspondientes a protenas relacionadas con el desarrollo y la inmunidad. Un dato importante nos da la comparacin de los procariotas y eucariotas. Las Arqueobacterias(protistas anaerobios que desdoblan el metano, un dominio independiente segn la clasificacin de Whole, 1988), que originalmente se consideraban como las ms primitivas, han demostrado que poseen genes muy semejante los eucariotas y estaran mas emparentados a estos que a las bacterias, que seran mas antiguas. Esto sugiere una nueva concepcin en el rbol filogentico. La correspondencia de genes del hombre con otros animales es sorprendente: Compartimos el 98,8 % con el chimpanc y 90 % con el ratn. En el grafico se representa el cariotipo del hombre y con
El GENOMA
diferente nivel de gris las zonas de correspondencia con los diversos cromosomas del ratn. Puede apreciarse que fragmentos de los cromosomas humanos encuentran su equivalente, entendiendo como tal la conservacin de los genes contenidos en los mismos. All queda de manifiesto cmo desde la separacin de los linajes de roedores y humanos se han producido numerosos cambios en la disposicin cromosmica, pero el contenido total en genes de ambos organismos es muy semejante. El genoma del hombre posee mayor cantidad de ADN repetitivo(45 %) que A. Tatiana(11 %), C. Elegans(7 %) y D. melanogaster(3 %). Aunque el hombre pareciera haber dejado de incrementar el ADN repetitivo hace mas de 50 millones de aos, no sucede lo mismo en roedores. Esta puede ser la causa de algunas diferencias fundamentales entre ambas especies, aunque la cantidad de genes, como ya hemos mencionado, es similar. En algunas familias de genes el hombre posee hasta cuatro veces mas. Estudiando las protenas (protemica) se han identificado mas de un 90 % de dominios equivalentes en humano, mosca y nematodo, aunque en el primero posee el doble de reordenaciones. Y existe equivalencia de las protenas entre los animales mencionados y el hombre en el 61 % con la mosca, en el 43 % con el nematodo y el 46 % con la levadura. El resto (mas del 30 %) de las protenas no tienen semejanza: a) poseen la misma funcin y pero cambian la frecuencia; b) adquieren funciones especificas (solo de una especie); o cambian el marco de lectura. Un descubrimiento importante en el hombre es la semejanza del 99.9% del ADN entre las personas (Solamente el 0,01 % del ADN es diferente: unas 1.250 pb), no habiendo diferencias significativamente mayores entre las razas (Se debe hacer notar que Celera realiz la secuenciacin sobre cinco personas: Un afroamericano, un chino, un mexicano y dos caucsicos). Dndose la paradoja que existen mayores diferencias entre individuos de la misma poblacin que entre razas,
destruyendo de dicha manera el preconcepto de diferencias genticas tnicas. GENOMA MITOCONDRIAL Como ya se ha mencionado el genoma mitocondrial se lo considera fuera del genoma de la especie. Se encuentra entre los primeros ADN ledos, su conocimiento data de hace veinte aos, para dicha poca se haban descrito 18 genes en su informacin usados para la sntesis de los ARN de transferencia. Su caracterstica fundamental es poseer un ADN no asociado a protenas(desnudo) y circular, con un total de 16.571 de bases secuenciadas (Actualizado al 11/3/2001), un tamao de ochocientas veces menos que un cromosoma medio. La semejanza con la disposicin del ADN de un procaritota abona la idea de un proceso simbitico en la evolucin. Al separa la molcula bicaternaria del ADN se obtienen dos cadenas de diverso peso consecuencia de la dispar proporcin de C y G en ambas(Cadena H o heavy, pesada y L o light, liviana). De ambas la que normalmente es leda es la Cadena H. En dicho genoma se encontraron 37 genes, de los cuales la mayora(22) son responsables para la sntesis de ARN de transferencia. Del resto, 13 son responsables de los ARNm que van a sintetizar la NADH deshidrogenasa(6 subunidades de la lectura de la cadena H y 1 de la cadena L), la Citocromo oxidadasa(3 subunidades), la ATPasa(2 subunidades) y el Citocromo b, todas enzimas participantes en la forsforilacin oxidativa o cadena respiratoria que conlleva a la sntesis del ATP. Los dos ultimos genes son los encargados de la formacin de los ARN ribosomales de la mitocondria(recordar que los ribosomas mitocondriales son de menor peso que los citoplasmticos): el ARNr de 12 S y el ARNr de 16s. VARIACIONES EN EL GENOMA
El GENOMA
Se han identificado en el genoma humano aproximadamente 1,4 millones de situaciones dnde existen porciones de ADN de 300 de pares de bases que se diferencian en un solo par(SNP: Single Nucleotide Polimorphysm). Esta informacin promete revolucionar los procesos de identificacin de regiones cromosomicas pues se pueden encontrar sucesiones especficas para reconocer familias, regiones relacionadas con enfermedades hereditarias y la historia evolutiva humana. Otro dato importante encontrado es la proporcin de mutaciones diferencial en las lneas germinales de ambos sexos (espermatognesis y ovognesis) siendo el doble en varones que en hembras. Se esgrimen variadas razones para explicar el fenmeno, aunque esto pareciera ser la consecuencia del mayor numero de divisiones celulares en la formacin del espermatozoide (Recordar que los ovocitos dejan de dividirse al nacimiento y en el varn este proceso es continuo) FUTURO: Es evidente que el conocimiento del genoma(bsicamente el humano) implicar aplicaciones mdicas inmediatas. La identificacin de genes especficos responsables de enfermedades asociado a el cncer, sordera o ceguera para su diagnstico temprano son objetivos a corto plazo. La identificacin de otras enfermedades con asociaciones de los genes y el ambiente por el uso de los SNP y el tratamiento gentico son objeto a mediano plazo. Pero el gran desafo lo constituye el tratar de comprender el complejo mecanismo que significa la activacin de determinados genes(ya sea en diferentes etapas del desarrollo o diferentes tejidos) y su asociacin para el funcionamiento del sistema biolgico. La protemica dirige sus objetivos a esta bsqueda. Este anlisis funcional ya est recurriendo a novedosas tecnologas como los chips de ADN(microarrays) y bioinformaticas.
En ltima instancia el conocer la secuencia genmica no difiere mucho en tener uno de los grandes catlogos de productos bioqumicos comerciales que tanto usan los biotecnlogos. Cada laboratorio dispone de ese catlogo, pero cada uno usa un conjunto limitado de sus recursos, en funcin del tipo de investigacin y del problema biolgico que quiera abordar. Disponer del atlas del genoma y de las herramientas de estudio de rasgos complejos impulsar la biologa del siglo XXI de un modo que no podemos sospechar an( Fred Sherman). GLOSARIO
ADNc:(cDNA - ADN complementario) Es un ADN obtenido artificialmente a partir del ARNmensajero (ARNm) con el uso de
retrotranscriptasas. Representan nicamente a la parte codificante del gen, sin intrones ni promotores. Se obtienen bibliotecas de ADNc. BAC: (Bacterial Artificial Crhomosomes o Cromosomas artificiales bacterianos). Son porciones de ADN(hasta 200.000 pb) que se asocian al cromosoma bacteriano y se reproduce con este(clones). Se realizan bibliotecas de BACs centiMorgan(cM): constituye la unidad de medida de recombinacin y se utiliza para realizarlos mapas de ligamientos y determinar distancia entre los genes ligados. Un centiMorgan equivale aproximadamente a 1.000.000 de pares de bases. Enhancers(Potenciadores), son secuencias de ADN que interactan con molculas capaces de potenciar o aumentar la expresin de un gen. ETS: (Expressed Sequence Tags) son secuencias cortas de ADN (de 200 a 500 pb), generadas mediante la secuenciacin de los extremos 5' y 3' de clones de ADNc seleccionados al azar. Junk DNA: (ADN basura) ADN al cual no se le conoce funcin en el genoma. Corresponde a los intrones, ADN repetitivo y altamente repetitivo. LINE: (Long INterspersed Elements o Elementos Largos Dispersos). Son porciones de varios miles de pares de bases que se repiten varias veces. Los L1 poseen 6500 pb y se repiten de 20.000 a 50.00 veces en el genoma humano. Microarray:(Micromatrices o microchips). Los microarrays tambin llamados chips de ADN son slides de vidrio o siliconas conteniendo miles de oligonucleotidos de ADN. Son dispositivos utilizados para anlisis de gran numero de genes
El GENOMA
simultneamente. Pueden contener: genes expresados por un tipo celular particular, todos los genes del organismo o genes seleccionados que uno quiere investigar. Microsatlites: Son porciones repetitivas del ADN de 10 a 1000 pb donde secuencias de 2 a 10 pb se reiteran. Varios cientos de miles de microsatlites se encuentran en todo el genoma. Su funcin es desconocida. Estos se ubican en un solo lugar en el genoma variando su longitud y son utilizados como marcadores genticos. Minisatlites: Son porciones repetitivas de 1000 a 100.000 pb, donde 10 a 100 bp se repiten en un orden determinado. Existen miles en el genoma y su ubicacin subtelomrica es frecuente. Se desconoce su funcin. Se lo utiliza para el ADN fingerprinting(huella dactilar) Contig: Fragmentos del genoma que se han clonado separadamente, son contiguos y comparte parte del mismo(solapados) Retrotransposones o LTR: (Long terminal repeat). Elementos que pueden desplazarse en distintas regiones de los cromosomas. Estn emparentados con los retrovirus. RFLP: (Restriction Fragment Length Polymorphisms o Polimorfismos por tamao en los fragmentos de restriccin). Son fragmentos de ADN que se utilizan como sondas que pueden detectar diferencias con un ADN testigo con el uso de enzimas de restriccin. El polimorfismo se puede deber a alteracin del sitio de restriccin o de los minisatlites. SINE:(Short INterspersed Elements o Elementos Cortos Dispersos). Son porciones de ADN de 130 a 500 pb que se repiten muchas veces y constituyen el 20 % del genoma. Los ms comunes son la familia Alu(De 300 pb y que se encuentran repetidos mas de 500.000 veces en el genoma humano y son ricos en pares de G-C) y se les atribuye funciones en la evolucin. SNP:(Singe Nucleotide polymorphism - Polimorfismos de un solo nucletido).Son segmentos del ADN de aproximadamente 300 pb que se diferencian entre los individuos por un solo nucletido. Son utilizados como marcadores para identificar parentescos entre individuos. STC: (Secuence Target Conector o conectores etiquetados por su secuencia) http://www.ncbi.nlm.nih.gov/Genomes/ Son los extremos identificados de los BACs que permiten se lo pueda ubicar en el mapa. STS: (Secuence Tagget Site o lugares etiquetados por su secuencia) Son segmentos de ADN cortos(entre 100 y 1000 bp) que solamente aparecen una sola vez
en el genoma y que su ubicacin y secuencia de bases son conocidas. Son utilizada para identificar cromosomas e identificar zonas en los mapas fsicos. Transposones: Elementos moviles. UTR: (Un Traslated Region): son regiones dentro del ADN que no son traducidas durante el proceso de lectura de la polimerasa, para el paso de ARN a protena. VNTR: (Variable Number of Tandem Repeats) o marcadores satelitales YAC: (Yeast Artificial Crhomosome o Cromosoma artificial de levadura). Conformados por porciones de ADN(de de una especie estudiada) asociados a un cromosoma de levadura y se reproduce con este(clones). Hay bibliotecas de YACs.
BIBLIOGRAFIA: Debido a la cantidad de informacin generada en escaso tiempo es recomendable recurrir a las paginas de Internet de las empresas dedicadas a esta actividad: NATIONAL CENTER FOR BIOTECHNOLOGY INFORMATION: http://www.ncbi.nlm.nih.gov/Genomes/ NATIONAL ANIMAL GENOME RESEARCH PROGRAM http://www.animalgenome.org/ HUMAN GENOME ORGANIZATION (HUGO) http://www.hugo-international.org/
El GENOMA
Comparacin entre las dos estrategias de secuenciacin del genoma humano, la seguida por el consorcio pblico (a) y la del grupo liderado por Craig Venter (b). En la primera de ellas, se parte de una coleccin ordenada, mediante mapeo fsico y gentico, de fragmentos de tamao mediano, que son secuenciados luego por el procedimiento de la perdigonada. Por el contrario, en la segunda estrategia se procede a la secuenciacin completa del genoma por el procedimiento de perdigonada, con un nivel elevado de redundancia para garantizar la lectura de todas las posiciones, quedando para poderosos sistemas informticos la tarea de ensamblar las secuencias fragmentarias obtenidas en una nica secuencia lineal. En ambas estrategias se plantean problemas con las zonas del genoma ricas en DNA repetitivo, si bien en la primera es ms fcil identificar y cuantificar la extensin de las zonas no secuenciadas por este motivo

10 GenomaFRN

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

10 GenomaFRN

Uploaded by

Copyright:

Available Formats

El GENOMA

Carlos Enrique Pelozo

Facultad de Recursos Naturales UNIVERSIDAD NACIONAL DE FORMOSA Noviembre 2006

Carlos Enrique Pelozo

Carlos Enrique Pelozo

Carlos Enrique Pelozo

Carlos Enrique Pelozo

Carlos Enrique Pelozo

Carlos Enrique Pelozo

debe considerar las secuencias reguladoras inmediatas(Promotor) y alejadas(Intensificadores-Enhancers- y Silenciadores)

Carlos Enrique Pelozo

Carlos Enrique Pelozo

Carlos Enrique Pelozo

Carlos Enrique Pelozo

Carlos Enrique Pelozo

Carlos Enrique Pelozo

You might also like