Professional Documents
Culture Documents
1 2
Durante la dcada de 1980 los genetistas comenzaron a utilizar la tecnologa del ADN
recombinante como una aproximacin al anlisis gentico, cartografiando secuencias de ADN
clonadas en cromosomas especficos. La mayor parte de estas secuencias no eran genes, sino
marcadores como polimorfismos de longitud de fragmentos de restriccin (RFLP), polimorfismo de
un nico nucletido (SNP) y otros. Una vez asignados a un cromosoma, estos marcadores se
utilizaban en rboles genealgicos para establecer un ligamiento entre los marcadores y
enfermedades genticas. Este mtodo denominado clonacin posicional se utiliz para
cartografiar, aislar, clonar y secuenciar los genes de distintas enfermedades.
1
A mediados de 1980 ya se haban asignado ms de 3.500 genes y marcadores a
cromosomas humanos. Actualmente se han secuenciado centenares de genomas de procariotas
y eucariotas, y hay ms de mil proyectos en ejecucin.
Genmica Estructural
Genmica Funcional
Genmica Comparativa
2
La Protemica es una extensin de la Genmica y su objetivo es el estudio de las protenas
presentes en una clula, en un tejido, en un fluido en un momento dado bajo determinadas
condiciones. Define el conjunto completo de protenas codificadas por un genoma. Incluye:
Identificacin de todas las protenas expresadas en una clula bajo determinadas
condiciones.
La naturaleza y el alcance de cualquier modificacin pos-traduccional de las protenas.
Las interacciones protena-protena.
La localizacin subcelular de las protenas.
3
GENMICA ESTRUCTURAL
MAPAS GENTICOS
Distancia en un
mapa gentico
Marcadores de ADN
4
Durante muchos aos, los genes podan detectarse slo observando su influencia en un
rasgo (fenotipo) y la construccin de mapas genticos estaba limitada por la disponibilidad de
rasgos de un locus individual que podran examinarse por la evidencia de la recombinacin. Al
final, esta limitacin se super con el desarrollo de tcnicas moleculares, como el anlisis de
polimorfismos de la longitud del fragmento de restriccin, la reaccin en cadena de la polimerasa
(PCR) y la secuenciacin de ADN, mejorando los mapas genticos.
Los mapas genticos tienen varias limitaciones, la primera es la baja resolucin o el detalle.
Segundo, no siempre se corresponden con precisin a las distancias fsicas entre los genes. Los
mapas genticos se basan en las frecuencias de entrecruzamiento o recombinacin, que varan
de un cromosoma a otro, de modo que las distancias de un mapa gentico son slo
aproximaciones de distancias fsicas reales a lo largo de un cromosoma. A pesar de estas
limitaciones, los mapas genticos han sido fundamentales para el desarrollo de los mapas fsicos y
la secuenciacin de genomas completos.
MAPAS CITOGENTICOS
5
Con el avance de las tcnicas de bandeo cromosmico, la citogentica cuenta con una
herramienta de mayor precisin en la individualizacin de los cromosomas, facilitando su
agrupamiento y clasificacin morfolgica.
El estudio citogentico en animales domsticos se ha desarrollado rpidamente en los
ltimos aos. Hoy en da es utilizado como elemento de diagnstico que permiten detectar un
gran nmero de patologas. A su vez el bandeo cromosmico, ha permitido precisar la
localizacin de genes aportando informacin al mapa gentico. Por otro lado permiten realizar
estudios evolutivos de especies relacionadas entre s.
La construccin de los mapas citogenticos o cromosmicos se realizan utilizando tcnicas
que no incluyen la reproduccin sexual (meiosis) y, por lo tanto, asignan una localizacin segn las
regiones citogenticas (adems, estos mapas presentan la ventaja de no requerir del uso de
marcadores polimrficos). Esas tcnicas son:
Hibridacin in situ,
Hbridos de clulas somticas
Hbridos de radiacin.
Hibridacin In Situ.
Cuando una secuencia de ADN, en este caso referida como una sonda de ADN (en
ingls, probe), es marcada con istopos radioactivos o fluorescencia, podemos hibridarla con su
secuencia complementaria en el ADN genmico de un cromosoma especfico y observar la
marca directamente sobre el extendido cromosmico con un microscopio ptico. Las clulas
deben estar fijas y los cromosomas esparcidos en un portaobjetos y expuestos a una solucin de
pH elevado para romper el apareamiento de bases y permitir el acceso a las sondas. La
hibridacin in situ fluorescente (FISH) es una tcnica muy sensible siempre que se cuente con
sondas lo suficientemente grandes (y homlogas) y que se suprima la fluorescencia de fondo. La
sensibilidad de esta variante de la tcnica de hibridacin in situ es que permite localizar una
secuencia con una precisin de hasta 30 Mb y de detectar anormalidades cariotpicas en
cromosomas metafsicos tanto como interfsicos. Los fluorocromos ms empleados son:
fluorescena (FITC), rodamina (XRITC) y Texas Red.
6
Por ltimo, el pintado de cromosomas (del ingls chromosome painting) es una variante del
FISH que emplea una mezcla de sondas de ADN derivada de un cromosoma entero o de una
regin cromosmica de inters. Se utiliza para obtener patrones de regiones homlogas entre
diferentes especies y es una forma muy directa de evaluar la cantidad de rearreglos que se
produjeron entre dos especies en el curso de la evolucin.
7
Hbridos de Radiacin (HR)
Otra tcnica desarrollada para obtener mapas de alta resolucin son los paneles de
hbridos de radiacin (Radiation Hybrid RH), enfoque descripto por Goss y Harris en 1975. Las dos
grandes ventajas de este sistema son que pueden mapearse marcadores o genes no polimrficos
(se evala slo la presencia o ausencia de un marcador) y que se logra una resolucin mayor que
con los mapas de ligamiento, constituyendo un puente entre stos y los mapas fsicos. Estos
paneles de clulas hbridas se construyen a partir de clulas donantes (de la especie a ser
mapeada) que han sido irradiadas letalmente (ya sea con rayos g o X) para causar la
fragmentacin de sus cromosomas (por roturas de doble cadena). Las clulas as irradiadas son
fusionadas con lneas celulares receptoras deficientes para un marcador de seleccin, como ser
la timidina quinasa (TK) o la hipoxantina fosforibosil transferasa (HPRT). Usando condiciones de
seleccin con medios apropiados, sobrevivirn slo aquellas clulas que contengan, por lo menos,
algn fragmento cromosmico proveniente de las clulas dadoras.
El concepto terico es que aquellos loci que se encuentran muy prximos unos de otros
sern retenidos en el mismo fragmento cromosmico despus de la radiacin. Esta caracterstica
es similar al principio de ligamiento gentico que hemos visto en los mapas meiticos. Como en los
paneles de ADN obtenidos con cruzas de animales, la informacin de los paneles HR es
acumulativa y puede proveer datos para el ordenamiento (de alta resolucin) de regiones no
polimrficas o no separables por los mapas de ligamiento.
Figura 6. Hbridos de radiacin. Construccin de clones de hbridos de radiacin (HR) a partir de clulas
donantes con un nico cromosoma humano (hbrido mono-cromosmico) y clulas receptoras de hmster.
Cada clon (abajo) presenta una coleccin diferente (al azar) de fragmentos del cromosoma humano
original. Los 6 loci hipotticos (A a F) se marcan como + (presencia) o - (ausencia), dando una idea del
ordenamiento en el cromosoma original
8
Cuando se evala un marcador (por Southern blot, FISH o PCR), el patrn de presencia (+)
o ausencia () a travs del panel, define el emplazamiento del mismo: aquellos marcadores con el
mismo patrn de + y estarn localizados en el mismo bin o posicin. Estos estudios se conocen
como patrones de retencin de marcadores y nos ayudan a determinar la ubicacin de un gen
o marcador. En estos casos, la unidad para medir la distancia en el mapa es el Ray o el centiRay
(cR).
MAPAS FSICOS
Los mapas fsicos estn basados en el anlisis directo del ADN y ponen los genes respecto
a distancias medidas en el nmero de pares de bases, kilobases o megabases. Un tipo comn de
mapa fsico es el que conecta piezas aisladas de ADN genmico que fue clonado en bacterias o
levaduras. Una de las ventajas es que, por lo general, los mapas fsicos tienen resolucin mayor y
son ms exactos que los mapas genticos.
Clones de ADN
alineados
Figura 7. Los
mapas fsicos a
menudo se utilizan
para ordenar los
fragmentos de
ADN clonados.
Hay varias tcnicas para crear mapas fsicos, entre las que se incluyen el mapeo de
restriccin, que determina las posiciones de sitios de restriccin en el ADN; el mapeo del sitio de
secuencia especfica (sequence-tagged site, STS), que localiza las posiciones de secuencias
cortas nicas de ADN en un cromosoma; la hibridacin in situ fluorescente (fluorescent in situ
hybridization, FISH), por el cual pueden mapearse los marcadores visualmente en sus
localizaciones cromosmicas y la secuenciacin de ADN.
9
VISUALIZACION DE LOS FRAGMENTOS DE ADN
2. Otra tcnica es la Southern blot, sirve para transferir los fragmentos desnaturalizados
monocatenarios provenientes de un gel a un medio slido delgado. Estos fragmentos son cortados
por una o ms enzimas de restriccin. Se puede identificar que clones de una biblioteca
contienen una determinada secuencia de ADN y para caracterizar el tamao de los fragmentos.
Tambin se puede utilizar para determinar si un clon contiene todo un gen o solo parte de el.
Los fragmentos se separan por electroforesis en gel, lo que produce una serie de bandas.
Se tie el ADN en el gel con bromuro de etidio y se fotografa o escanea para determinar el
nmero y peso molecular de los fragmentos. El ADN se debe desnaturalizar en fragmentos de
cadena sencilla con un tratamiento alcalino. Se cubre el gel con una membrana de nitrocelulosa.
Los fragmentos de ADN del gel se transfieren a la membrana colocando la membrana y el gel
sobre un pabilo (esponja) sumergida parcialmente en una solucin tampn. Se colocan varias
capas de papel de celulosa secante. La accin capilar arrastra el tampn por el gel y de esta
manera se transfieren los fragmentos de ADN del gel al filtro de nitrocelulosa. Despus de la
transferencia al gel se coloca en una solucin de hibridacin de una sonda marcada en forma
radiactiva o qumica. La sonda se unir a todos los fragmentos de ADN en la membrana que
posee secuencias complementarias. Luego se lava la membrana para sacar la sonda no unida y
la sonda unida se detecta por autorradiografa u otro mtodo para sondas marcadas.
10
Figura 8. Tcnica de Southern blot
para transferir los fragmentos
desnaturalizados monocatenarios
provenientes de un gel a un
medio slido delgado.
7. Mutagnesis
Una manera muy eficaz para estudiar los genes es provocar mutagnesis y estudiar los efectos
en el organismo.
11
8. Animales transgnicos
En ratones y otros mamferos el ovocito es lo
suficientemente grande como para inyectar el ADN
de manera directa. En el estado de dos proncleos
antes de la fecundacin. Antes de la fecundacin se
puede inyectar el ADN en uno de ellos y as unas
copias de ADN son inyectadas y se integran al azar
mediante un proceso denominado recombinacin
no homloga. Los embriones se implantan luego en
una hembra seudopreada, madre sustituta.
Figura 10. Knock-out. Dentro del ratn la copia normal del gen
puede intercambiarse con la desactivada a travs de la
recombinacin.
12
Reaccin en Cadena de la Polimerasa para amplificar el ADN (PCR)
14
SECUENCIACION
15
Figura 12. Mtodo qumico de
Maxam y Gilbert.
16
de poliacrilamida - urea. Cada una de las cuatro reacciones de sntesis se corre en calles
individuales (A, T, G y C) y se visualizan las bandas de ADN mediante autorradiografa o luz
ultravioleta. Las bandas obtenidas en el gel corresponden a los fragmentos de ADN de diferentes
longitudes
Una banda en una calle indica un fragmento de ADN que es el resultado de una
terminacin de la cadena tras la incorporacin de un didesoxinucletido (ddATP, ddGTP, ddCTP o
ddTTP). El nucletido terminal puede ser identificado de acuerdo al didesoxinucletido que se
aadi en la reaccin que dio lugar a esa banda. Las posiciones relativas entre las cuatro calles
se utilizan entonces para leer la secuencia de ADN.
17
Secuenciacin automtica de Sanger
Durante muchos aos, la secuenciacin del ADN se realiz sobre todo en forma manual y
era una tcnica laboriosa y costosa. En la actualidad, la secuenciacin se lleva a cabo mediante
aparatos automatizados que utilizan colorantes fluorescente y escneres de lser para los miles de
secuencias de pares de bases en unas pocas horas.
Figura 14. Esquema de la secuenciacin por el mtodo automtico de electroforesis capilar con la secuencia
obtenida.
Los ddNTP utilizados en la reaccin automatizada se marcan cada uno con un colorante
fluorescente distinto. Las cuatro reacciones pueden tener lugar en el mismo tubo de ensayo y
pueden colocarse en el mismo pocillo durante la electroforesis, dado que cada dNTP se marca en
forma distintiva. Los aparatos de secuenciacin recin desarrollados llevan a cabo la electroforesis
en tubos capilares que contienen gel. Los fragmentos de diferentes tamaos producidos por la
reaccin de secuenciacin se separan dentro de un tubo y al migrar pasan por delante de un haz
de lser y un detector.
Cuando los fragmentos pasan por el lser, sus colorantes fluorescentes se activan y la
fluorescencia resultante se detecta por un escner ptico. Cada colorante emite fluorescencia de
una longitud de onda caracterstica que se lee en el escner ptico. Para la interpretacin, la
informacin ingresa en una computadora y los resultados se imprimen como un conjunto de picos
18
en un grfico (Fig. 14). Los aparatos de secuenciacin automatizados pueden contener 96 tubos
capilares o ms, lo que permite leer secuencias de 50.000 a 60.000 pb en unas pocas horas.
19
El equipo funciona de forma completamente automtica inyectando las muestras (que se
preparan exactamente igual que durante la secuenciacin en geles y se colocan en una placa
de 96 pocillos), en un capilar previamente cargado con un cierto polmero que funciona como lo
hace la matriz de acrilamida-bisacrilamida-urea de los geles de secuencia, permitiendo resolver
fragmentos de ADN de cadena sencilla que se diferencian en una nica base.
A una altura determinada el laser detecta la fluorescencia emitida por cada cadena
sencilla de ADN fluorescente y traduce esta emisin de fluorescencia en la secuencia
correspondiente. Una vez desarrollada la electroforesis de la primera muestra, el capilar se vaca
rellenndose nuevamente con polmero fresco. Se inyecta a continuacin una segunda muestra,
se procede a desarrollar nuevamente la electroforesis y as sucesivamente.
20
SECUENCIACIN DE TODOS LOS GENES DEL GENOMA
Corte de ADN
con enzima de Figura 17. Estrategia general para clonar un gen.
restriccin
Un trozo de ADN es manipulado con enzimas de
restriccin e introducido en un plsmido el cual a
su vez es introducido en una bacteria. Al cultivar la
bacteria se obtienen mltiples copias del ADN de
inters.
Introduccin del
plsmido El clonado se realiza con distintos tipos
recombinante a
la bacteria de enzimas de restriccin y vectores: Las
enzimas de restriccin son protenas aisladas
de bacterias cuya funcin es cortar ADN.
Cada enzima reconoce un sitio particular del
ADN, es decir que reconoce una secuencia
particular de nucletidos. Esa secuencia
especfica se denomina sitio de restriccin.
Una vez que la enzima reconoce estos sitios,
se posiciona sobre la molcula de ADN y
corta dentro o en torno de esa secuencia.
21
Cortes con extremos romos Cortes con extremos cohesivos
de ADN que llevan insertados. Para que sirva de vector, una molcula debe ser capaz de
replicarse junto con el fragmento de ADN que transporta. Tambin tiene que tener secuencias de
reconocimiento que permitan la insercin del fragmento de ADN a clonar.
Para insertar un fragmento de ADN al vector, se utiliza una enzima de restriccin, y se
mezcla con fragmentos de ADN producidos con la misma enzima.
Los vectores que transportan un fragmento insertado se denominan vectores
recombinantes.
Hay muchos vectores de clonacin, que es una molcula de ADN replicante y estable a la
cual puede adherirse un fragmento de ADN extrao para la introduccin en una clula. Difieren
en la especificidad de la clula husped, el tamao de los insertos que pueden transportar y en el
nmero de copias que producen y el nmero y tipo de genes marcadores que contienen.
Tipos de Vectores:
Vectores procariotas:
1. Plsmidos: (ADN epismico). Para secuencias cortas de 10.000 bases (10 Kb). Son circulares y
existen naturalmente en las bacterias. Contienen orgenes de replicacin y pueden por eso
replicarse independientemente del cromosoma bacteriano.
22
extremos romos. Primero, se corta el plsmido y el ADN extrao con una enzima de restriccin. Si la
enzima de restriccin produce extremos cohesivos, estos se eliminan por una enzima que digiere el
ADN monocatenario. De manera alternativa el plsmido y el ADN extrao pueden cortarse por
una enzima de restriccin que produce extremos romos. Una vez que el plsmido y el ADN extrao
tienen extremos romos, los extremos cohesivos monocatenarios son agregados por una enzima
transferasa terminal.
Un tercer mtodo de insercin de fragmentos consiste en utilizar la enzima ligasa T4, capaz
de conectar dos piezas cualquiera de extremos romos de ADN y se denomina clonacin
mediante el uso de conectores.
Una vez insertado el plsmido debe introducirse en las clulas bacterianas. Esta tarea suele
cumplirse mediante la transformacin y que es la capacidad de las bacterias de captar el ADN
del ambiente externo. Muchas veces la transformacin es un proceso natural, y otros deben
tratarse en forma qumica o fsica previamente. Los plsmidos dentro de la clula se replican y
multiplican.
2. Bacterifagos: (gran capacidad para invadir bacterias, se utiliza para ADN complementario y
genmico). Ofrecen ciertas ventajas y el ms comn es el bacterifago que infecta E. Coli. Una
de sus ventajas es la elevada eficiencia para transferir el ADN a las bacterias. Una segunda
ventaja es que cerca de la tercera parte del genoma no es esencial para la infeccin ni para la
reproduccin. Estos genes no esenciales que comprenden alrededor de 15 Kb pueden ser
reemplazados por hasta 23 Kb de ADN extrao. El ADN extrao cortado con EcoRI tendr
extremos cohesivos que son complementarios con los de los extremos de los genes esenciales, a
los cuales puede conectarse mediante la ligasa. El cromosoma posee extremos monocatenarios
cortos denominados sitios cos, necesarios para empaquetar en ADN dentro de la cabeza de un
fago. Los cromosomas del fago recombinante pueden entonces empaquetarse en la cubierta
proteica y agregarse a E. coli. Los fagos inyectan su ADN recombinante dentro de la clula,
donde se replicar. Slo los fragmentos de ADN de tamao adecuado y que contienen genes
esenciales se empaquetarn en las cubiertas del fago.
3. Csmidos: Los csmicos combinan las propiedades de los vectores plsmidos y los fagos. Los
fragmentos de ADN grandes de 44 Kb pueden clonarse en csmicos.
Los csmicos son plsmidos pequeos que contienen los sitios cos del fago ; pueden
empaquetarse con las cubiertas virales y transferirse a las bacterias por infeccin viral. Dado que
se pierden todos los sitios virales menos los sitios cos, un csmico puede tener ms del doble del
ADN extrao que puede transportar el fago vector.
23
El ADN extrao es insertado en los csmicos del mismo modo que se introduce en los plsmidos.
Vectores eucariotas:
24
1. YACs: (cromosoma artificial de levadura). Es un material bastante inestable. Para secuencias
de hasta 1 Mb (1000 Kb o 1 milln de bases). Son molculas de ADN con un origen de replicacin
de levadura, que permite que se replique, un par de telmeros que garantizan estabilidad dentro
de la clula y un centrmero.
2. BAC: Cromosoma artificial de bacterias. Se utilizan para clonar segmentos grandes desde 100
a 500 Kb (100.000 bases a 500.000 bases).
El ADN clonado en los BACs es por lo general ms pequeo que los YACs. Sin embargo, los
BACs ofrecen ventajas importantes como por ejemplo, son ms manipulables para ciertos tipos de
25
estudios en el laboratorio. Los BACs se usan a gran escala para construir mapas fsicos de alta
resolucin de los cromosomas, con el fin de establecer la secuencia completa del genoma.
El mtodo de Hierarchical Shotgun Sequencing fue propuesto por James Watson y Francis
Collins, entre otros, contando con la mayor parte de la financiacin pblica.
Esta metodologa resulta la ms compleja, con un conocimiento ms exhaustivo del
genoma. Bsicamente consiste en secuenciar el genoma completo, cromosoma a cromosoma de
26
un extremo al otro. Se hacen 2 o 3 fragmentos del ADN (fragmentos cortos de 2 Kb, fragmentos de
15-20 Kb y tambin se pueden hacer fragmentos de 200-300 Kb).
Luego se construye una biblioteca genmica con cada preparacin con la utilizacin de
vectores BAC. Se seleccionan y secuencian clones al azar de estas bibliotecas. Luego se utiliza un
programa para ensamblar y superponer largos tramos de secuencia a partir de los fragmentos
cortos, usando las secuencias de los clones ms largos como marco de referencia.
1 2
27
Tabla 1. Ejemplos de genomas completos o de borradores de secuencias publicadas.
28
NUEVOS MTODOS DE SECUENCIACIN
SECUENCIACIN DE ALTO RENDIMIENTO
Figura 25. Evolucin de las tecnologas de alto rendimiento. ABI-3730 de Applied Biosystems, posiblemente el
ms utilizado en la secuenciacin del genoma Humano, con una capacidad de 1 Mb por da (Un milln de
bases). El AB-SOLID actual, en menos de 10 aos ha multiplicado por 1000 la capacidad de secuenciacin.
29
Amplificacin clonal in vitro
Figura 26. Emulsin de PCR. Una molcula de ADN por perla. La amplificacin clonal de miles de copias se
produce en microrreactores en una emulsin.
30
Figura 27. Amplificacin en fase slida. Una molcula de ADN por Cluster.
Secuenciacin paralelizada
Una vez que las secuencias clonales de ADN se localizan fsicamente en posiciones
separadas de la superficie, se pueden utilizar varios mtodos de secuenciacin para determinar
las secuencias de ADN de todas las localizaciones en paralelo.
1 2
31
La "secuenciacin por sntesis", como en la popular secuenciacin electrofortica con
terminador marcado con colorante, usa el proceso de sntesis de ADN por ADN polimerasa para
identificar las bases presentes en la molcula complementaria de ADN. Los mtodos de
terminador reversible (usados por Illumina y Helicos) utilizan versiones reversibles de terminadores
marcados con colorante, aadiendo un nucletido cada vez, y detectando la fluorescencia
correspondiente a esa posicin y removiendo posteriormente el grupo de bloqueo para permitir la
polimerizacin de otro nucletido.
32
reservorio de todos los oligonucletidos posibles de una longitud dada, marcados de acuerdo con
la posicin secuenciada. Los oligonucletidos se templan y ligan; el ligamiento preferente de las
ADN ligasas por su secuencia especfica produce una seal correspondiente a la secuencia
complementaria en esa posicin concreta. Shendure et al., usaron este mtodo para secuenciar
el genoma de E. coli MG1655.
33
Real Time (Secuenciacin en Tiempo Real)
Genoma de enriquecimiento
A pesar de las reducciones de costes sustanciales asociados con tecnologas NGS (Next
Generation Sequencing) en comparacin con el mtodo automatizado de Sanger, la
secuenciacin del genoma completo es todava un esfuerzo costoso. Una solucin provisional a
este problema puede ser el uso de plataformas de NGS para apuntar a regiones de inters
especficas. Esta estrategia se puede utilizar para examinar todos los exones en el genoma, genes
especficos de las familias que constituyen dianas farmacolgicas conocidas o las regiones que
estn implicados en enfermedades o en efectos farmacogenticos.
34
El concepto de focalizacin de regiones especficas del genoma est bien establecido,
con la PCR es el ms ampliamente utilizado, aunque en una escala pequea. PCR acoplado con
secuenciacin de Sanger est adecuadamente emparejado para analizar unos cuantos
candidatos genes, pero el acoplamiento de la PCR con las plataformas NGS de alto rendimiento
no es prctico porque la preparacin de la muestra requerira el manejo de decenas de miles de
cebadores de forma individual o en grupos multiplex.
Un artculo de Frazer y sus colegas en colaboracin con RainDance Technologies (2009)
informaron la amplificacin simultnea de 3.976 productos que utilizan tecnologas de microgotas
PCR.
La produccin de grandes cantidades a bajo costo hace que las plataformas de NGS
descritas anteriormente sean tiles para muchas aplicaciones. Estos incluyen el descubrimiento de
la variante por resecuenciacin de regiones especficas de inters o genomas en su totalidad, el
asamblado de novo de bacterias y de genomas eucariotas menores, la catalogacin de los
transcriptomas de clulas, tejidos y organismos (ARN-seq), los perfiles en todo el genoma de las
marcas epigenticas y la estructura de la cromatina usando mtodos basados en la seq (CHIP-
seq, metil-seq y ADNsa-seq) y la clasificacion de especies y el descubrimiento de genes pora
estudios de la metagenmica.
Por ejemplo, las plataformas Illumina/Solexa y LIfe/APG son variantes muy adecuadas para
el descubrimiento de resecuenciacin de genomas humanos, porque se producen por ciclo
volmenes gigantescos de bases de alta calidad.
Adems, la plataforma, Helicos BioSciences es muy adecuado para aplicaciones que
exigen informacin cuantitativa de ARN o ARN seq.
El rpido ritmo de los avances tecnolgicos en el campo podra cambiar esta informacin
en un futuro prximo.
Genomas individuales
Los estudios del genoma humano tienen por objeto un catlogo de SNV S (variante de un
simple nucletido) y la SVS (variantes estructurales) y su asociacin a diferencias fenotpica, con el
objetivo final de personalizar la genmica con fines mdicos. En 2004, el Consorcio Internacional
de Secuenciacin del Genoma Humano public la primera, y todava nica, referencia terminada
del genoma humano (actualmente Centro Nacional de Biotecnologa de la Informacin: NCBI). Su
costo fue estimado en US $300 millones.
La genmica individual tambin est siendo aplicada al estudio de la enfermedad. Por
ejemplo, Mardis et al., reportaron la secuencia de dos genomas del cncer de leucemia mieloide
agudo mediante la plataforma Illumina/Solexa, y ambos estudios, identificaron mutaciones
somticas que pueden ser asociada con la enfermedad. Gibbs et al., describieron recientemente
35
la elucidacin de las dos variantes allicas en una familia con una forma recesiva de la
enfermedad de Charcot-Marie-Tooth utilizando la plataforma Life/APG.
Varios proyectos destinados a la secuenciacin de ms individuos, incluyendo el Atlas del
genoma del cncer y El proyecto de 1000 Genomas, tambin estn utilizando las plataformas
Illumina/Solexa y Life/454 para secuenciar genomas enteros.
En comparacin con la secuenciacin automatizada de Sanger, las plataformas de NGS
han aumentado dramticamente el rendimiento y redujo sustancialmente los gastos, con varios
grupos presentando informes de costos de reactivos por debajo de $100.000. Sin embargo, existe
una gran variabilidad entre y dentro de plataformas NGS en trminos de tamao del molde y
construccin, largo de lectura, rendimiento y la base y la cobertura del genoma, y dicha
variabilidad hace que sea difcil evaluar la calidad (es decir, la precisin de la cobertura del
genoma y continuidad del genoma) de los genomas basado en consideraciones de costo.
En junio de 2009, Illumina anunci la secuenciacin del genoma individual por el precio de
US$ 48.000. Complete Genomics ofrece un servicio similar a un precio de US$ 5.000. Sin embargo, el
logro del ahorro de los costos tambin puede venir con una disminucin de la calidad de la
informacin.
Las tecnologas de NGS tienen una impresionante gama de aplicaciones, y actualmente se
estn desarrollando an ms. Adems de las aplicaciones descritas anteriormente, las tecnologas
de NGS estn siendo utilizadas para caracterizar las relaciones evolutivas de genomas antiguos y
para dilucidar el papel de secuencias no codificantes en la salud y enfermedades. En un futuro no
muy lejano, es previsible que las tecnologas de NGS pudieran ser utilizadas para obtener datos de
alta calidad a partir de la secuencia un genoma aislado de una sola clula, lo que sera un
avance importante, sobre todo para la genmica del cncer. Para que esto ocurra, sern
necesarios avances en las tcnicas, para aislar eficazmente largas molculas de ADN intactas, y
en los mtodos, para la lectura precisa de la secuencia. El campo del desarrollo de NGS y las
aplicaciones es un rea de rpido movimiento de la investigacin, que hace de este un momento
emocionante para los estudios genmicos.
36
Aplicaciones de la tecnologa del ADN recombinante
Adems de proporcionar informacin valiosa sobre los genes la Tecnologa del ADN
recombnate tiene numerosas aplicaciones como la elaboracin de productos farmacuticos
(insulina), y otras sustancias, bacterias especializadas (como produccin de etanol a partir de
plantas), plantas y animales de granja diseados por ingeniera gentica y para corregir defectos
genticos humanos. Algunos frmacos oligonucletidos (secuencias cortas de ADN sinttico o de
ARN pueden utilizarse para tratar enfermedades (terapia gnica). Los oligonucletidos antisentido
son complementarios a los ARN no deseados, como el ARN viral. Cuando se agrega a una clula,
estos ADN antisentido se unen al ARNm viral e inhiben su traduccin. Varios frmacos han sido
probados para diferentes tratamientos para el cncer.
Tambin ha permitido el desarrollo de sondas para detectar mutaciones causantes de
enfermedades. Se dispone de la comprobacin prenatal para varios centenares de
enfermedades genticas. Para muchas enfermedades genticas las nicas pruebas diagnsticas
disponibles son las que identifican una mutacin predisponerte en el ADN, pero muchas
enfermedades genticas son provocadas por varias mutaciones diferentes y derivar en resultados
pueden ser falsos Salvo la completa secuenciacin del gen que es costosa no hay manera de
identificar a todos los individuos predispuestos.
En la terapia gnica deban primero localizarse los genes causantes de enfermedades y
desarrollarse vectores. Un mtodo de terapia consiste extraer clulas del cuerpo agregar los virus
con los genes recombinantes e reintroducir las clulas en el cuerpo del paciente. En este caso los
vectores se introducen directamente.
Figura 32. Evolucin de proyectos y publicaciones
37
Generalidades del anlisis genmico
El objetivo final del anlisis de la secuencia es obtener una descripcin funcional completa
de todos los genes del genoma de un organismo.
38
GENMICA FUNCIONAL
La Genmica Funcional clasifica los genes de las secuencias dilucidadas por la Genmica
Estructural e identifica sus funciones.
Algunos genes pueden tener funciones previamente asignadas mediante los mtodos
clsicos de mutagnesis y de cartografa de ligamiento; pero muchos genes no tienen an una
funcin asignada.
La genmica funcional es el estudio simultneo de todos los genes involucrados en un
estado fisiolgico determinado o en un tejido en particular.
Permite comprender la organizacin y los mecanismos genticos que en conjunto hacen a
la fisiologa de un organismo.
La secuencia de nucletidos de un gen puede utilizarse para predecir la secuencia de
aminocidos de la protena que codifica. Entonces, la protena puede sintetizarse o aislarse y
estudiarse sus propiedades para determinar su funcin. Sin embargo, este enfoque bioqumico
para la comprensin de la funcin gnica insume tiempo y es costoso. Un objetivo fundamental
de la genmica funcional fue desarrollar mtodos informticos que permitan identificar la funcin
gnica a partir de la secuencia de ADN sola, evitando el proceso laborioso de aislar y caracterizar
las protenas individuales.
Despus de obtener una secuencia genmica, la siguiente tarea es asignar funciones a los
genes de la secuencia. Algunos genes pueden tener funciones previamente asignadas mediante
los mtodos clsicos de mutagnesis y de cartografa de ligamiento; pero muchos genes no
tienen una funcin bien dirigida asignada.
Una aproximacin para asignar funciones a estos genes es la utilizacin de bsqueda de
homologa. Este anlisis tiene diversos componentes: bsqueda en bases de datos como GenBank
para encontrar genes parecidos aislados en otros organismos, comparar la secuencia de un ORF
con la de un gen bien caracterizado de otro organismo, rastrear el ORF en busca de motivos
funcionales, regiones del ADN que codifican dominios proteicos como canales de iones, regiones
de unin a ADN o seales de secrecin/exportacin.
39
Predecir redes sociales de genes estrechamente relacionadas con procesos biolgicos
especficos.
Northern Blot
PCR cuantitativa
Hibridacin substractiva
Differential display
Microarrays (Microarreglos de ADN)
SAGE
XX-seq: RNA-Seq, Chl-Seq, CVN-Seq.
Northern Blot
40
PCR cuantitativa o PCR en tiempo real
Al igual que la PCR convencional, se utiliza un molde de ADN, cebadores especficos, dNTP
y una ADN polimerasa; a esto se le adiciona una sustancia marcada con fluorforo.
41
1 2
42
1. Se construye o compra un
microarray o chip, que contiene el
ADN de cadena simple que
representa miles de genes
diferentes.
Figura 38. SAGE. Luego de la obtencin de los ditaq se realiza clonado, secuenciacin y anlisis
bioinformtico.
44
Figura 39. Comparacin de las secuencias de los Tag con bases de datos especficas como SAGE Genie
donde ya se encuentran mapeados los tags con sus respectivos genes y permite la identificacin y
caracterizacin de los transcriptos
ARN-Seq
46
GENMICA COMPARATIVA
47
por organismos alejados sean esenciales para la vida. Comparando los conjuntos de genes
compartidos por organismos diferentes sera posible catalogar los compartidos y desarrollar una
lista de genes que se consideraran indispensables para la vida.
Los genes ortlogos son aquellos que descienden de un gen ancestral comn que tienen la
misma funcin en diferentes especies. As por ejemplo Mycoplasma genitalium comparte 240
genes ortlogos con Haemophilus influenzae adems se identificaron 16 genes cuyas secuencias
son diferentes pero realizan la misma funcin. Mycoplasma genitalium tiene un genoma con 480
genes que codifican protena, lo que representa el genoma bacteriano mas pequeo de entre los
casi 150 genomas secuenciados hasta la fecha.
Los genes que pertenecen a familias multignicas comparten secuencias de ADN similares
pero no idnticas como resultado de una mutacin en linaje con un nico gen ancestral. Sus
productos a menudo son diferentes con funciones parecidas pero sus genes no siempre se
encuentran en una misma localizacin del cromosoma.
Las familias multignicas permiten aportan conocimientos sobre la evolucin del genoma.
Las protenas que surgen a partir de la duplicacin de un nico gen se denominan parlogas. La
familia de la globina es un ejemplo de familia multignica parloga que surgi por duplicacin y
dispersin a diferentes sitios cromosmicos.
Las familias multignicas estn presentes en muchos genomas. Adems de las amplias y
grandes mutaciones de los genes pequeos bloques de genes pueden duplicarse mediante
diversos mecanismos. La filogenia molecular ha trazado el linaje y las relaciones entre los miembros
de las familias gnicas. Uno de los ejemplos mejor estudiados de divergencia es la superfamilia
gnica de las globinas. En esta familia hace 800 aos se produjo la duplicacin de un gen
ancestral que codificaba a una protena de transporte de oxgeno. De los dos genes generados,
uno evolucion hasta la mioglobina actual y el otro en el gen de la globina ancestral el que se
duplic y form los prototipos de las subfamilias gnicas de la y globina. Otros patrones se
observan en otras familias gnicas las que son intensamente estudiadas en el genoma humano.
Como se observa en la figura 42, en la regin media del cromosoma 6 bovino (BTA6) se
han mapeado diferentes QTL asociados a rasgos fenotpicos como produccin de leche,
conformacin y rasgos funcionales en animales de tambo y composicin corporal y crecimiento
en animales de cra. En BTA6, la proporcin de los genes de la especie bovina que se han
asignado es relativamente pequea y se distribuye de manera desigual. Estudios comparativos del
mapeo cromosmico de alta resolucin combinados con la informacin de las secuencias
nucleotdicas pueden ser utilizado para detectar la posicin y funcin, dentro de regiones del
cromosoma, de genes candidatos polimrficos que afectan variables fenotpicas de importancia
econmica y fisiolgica en bovinos. La alineacin comparativa de las secuencias de los
cromosomas ortlogos humanos, de ratn, de gallina y de perro con la secuencia bovina permiti
enriquecer mapas previos del cromosoma BTA6 determinando loci nuevos. Utilizando el anlisis de
RH, incluyeron un total de 63 nuevos genes y EST con precisin en relacin con la posicin de los
48
loci conocidos, por lo tanto, aumentaron la densidad de los genes y ESTs integrados en el mapa
de BTA6.
Figura 42. Mapeo comparativo entre cromosomas de pollo, bovino, humano, ratn y perro.
49
LA PROTEMICA
Esta rama se ocupa de Identificar y analizar las protenas de una clula. El Proteoma define
el conjunto completo de protenas codificadas por un genoma.
En la mayora de los genomas secuenciados se desconoce la funcin de muchos de los
genes recin descubiertos. Muchas veces se le asigna una funcin por su homologa con genes
conocidos. En E coli y S cerevisiae se desconoce la mayor parte de la funcin de los genes
codificados al igual que en humanos.
A medida que se dispone de ms datos de las secuencias de los eucariotas se hace
evidente que su complejidad no esta necesariamente correlacionada con la cantidad de genes.
Por ejemplo Drosophila tiene menos genes que C. elegans pero no es menos complejo que el
nemtodo. La relacin entre gen y producto gnico es compleja. Los genes pueden tener sitios
mltiples de inicio de la transcripcin que produce varios transcriptos distintos. El corte y empalme
alternativo y la edicin de las molculas generan docenas de protenas diferentes a partir de un
nico gen. En humanos se estima que el 40 60% producen ms de una protena por ese motivo.
El anlisis de la funcin proteica se ve dificultado por el hecho de que muchas protenas trabajan
va interacciones protena protena o como parte integrante de un gran complejo molecular.
La protemica se utiliza para reconciliar las diferencias entre el nmero de genes de un
genoma y el nmero de protenas (producto final) observadas en la clula. Proporciona
informacin sobre la funcin de las protenas, su estructura, las modificaciones post-
traduccionales, las interacciones protenicas sus variantes y las relaciones con otras protenas del
genoma.
La protemica utiliza tcnicas para separar e identificar las protenas aisladas. La
combinacin de tcnicas implica un gel de electroforesis bidimensional (2DGE) y espectrometra
de masas. En la primera las protenas extradas de una clula se cargan en un gel de
poliacrilamida y se separa segn su carga elctrica. El gel se rota 90 y las protenas se separan
segn su peso molecular. Las modernas tcnicas de espectrometra de masas permiten
determinar con precisin la masa de molculas. Uno de estos mtodos se denomina ionizacin
por lser asistida por matriz (MALDI). Se pueden identificar cientos de protenas por da y los
bancos de espectrmetros pueden procesar cientos de muestras en un solo da. Nuevos
instrumentos se estn desarrollando para el procesado de muestras con ms rapidez, sensibilidad
y precisin.
50