Professional Documents
Culture Documents
2
Figura 1. Organismos modelo utilizados
para identificar mutaciones y generar
Durante la dcada de 1980 los genetistas comenzaron a utilizar la tecnologa del ADN
recombinante como una aproximacin al anlisis gentico, cartografiando secuencias de ADN
clonadas en cromosomas especficos. La mayor parte de estas secuencias no eran genes, sino
marcadores como polimorfismos de longitud de fragmentos de restriccin (RFLP), polimorfismo de
un nico nucletido (SNP) y otros. Una vez asignados a un cromosoma, estos marcadores se
utilizaban en rboles genealgicos para establecer un ligamiento entre los marcadores y
enfermedades genticas. Este mtodo denominado clonacin posicional se utiliz para
cartografiar, aislar, clonar y secuenciar los genes de distintas enfermedades.
GENMICA ESTRUCTURAL
MAPAS GENTICOS
Las
distancias
genticos
son
porcentaje
de
en
los
mapas
medidas
en
recombinacin
Marcadores de ADN
Distancia en un
mapa gentico
Durante muchos aos, los genes podan detectarse slo observando su influencia en un
rasgo (fenotipo) y la construccin de mapas genticos estaba limitada por la disponibilidad de
rasgos de un locus individual que podran examinarse por la evidencia de la recombinacin. Al
final, esta limitacin se super con el desarrollo de tcnicas moleculares, como el anlisis de
polimorfismos de la longitud del fragmento de restriccin, la reaccin en cadena de la polimerasa
(PCR) y la secuenciacin de ADN, mejorando los mapas genticos.
Los mapas genticos tienen varias limitaciones, la primera es la baja resolucin o el detalle.
Segundo, no siempre se corresponden con precisin a las distancias fsicas entre los genes. Los
mapas genticos se basan en las frecuencias de entrecruzamiento o recombinacin, que varan
de un cromosoma a otro, de modo que las distancias de un mapa gentico son slo
aproximaciones de distancias fsicas reales a lo largo de un cromosoma. A pesar de estas
limitaciones, los mapas genticos han sido fundamentales para el desarrollo de los mapas fsicos y
la secuenciacin de genomas completos.
MAPAS CITOGENTICOS
Los
mapas
citogenticos
con
la secuencia
de
montaje del
o una lnea
roja slida
slida de
color
(circulo). Las
negro
lneas rojas
Con el avance de las tcnicas de bandeo cromosmico, la citogentica cuenta con una
herramienta de mayor precisin en la individualizacin de los cromosomas, facilitando su
agrupamiento y clasificacin morfolgica.
El estudio citogentico en animales domsticos se ha desarrollado rpidamente en los
ltimos aos. Hoy en da es utilizado como elemento de diagnstico que permiten detectar un
gran nmero de patologas. A su vez el bandeo cromosmico, ha permitido precisar la
localizacin de genes aportando informacin al mapa gentico. Por otro lado permiten realizar
estudios evolutivos de especies relacionadas entre s.
La construccin de los mapas citogenticos o cromosmicos se realizan utilizando tcnicas
que no incluyen la reproduccin sexual (meiosis) y, por lo tanto, asignan una localizacin segn las
regiones citogenticas (adems, estos mapas presentan la ventaja de no requerir del uso de
marcadores polimrficos). Esas tcnicas son:
Hibridacin in situ,
Hbridos de radiacin.
Hibridacin In Situ.
Cuando una secuencia de ADN, en este caso referida como una sonda de ADN (en
ingls, probe), es marcada con istopos radioactivos o fluorescencia, podemos hibridarla con su
secuencia complementaria en el ADN genmico de un cromosoma especfico y observar la
marca directamente sobre el extendido cromosmico con un microscopio ptico. Las clulas
deben estar fijas y los cromosomas esparcidos en un portaobjetos y expuestos a una solucin de
pH elevado para romper el apareamiento de bases y permitir el acceso a las sondas. La
hibridacin in situ fluorescente (FISH) es una tcnica muy sensible siempre que se cuente con
sondas lo suficientemente grandes (y homlogas) y que se suprima la fluorescencia de fondo. La
sensibilidad de esta variante de la tcnica de hibridacin in situ es que permite localizar una
secuencia con una precisin de hasta 30 Mb y de detectar anormalidades cariotpicas en
cromosomas metafsicos tanto como interfsicos. Los fluorocromos ms empleados son:
fluorescena (FITC), rodamina (XRITC) y Texas Red.
Por ltimo, el pintado de cromosomas (del ingls chromosome painting) es una variante del
FISH que emplea una mezcla de sondas de ADN derivada de un cromosoma entero o de una
regin cromosmica de inters. Se utiliza para obtener patrones de regiones homlogas entre
diferentes especies y es una forma muy directa de evaluar la cantidad de rearreglos que se
produjeron entre dos especies en el curso de la evolucin.
Fibroblasto humano
Clula tumoral
del ratn
Para
esta
tcnica
se
utilizan
Los fibroblastos
humanos y las clulas
tumorales de ratn se
mezclaron en presencia
de polietilenglicol
mamferos.
Aunque
se
Clula hbrida
con ncleos
fusionados
ejemplo,
los
hbridos
Figura 5. La hibridacin
de clulas somticas
puede utilizarse para
determinar cul es el
cromosoma
que
contiene el gen de
inters.
en
forma
preferencial)
los
hbridas que representen cada cromosoma humano en forma nica, sobre un conjunto de
cromosomas de roedor. Por lo tanto, todos los genes de origen roedor son retenidos (y se expresan
normalmente), mientras que slo los genes presentes en el nico cromosoma humano que qued
retenido en ese hbrido podrn ser localizados por medio del uso de sondas moleculares o el
anlisis de expresin. De esta manera, detectando patrones de presencia o ausencia de
marcadores (o expresin de genes) y correlacionando con los cromosomas presentes en el
hbrido, se puede asignar un gen humano a un cromosoma en particular. Los hbridos de clulas
somticas humano/ratn, con un complemento limitado de cromosomas humanos (intactos), han
sido muy usados para localizar genes humanos en los ltimos 20 aos, a pesar de ser muy
inestables.
Otra tcnica desarrollada para obtener mapas de alta resolucin son los paneles de
hbridos de radiacin (Radiation Hybrid RH), enfoque descripto por Goss y Harris en 1975. Las dos
grandes ventajas de este sistema son que pueden mapearse marcadores o genes no polimrficos
(se evala slo la presencia o ausencia de un marcador) y que se logra una resolucin mayor que
con los mapas de ligamiento, constituyendo un puente entre stos y los mapas fsicos. Estos
paneles de clulas hbridas se construyen a partir de clulas donantes (de la especie a ser
mapeada) que han sido irradiadas letalmente (ya sea con rayos g o X) para causar la
fragmentacin de sus cromosomas (por roturas de doble cadena). Las clulas as irradiadas son
fusionadas con lneas celulares receptoras deficientes para un marcador de seleccin, como ser
la timidina quinasa (TK) o la hipoxantina fosforibosil transferasa (HPRT). Usando condiciones de
seleccin con medios apropiados, sobrevivirn slo aquellas clulas que contengan, por lo menos,
algn fragmento cromosmico proveniente de las clulas dadoras.
El concepto terico es que aquellos loci que se encuentran muy prximos unos de otros
sern retenidos en el mismo fragmento cromosmico despus de la radiacin. Esta caracterstica
es similar al principio de ligamiento gentico que hemos visto en los mapas meiticos. Como en los
paneles de ADN obtenidos con cruzas de animales, la informacin de los paneles HR es
acumulativa y puede proveer datos para el ordenamiento (de alta resolucin) de regiones no
polimrficas o no separables por los mapas de ligamiento.
Figura 6. Hbridos de radiacin. Construccin de clones de hbridos de radiacin (HR) a partir de clulas
donantes con un nico cromosoma humano (hbrido mono-cromosmico) y clulas receptoras de hmster.
Cada clon (abajo) presenta una coleccin diferente (al azar) de fragmentos del cromosoma humano
original. Los 6 loci hipotticos (A a F) se marcan como + (presencia) o - (ausencia), dando una idea del
ordenamiento en el cromosoma original
Cuando se evala un marcador (por Southern blot, FISH o PCR), el patrn de presencia (+)
o ausencia () a travs del panel, define el emplazamiento del mismo: aquellos marcadores con el
mismo patrn de + y estarn localizados en el mismo bin o posicin. Estos estudios se conocen
como patrones de retencin de marcadores y nos ayudan a determinar la ubicacin de un gen
o marcador. En estos casos, la unidad para medir la distancia en el mapa es el Ray o el centiRay
(cR).
MAPAS FSICOS
Los mapas fsicos estn basados en el anlisis directo del ADN y ponen los genes respecto
a distancias medidas en el nmero de pares de bases, kilobases o megabases. Un tipo comn de
mapa fsico es el que conecta piezas aisladas de ADN genmico que fue clonado en bacterias o
levaduras. Una de las ventajas es que, por lo general, los mapas fsicos tienen resolucin mayor y
son ms exactos que los mapas genticos.
Clones de ADN
alineados
Figura
mapas
7.
fsicos
Los
a
menudo se utilizan
para ordenar los
fragmentos
de
ADN clonados.
Mapa gentico
Cromosoma
Mapa fsico
Secuencia de
ADN
Hay varias tcnicas para crear mapas fsicos, entre las que se incluyen el mapeo de
restriccin, que determina las posiciones de sitios de restriccin en el ADN; el mapeo del sitio de
secuencia especfica (sequence-tagged site, STS), que localiza las posiciones de secuencias
cortas nicas de ADN en un cromosoma; la hibridacin in situ fluorescente (fluorescent in situ
hybridization, FISH), por el cual pueden mapearse los marcadores visualmente en sus
localizaciones cromosmicas y la secuenciacin de ADN.
2. Otra tcnica es la Southern blot, sirve para transferir los fragmentos desnaturalizados
monocatenarios provenientes de un gel a un medio slido delgado. Estos fragmentos son cortados
por una o ms enzimas de restriccin. Se puede identificar que clones de una biblioteca
contienen una determinada secuencia de ADN y para caracterizar el tamao de los fragmentos.
Tambin se puede utilizar para determinar si un clon contiene todo un gen o solo parte de el.
Los fragmentos se separan por electroforesis en gel, lo que produce una serie de bandas.
Se tie el ADN en el gel con bromuro de etidio y se fotografa o escanea para determinar el
nmero y peso molecular de los fragmentos. El ADN se debe desnaturalizar en fragmentos de
cadena sencilla con un tratamiento alcalino. Se cubre el gel con una membrana de nitrocelulosa.
Los fragmentos de ADN del gel se transfieren a la membrana colocando la membrana y el gel
sobre un pabilo (esponja) sumergida parcialmente en una solucin tampn. Se colocan varias
capas de papel de celulosa secante. La accin capilar arrastra el tampn por el gel y de esta
manera se transfieren los fragmentos de ADN del gel al filtro de nitrocelulosa. Despus de la
transferencia al gel se coloca en una solucin de hibridacin de una sonda marcada en forma
radiactiva o qumica. La sonda se unir a todos los fragmentos de ADN en la membrana que
posee secuencias complementarias. Luego se lava la membrana para sacar la sonda no unida y
la sonda unida se detecta por autorradiografa u otro mtodo para sondas marcadas.
10
transferir
los
fragmentos
desnaturalizados monocatenarios
provenientes de un gel a un
medio slido delgado.
7. Mutagnesis
Una manera muy eficaz para estudiar los genes es provocar mutagnesis y estudiar los efectos
en el organismo.
11
8. Animales transgnicos
En ratones y otros mamferos el ovocito es lo
suficientemente grande como para inyectar el ADN
de manera directa. En el estado de dos proncleos
antes de la fecundacin. Antes de la fecundacin se
puede inyectar el ADN en uno de ellos y as unas
copias de ADN son inyectadas y se integran al azar
mediante un proceso denominado recombinacin
no homloga. Los embriones se implantan luego en
una hembra seudopreada, madre sustituta.
Figura 10. Knock-out. Dentro del ratn la copia normal del gen
puede intercambiarse con la desactivada a travs de la
recombinacin.
12
una solucin que incluye el ADN blanco (ADN por ser amplificado),
la ADN polimerasa,
los cebadores que son complementarios a las secuencias cortas en cada cadena
de ADN blanco
los iones magnesio y otras sustancias que son necesarias para que se produzca la
reaccin.
Paso 1: una solucin de ADN se calienta entre 90C y 100C para romper los puentes de
hidrgeno entre las dos cadenas de nucletidos y producir as los moldes monocatenarios
necesarios. La mezcla de la reaccin se mantiene a esta temperatura durante slo uno o
dos minutos.
Paso 2: la solucin de ADN se enfra con rapidez a una temperatura entre 30C y 65C y se
mantiene as durante un minuto o menos. Los cebadores se adhieren a sus secuencias
complementarias en las cadenas molde.
Paso 3: la solucin se calienta entre 60C y 70C, temperatura a la cual la ADN polimerasa
puede sintetizar cadenas nuevas de ADN mediante el agregado de nucletidos a los
cebadores. En el transcurso de unos pocos minutos se producen dos molculas nuevas de
ADN bicatenario por cada molcula original de ADN.
Luego se repite cada ciclo completo. Con cada ciclo, la cantidad de ADN se duplica; de
modo que ste aumenta en forma geomtrica. Una molcula de ADN aumenta a ms de 10.000
13
14
SECUENCIACION
caracterizado
hasta
que
se
conoce
su
15
Figura
12.
Mtodo
qumico
de
Maxam y Gilbert.
en
el
mtodo
de
Maxam-Gilbert,
su
caracterstica
didesoxinucletidos
particular
es
el
trifosfato
(ddNTPs)
uso
de
como
cadena no puede continuar elongndose ya que la enzima ADN polimerasa necesita un extremo
3 OH para aadir el siguiente nucletido, y el ddNTP, marcado en forma radioactiva o qumica,
incorporado carece de este grupo hidroxilo. Al terminar la elongacin de la cadena, se producen
varios fragmentos de ADN de longitud variable, los cuales son desnaturalizados por calor y
separados por tamao (con una resolucin de un solo nucletido) mediante electroforesis en gel
16
de poliacrilamida - urea. Cada una de las cuatro reacciones de sntesis se corre en calles
individuales (A, T, G y C) y se visualizan las bandas de ADN mediante autorradiografa o luz
ultravioleta. Las bandas obtenidas en el gel corresponden a los fragmentos de ADN de diferentes
longitudes
ADN
monocatenario que
debe ser
secuenciado
Figura
13.
didesoxi
de
El
de
ADN
se
mtodo
Los cuatro
ddNTP
de
secuenciacin
basa
en
Autorradiograma de
la electroforesis en
gel
la
terminacin de la sntesis de
ADN.
Secuencia de la cadena
obtenida complementaria
Secuencia de la cadena
molde original
Una banda en una calle indica un fragmento de ADN que es el resultado de una
terminacin de la cadena tras la incorporacin de un didesoxinucletido (ddATP, ddGTP, ddCTP o
ddTTP). El nucletido terminal puede ser identificado de acuerdo al didesoxinucletido que se
aadi en la reaccin que dio lugar a esa banda. Las posiciones relativas entre las cuatro calles
se utilizan entonces para leer la secuencia de ADN.
17
Durante muchos aos, la secuenciacin del ADN se realiz sobre todo en forma manual y
era una tcnica laboriosa y costosa. En la actualidad, la secuenciacin se lleva a cabo mediante
aparatos automatizados que utilizan colorantes fluorescente y escneres de lser para los miles de
secuencias de pares de bases en unas pocas horas.
Figura 14. Esquema de la secuenciacin por el mtodo automtico de electroforesis capilar con la secuencia
obtenida.
Los ddNTP utilizados en la reaccin automatizada se marcan cada uno con un colorante
fluorescente distinto. Las cuatro reacciones pueden tener lugar en el mismo tubo de ensayo y
pueden colocarse en el mismo pocillo durante la electroforesis, dado que cada dNTP se marca en
forma distintiva. Los aparatos de secuenciacin recin desarrollados llevan a cabo la electroforesis
en tubos capilares que contienen gel. Los fragmentos de diferentes tamaos producidos por la
reaccin de secuenciacin se separan dentro de un tubo y al migrar pasan por delante de un haz
de lser y un detector.
Cuando los fragmentos pasan por el lser, sus colorantes fluorescentes se activan y la
fluorescencia resultante se detecta por un escner ptico. Cada colorante emite fluorescencia de
una longitud de onda caracterstica que se lee en el escner ptico. Para la interpretacin, la
informacin ingresa en una computadora y los resultados se imprimen como un conjunto de picos
18
en un grfico (Fig. 14). Los aparatos de secuenciacin automatizados pueden contener 96 tubos
capilares o ms, lo que permite leer secuencias de 50.000 a 60.000 pb en unas pocas horas.
desnaturalizantes.
19
El tiempo necesario del proceso es, para la polimerizacin del mismo, unas dos horas y
para la preelectroforesis, una hora aproximadamente.
20
Corte de ADN
con enzima de
restriccin
inters.
21
extremos
romos
Los
vectores
transfieren
y replican
fragmentos
de ADN que llevan insertados. Para que sirva de vector, una molcula debe ser capaz de
replicarse junto con el fragmento de ADN que transporta. Tambin tiene que tener secuencias de
reconocimiento que permitan la insercin del fragmento de ADN a clonar.
Para insertar un fragmento de ADN al vector, se utiliza una enzima de restriccin, y se
mezcla con fragmentos de ADN producidos con la misma enzima.
Los
vectores
que
transportan
un
fragmento
insertado
se
denominan
vectores
recombinantes.
Hay muchos vectores de clonacin, que es una molcula de ADN replicante y estable a la
cual puede adherirse un fragmento de ADN extrao para la introduccin en una clula. Difieren
en la especificidad de la clula husped, el tamao de los insertos que pueden transportar y en el
nmero de copias que producen y el nmero y tipo de genes marcadores que contienen.
Tipos de Vectores:
Vectores procariotas:
1. Plsmidos: (ADN epismico). Para secuencias cortas de 10.000 bases (10 Kb). Son circulares y
existen naturalmente en las bacterias. Contienen orgenes de replicacin y pueden por eso
replicarse independientemente del cromosoma bacteriano.
Figura 19. pUC19 vector plsmido tpico de clonacin.
donde
se
crean
extremos
cohesivos
22
extremos romos. Primero, se corta el plsmido y el ADN extrao con una enzima de restriccin. Si la
enzima de restriccin produce extremos cohesivos, estos se eliminan por una enzima que digiere el
ADN monocatenario. De manera alternativa el plsmido y el ADN extrao pueden cortarse por
una enzima de restriccin que produce extremos romos. Una vez que el plsmido y el ADN extrao
tienen extremos romos, los extremos cohesivos monocatenarios son agregados por una enzima
transferasa terminal.
Un tercer mtodo de insercin de fragmentos consiste en utilizar la enzima ligasa T4, capaz
de conectar dos piezas cualquiera de extremos romos de ADN y se denomina clonacin
mediante el uso de conectores.
Una vez insertado el plsmido debe introducirse en las clulas bacterianas. Esta tarea suele
cumplirse mediante la transformacin y que es la capacidad de las bacterias de captar el ADN
del ambiente externo. Muchas veces la transformacin es un proceso natural, y otros deben
tratarse en forma qumica o fsica previamente. Los plsmidos dentro de la clula se replican y
multiplican.
2. Bacterifagos: (gran capacidad para invadir bacterias, se utiliza para ADN complementario y
genmico). Ofrecen ciertas ventajas y el ms comn es el bacterifago que infecta E. Coli. Una
de sus ventajas es la elevada eficiencia para transferir el ADN a las bacterias. Una segunda
ventaja es que cerca de la tercera parte del genoma no es esencial para la infeccin ni para la
reproduccin. Estos genes no esenciales que comprenden alrededor de 15 Kb pueden ser
reemplazados por hasta 23 Kb de ADN extrao. El ADN extrao cortado con EcoRI tendr
extremos cohesivos que son complementarios con los de los extremos de los genes esenciales, a
los cuales puede conectarse mediante la ligasa. El cromosoma posee extremos monocatenarios
cortos denominados sitios cos, necesarios para empaquetar en ADN dentro de la cabeza de un
fago. Los cromosomas del fago recombinante pueden entonces empaquetarse en la cubierta
proteica y agregarse a E. coli. Los fagos inyectan su ADN recombinante dentro de la clula,
donde se replicar. Slo los fragmentos de ADN de tamao adecuado y que contienen genes
esenciales se empaquetarn en las cubiertas del fago.
3. Csmidos: Los csmicos combinan las propiedades de los vectores plsmidos y los fagos. Los
fragmentos de ADN grandes de 44 Kb pueden clonarse en csmicos.
Los csmicos son plsmidos pequeos que contienen los sitios cos del fago ; pueden
empaquetarse con las cubiertas virales y transferirse a las bacterias por infeccin viral. Dado que
se pierden todos los sitios virales menos los sitios cos, un csmico puede tener ms del doble del
ADN extrao que puede transportar el fago vector.
23
El ADN extrao es insertado en los csmicos del mismo modo que se introduce en los plsmidos.
expresin;
ejemplo
un
en
vector
este
de
expresin E. coli.
Vectores eucariotas:
24
2. BAC: Cromosoma artificial de bacterias. Se utilizan para clonar segmentos grandes desde 100
a 500 Kb (100.000 bases a 500.000 bases).
El ADN clonado en los BACs es por lo general ms pequeo que los YACs. Sin embargo, los
BACs ofrecen ventajas importantes como por ejemplo, son ms manipulables para ciertos tipos de
25
estudios en el laboratorio. Los BACs se usan a gran escala para construir mapas fsicos de alta
resolucin de los cromosomas, con el fin de establecer la secuencia completa del genoma.
biblioteca
genmica
es
un
bibliotecas
genmicas
una
fuente
se
denomina
genoteca
biblioteca
genmica.
Para crear una genoteca genmica se recolectan
se
con enzimas de restriccin y debido a que los sitios de corte son al azar las molculas de ADN se
cortan en lugares diferentes y se producirn fragmentos superpuestos. Estos se unen a vectores
que pueden transferirse a las bacterias. Esta tcnica produce un conjunto de clulas bacterianas
o bacterifagos que contienen los fragmentos genmicos superpuestos. Una genoteca puede
contener un nmero importante de clones para garantizar que todas las secuencias de ADN estn
representadas.
El mtodo de Hierarchical Shotgun Sequencing fue propuesto por James Watson y Francis
Collins, entre otros, contando con la mayor parte de la financiacin pblica.
Esta metodologa resulta la ms compleja, con un conocimiento ms exhaustivo del
genoma. Bsicamente consiste en secuenciar el genoma completo, cromosoma a cromosoma de
26
un extremo al otro. Se hacen 2 o 3 fragmentos del ADN (fragmentos cortos de 2 Kb, fragmentos de
15-20 Kb y tambin se pueden hacer fragmentos de 200-300 Kb).
Luego se construye una biblioteca genmica con cada preparacin con la utilizacin de
vectores BAC. Se seleccionan y secuencian clones al azar de estas bibliotecas. Luego se utiliza un
programa para ensamblar y superponer largos tramos de secuencia a partir de los fragmentos
cortos, usando las secuencias de los clones ms largos como marco de referencia.
27
28
Figura 25. Evolucin de las tecnologas de alto rendimiento. ABI-3730 de Applied Biosystems, posiblemente el
ms utilizado en la secuenciacin del genoma Humano, con una capacidad de 1 Mb por da (Un milln de
bases). El AB-SOLID actual, en menos de 10 aos ha multiplicado por 1000 la capacidad de secuenciacin.
29
Figura 26. Emulsin de PCR. Una molcula de ADN por perla. La amplificacin clonal de miles de copias se
produce en microrreactores en una emulsin.
30
Figura 27. Amplificacin en fase slida. Una molcula de ADN por Cluster.
Secuenciacin paralelizada
Una vez que las secuencias clonales de ADN se localizan fsicamente en posiciones
separadas de la superficie, se pueden utilizar varios mtodos de secuenciacin para determinar
las secuencias de ADN de todas las localizaciones en paralelo.
31
La
Pirosecuenciacin
(utilizada
por
ADN
para
aadir
nucletidos,
32
reservorio de todos los oligonucletidos posibles de una longitud dada, marcados de acuerdo con
la posicin secuenciada. Los oligonucletidos se templan y ligan; el ligamiento preferente de las
ADN ligasas por su secuencia especfica produce una seal correspondiente a la secuencia
complementaria en esa posicin concreta. Shendure et al., usaron este mtodo para secuenciar
el genoma de E. coli MG1655.
33
Genoma de enriquecimiento
A pesar de las reducciones de costes sustanciales asociados con tecnologas NGS (Next
Generation Sequencing) en comparacin con el mtodo automatizado de Sanger, la
secuenciacin del genoma completo es todava un esfuerzo costoso. Una solucin provisional a
este problema puede ser el uso de plataformas de NGS para apuntar a regiones de inters
especficas. Esta estrategia se puede utilizar para examinar todos los exones en el genoma, genes
especficos de las familias que constituyen dianas farmacolgicas conocidas o las regiones que
estn implicados en enfermedades o en efectos farmacogenticos.
34
Genomas individuales
Los estudios del genoma humano tienen por objeto un catlogo de SNVS (variante de un
simple nucletido) y la SVS (variantes estructurales) y su asociacin a diferencias fenotpica, con el
objetivo final de personalizar la genmica con fines mdicos. En 2004, el Consorcio Internacional
de Secuenciacin del Genoma Humano public la primera, y todava nica, referencia terminada
del genoma humano (actualmente Centro Nacional de Biotecnologa de la Informacin: NCBI). Su
costo fue estimado en US $300 millones.
La genmica individual tambin est siendo aplicada al estudio de la enfermedad. Por
ejemplo, Mardis et al., reportaron la secuencia de dos genomas del cncer de leucemia mieloide
agudo mediante la plataforma Illumina/Solexa, y ambos estudios, identificaron mutaciones
somticas que pueden ser asociada con la enfermedad. Gibbs et al., describieron recientemente
35
la elucidacin de las dos variantes allicas en una familia con una forma recesiva de la
enfermedad de Charcot-Marie-Tooth utilizando la plataforma Life/APG.
Varios proyectos destinados a la secuenciacin de ms individuos, incluyendo el Atlas del
genoma del cncer y El proyecto de 1000 Genomas, tambin estn utilizando las plataformas
Illumina/Solexa y Life/454 para secuenciar genomas enteros.
En comparacin con la secuenciacin automatizada de Sanger, las plataformas de NGS
han aumentado dramticamente el rendimiento y redujo sustancialmente los gastos, con varios
grupos presentando informes de costos de reactivos por debajo de $100.000. Sin embargo, existe
una gran variabilidad entre y dentro de plataformas NGS en trminos de tamao del molde y
construccin, largo de lectura, rendimiento y la base y la cobertura del genoma, y dicha
variabilidad hace que sea difcil evaluar la calidad (es decir, la precisin de la cobertura del
genoma y continuidad del genoma) de los genomas basado en consideraciones de costo.
En junio de 2009, Illumina anunci la secuenciacin del genoma individual por el precio de
US$ 48.000. Complete Genomics ofrece un servicio similar a un precio de US$ 5.000. Sin embargo, el
logro del ahorro de los costos tambin puede venir con una disminucin de la calidad de la
informacin.
Las tecnologas de NGS tienen una impresionante gama de aplicaciones, y actualmente se
estn desarrollando an ms. Adems de las aplicaciones descritas anteriormente, las tecnologas
de NGS estn siendo utilizadas para caracterizar las relaciones evolutivas de genomas antiguos y
para dilucidar el papel de secuencias no codificantes en la salud y enfermedades. En un futuro no
muy lejano, es previsible que las tecnologas de NGS pudieran ser utilizadas para obtener datos de
alta calidad a partir de la secuencia un genoma aislado de una sola clula, lo que sera un
avance importante, sobre todo para la genmica del cncer. Para que esto ocurra, sern
necesarios avances en las tcnicas, para aislar eficazmente largas molculas de ADN intactas, y
en los mtodos, para la lectura precisa de la secuencia. El campo del desarrollo de NGS y las
aplicaciones es un rea de rpido movimiento de la investigacin, que hace de este un momento
emocionante para los estudios genmicos.
36
Adems de proporcionar informacin valiosa sobre los genes la Tecnologa del ADN
recombnate tiene numerosas aplicaciones como la elaboracin de productos farmacuticos
(insulina), y otras sustancias, bacterias especializadas (como produccin de etanol a partir de
plantas), plantas y animales de granja diseados por ingeniera gentica y para corregir defectos
genticos humanos. Algunos frmacos oligonucletidos (secuencias cortas de ADN sinttico o de
ARN pueden utilizarse para tratar enfermedades (terapia gnica). Los oligonucletidos antisentido
son complementarios a los ARN no deseados, como el ARN viral. Cuando se agrega a una clula,
estos ADN antisentido se unen al ARNm viral e inhiben su traduccin. Varios frmacos han sido
probados para diferentes tratamientos para el cncer.
Tambin ha permitido el desarrollo de sondas para detectar mutaciones causantes de
enfermedades.
Se
dispone
de
la
comprobacin
prenatal
enfermedades genticas. Para muchas enfermedades genticas las nicas pruebas diagnsticas
disponibles son las que identifican una mutacin predisponerte en el ADN, pero muchas
enfermedades genticas son provocadas por varias mutaciones diferentes y derivar en resultados
pueden ser falsos Salvo la completa secuenciacin del gen que es costosa no hay manera de
identificar a todos los individuos predispuestos.
En la terapia gnica deban primero localizarse los genes causantes de enfermedades y
desarrollarse vectores. Un mtodo de terapia consiste extraer clulas del cuerpo agregar los virus
con los genes recombinantes e reintroducir las clulas en el cuerpo del paciente. En este caso los
vectores se introducen directamente.
Figura 32. Evolucin de proyectos y publicaciones
37
Identificar los genes encontrando las pautas de lectura abiertas (ORF: Open Reading
Frames). Empiezan con una secuencia de iniciacin: ATG y terminan con una secuencia
de terminacin: TAA, TAG o TGA.
Traducir la secuencia de ADN en una secuencia proteica y compararla con otras protenas
conocidas.
El objetivo final del anlisis de la secuencia es obtener una descripcin funcional completa
de todos los genes del genoma de un organismo.
38
GENMICA FUNCIONAL
La Genmica Funcional clasifica los genes de las secuencias dilucidadas por la Genmica
Estructural e identifica sus funciones.
Algunos genes pueden tener funciones previamente asignadas mediante los mtodos
clsicos de mutagnesis y de cartografa de ligamiento; pero muchos genes no tienen an una
funcin asignada.
La genmica funcional es el estudio simultneo de todos los genes involucrados en un
estado fisiolgico determinado o en un tejido en particular.
Permite comprender la organizacin y los mecanismos genticos que en conjunto hacen a
la fisiologa de un organismo.
La secuencia de nucletidos de un gen puede utilizarse para predecir la secuencia de
aminocidos de la protena que codifica. Entonces, la protena puede sintetizarse o aislarse y
estudiarse sus propiedades para determinar su funcin. Sin embargo, este enfoque bioqumico
para la comprensin de la funcin gnica insume tiempo y es costoso. Un objetivo fundamental
de la genmica funcional fue desarrollar mtodos informticos que permitan identificar la funcin
gnica a partir de la secuencia de ADN sola, evitando el proceso laborioso de aislar y caracterizar
las protenas individuales.
Despus de obtener una secuencia genmica, la siguiente tarea es asignar funciones a los
genes de la secuencia. Algunos genes pueden tener funciones previamente asignadas mediante
los mtodos clsicos de mutagnesis y de cartografa de ligamiento; pero muchos genes no
tienen una funcin bien dirigida asignada.
Una aproximacin para asignar funciones a estos genes es la utilizacin de bsqueda de
homologa. Este anlisis tiene diversos componentes: bsqueda en bases de datos como GenBank
para encontrar genes parecidos aislados en otros organismos, comparar la secuencia de un ORF
con la de un gen bien caracterizado de otro organismo, rastrear el ORF en busca de motivos
funcionales, regiones del ADN que codifican dominios proteicos como canales de iones, regiones
de unin a ADN o seales de secrecin/exportacin.
39
Northern Blot
PCR cuantitativa
Hibridacin substractiva
Differential display
SAGE
Northern Blot
posteriormente
nylon.
Despus
de
la
marcada
para
40
Al igual que la PCR convencional, se utiliza un molde de ADN, cebadores especficos, dNTP
y una ADN polimerasa; a esto se le adiciona una sustancia marcada con fluorforo.
convencional,
los
Sensibilidad
Especificidad
Resultados Cuantitativos
Mtodo de deteccin
Fluorescencia
Rango de deteccin
Tiempo de reaccin
Amplio rango
1 hs
Pasos Post-PCR
No
Contaminacin
No
PCR
Baja
Baja
No
Electroforesis en gel de
agarosa
Pequeo rango
3-5 hs
Electroforesis en gel de
agarosa
Si
41
siguiendo
un
patrn
ordenado,
es
decir,
una
ordenacin.
menudo
estas
microordenaciones son producidas por mquinas automticas que ponen gotas microscpicas
de muestras especficas de ADN en posiciones especficas del chip. Las muestras de ADN que se
pueden aplicar pueden ser cualquier tipo de ADN clonado, pero a menudo son oligonucletidos
cortos sintetizados in vitro.
En un microarreglo de ADN se pueden aplicar ms de 30.000 muestras diferentes, lo que
representa miles de genes distintos. Tericamente, todos los genes del genoma de un organismo
pueden estar presentes en un microarreglo, lo que permite el anlisis de la expresin gentica de
todo el genoma.
Los microarreglos de ADN se pueden usar para comparar los patrones de expresin
gentica en dos o ms tejidos diferentes, en un mismo tejido en dos momentos diferentes del
desarrollo, o en clulas normales respecto de enfermas.
42
1. Se construye o compra un
microarray o chip, que contiene el
ADN de cadena simple que
representa
miles
de
genes
diferentes.
2. Se obtienen dos muestras de
clulas, luego de aplicar la droga a
una muestra y se recogen las
molculas de ARNm.
43
aprovechando la caracterstica del ARNm de tener una cola de adeninas en el extremo 3 (poli
A), se utiliza un soporte con colas de timinas para provocar la unin de los ARNm al soporte. Estas
timinas cumplen la funcin de primers para poder sintetizar ADNc a partir del ARNm por medio de
una transcriptasa inversa. Se corta el ADNc a una distancia determinada a partir del soporte de
timinas por medio de una enzima de restriccin, dejando extremos adhesivos en el sitio de corte.
En el extremo adhesivo se une una molcula llamada linker que posee una enzima de
restriccin tipo II que corta nuevamente el ADNc, esta vez dejando un extremo romo. Aqu se
obtiene por primera vez un tag de ADN (ARNm), unido a las secuencias que han permitido
hibridaciones. Dos tag para formar un ditag, es decir, dos tags junto a dos molculas linkers.
Posteriormente se procede a amplificar por PCR para obtener mayor cantidad de ditags y
favorecer la secuenciacin.
Los ditags se cortan con la primer enzima de restriccin para eliminar los linkers y dejar a los
ditags puros y con un extremo adhesivo, permitiendo la unin de estos a una gran hebra de ADNc
(ditags) o concatenado de ADNc. ste concatenado se pasa luego a un vector de clonamiento
para obtener mltiples copias. Por ltimo se procede a secuenciar este concatenado de ditags,
identificando cuantos tags hay en total de cada ARNm, y se procede a identificar qu protena
codifican, mediante el uso de una base de datos.
Figura 38. SAGE. Luego de la obtencin de los ditaq se realiza clonado, secuenciacin y anlisis
bioinformtico.
44
Figura 39. Comparacin de las secuencias de los Tag con bases de datos especficas como SAGE Genie
donde ya se encuentran mapeados los tags con sus respectivos genes y permite la identificacin y
caracterizacin de los transcriptos
ARN-Seq
45
46
GENMICA COMPARATIVA
duplicacin
de
un
nico
gen
se
denominan parlogas.
Definir
el
nmero mnimo de
mtodos
experimentales.
comparativos
La
aproximacin
47
por organismos alejados sean esenciales para la vida. Comparando los conjuntos de genes
compartidos por organismos diferentes sera posible catalogar los compartidos y desarrollar una
lista de genes que se consideraran indispensables para la vida.
Los genes ortlogos son aquellos que descienden de un gen ancestral comn que tienen la
misma funcin en diferentes especies. As por ejemplo Mycoplasma genitalium comparte 240
genes ortlogos con Haemophilus influenzae adems se identificaron 16 genes cuyas secuencias
son diferentes pero realizan la misma funcin. Mycoplasma genitalium tiene un genoma con 480
genes que codifican protena, lo que representa el genoma bacteriano mas pequeo de entre los
casi 150 genomas secuenciados hasta la fecha.
Los genes que pertenecen a familias multignicas comparten secuencias de ADN similares
pero no idnticas como resultado de una mutacin en linaje con un nico gen ancestral. Sus
productos a menudo son diferentes con funciones parecidas pero sus genes no siempre se
encuentran en una misma localizacin del cromosoma.
Las familias multignicas permiten aportan conocimientos sobre la evolucin del genoma.
Las protenas que surgen a partir de la duplicacin de un nico gen se denominan parlogas. La
familia de la globina es un ejemplo de familia multignica parloga que surgi por duplicacin y
dispersin a diferentes sitios cromosmicos.
Las familias multignicas estn presentes en muchos genomas. Adems de las amplias y
grandes mutaciones de los genes pequeos bloques de genes pueden duplicarse mediante
diversos mecanismos. La filogenia molecular ha trazado el linaje y las relaciones entre los miembros
de las familias gnicas. Uno de los ejemplos mejor estudiados de divergencia es la superfamilia
gnica de las globinas. En esta familia hace 800 aos se produjo la duplicacin de un gen
ancestral que codificaba a una protena de transporte de oxgeno. De los dos genes generados,
uno evolucion hasta la mioglobina actual y el otro en el gen de la globina ancestral el que se
duplic y form los prototipos de las subfamilias gnicas de la y globina. Otros patrones se
observan en otras familias gnicas las que son intensamente estudiadas en el genoma humano.
Como se observa en la figura 42, en la regin media del cromosoma 6 bovino (BTA6) se
han mapeado diferentes QTL asociados a rasgos fenotpicos como produccin de leche,
conformacin y rasgos funcionales en animales de tambo y composicin corporal y crecimiento
en animales de cra. En BTA6, la proporcin de los genes de la especie bovina que se han
asignado es relativamente pequea y se distribuye de manera desigual. Estudios comparativos del
mapeo cromosmico de alta resolucin combinados con la informacin de las secuencias
nucleotdicas pueden ser utilizado para detectar la posicin y funcin, dentro de regiones del
cromosoma, de genes candidatos polimrficos que afectan variables fenotpicas de importancia
econmica y fisiolgica en bovinos. La alineacin comparativa de las secuencias de los
cromosomas ortlogos humanos, de ratn, de gallina y de perro con la secuencia bovina permiti
enriquecer mapas previos del cromosoma BTA6 determinando loci nuevos. Utilizando el anlisis de
RH, incluyeron un total de 63 nuevos genes y EST con precisin en relacin con la posicin de los
48
loci conocidos, por lo tanto, aumentaron la densidad de los genes y ESTs integrados en el mapa
de BTA6.
Figura 42. Mapeo comparativo entre cromosomas de pollo, bovino, humano, ratn y perro.
49
LA PROTEMICA
Esta rama se ocupa de Identificar y analizar las protenas de una clula. El Proteoma define
el conjunto completo de protenas codificadas por un genoma.
En la mayora de los genomas secuenciados se desconoce la funcin de muchos de los
genes recin descubiertos. Muchas veces se le asigna una funcin por su homologa con genes
conocidos. En E coli y S cerevisiae se desconoce la mayor parte de la funcin de los genes
codificados al igual que en humanos.
A medida que se dispone de ms datos de las secuencias de los eucariotas se hace
evidente que su complejidad no esta necesariamente correlacionada con la cantidad de genes.
Por ejemplo Drosophila tiene menos genes que C. elegans pero no es menos complejo que el
nemtodo. La relacin entre gen y producto gnico es compleja. Los genes pueden tener sitios
mltiples de inicio de la transcripcin que produce varios transcriptos distintos. El corte y empalme
alternativo y la edicin de las molculas generan docenas de protenas diferentes a partir de un
nico gen. En humanos se estima que el 40 60% producen ms de una protena por ese motivo.
El anlisis de la funcin proteica se ve dificultado por el hecho de que muchas protenas trabajan
va interacciones protena protena o como parte integrante de un gran complejo molecular.
La protemica se utiliza para reconciliar las diferencias entre el nmero de genes de un
genoma y el nmero de protenas (producto final) observadas en la clula. Proporciona
informacin sobre la funcin de las protenas, su estructura, las modificaciones posttraduccionales, las interacciones protenicas sus variantes y las relaciones con otras protenas del
genoma.
La protemica utiliza tcnicas para separar e identificar las protenas aisladas. La
combinacin de tcnicas implica un gel de electroforesis bidimensional (2DGE) y espectrometra
de masas. En la primera las protenas extradas de una clula se cargan en un gel de
poliacrilamida y se separa segn su carga elctrica. El gel se rota 90 y las protenas se separan
segn su peso molecular. Las modernas tcnicas de espectrometra de masas permiten
determinar con precisin la masa de molculas. Uno de estos mtodos se denomina ionizacin
por lser asistida por matriz (MALDI). Se pueden identificar cientos de protenas por da y los
bancos de espectrmetros pueden procesar cientos de muestras en un solo da. Nuevos
instrumentos se estn desarrollando para el procesado de muestras con ms rapidez, sensibilidad
y precisin.
50