You are on page 1of 10

La secuenciacin de genes y genomas

Parte I de este libro ha demostrado cmo una


clonacin realizada con habilidad o experimento de
PCR puede proporcionar una muestra pura de un gen
individual, o cualquier otra secuencia de ADN,
separados de todos los otros genes y secuencias de
ADN en la clula. Ahora podemos dirigir nuestra
atencin a las formas en que la clonacin, PCR, y
otras tcnicas de anlisis de ADN se utilizan para
estudiar genes y genomas. Vamos a considerar tres
aspectos de la investigacin de la biologa molecular:

Las tcnicas utilizadas para obtener la


secuencia de nucletidos de los genes
individuales y genomas enteros (este
captulo);
Los mtodos utilizados para estudiar la
expresin y funcin de genes individuales
(Captulo 11);
Las tcnicas que se utilizan para estudiar
genomas enteros (Captulo 12).

Probablemente la tcnica ms importante disponible


para el bilogo molecular es ADN la secuenciacin,
en la que el orden preciso de los nucletidos en una
pieza de ADN se puede determinar. Mtodos de
secuenciacin de ADN han sido de alrededor de 40
aos, y desde mediados de la dcada de 1970 rpida
y eficaz de secuenciacin ha sido posible.
Inicialmente se aplicaron estas tcnicas a los genes
individuales, pero desde principios de 1990 un
nmero cada vez mayor de la totalidad del genoma
se ha obtenido las secuencias. En este captulo
vamos a estudiar la metodologa utilizada en La
secuenciacin del ADN y luego examinar cmo se
utilizan estas tcnicas en los proyectos genoma.

10.1 La metodologa para la secuenciacin de


ADN
Existen varios procedimientos para la secuenciacin
del ADN, el ms popular de la terminacin de la
cadena mtodo ideado por primera vez por Fred
Sanger y sus colaboradores en la dcada de 1970.
Cadena La clonacin de genes y el anlisis de ADN:
una introduccin. 6 edicin. Por T. A. Marrn.
Publicado 2010 por Blackwell Publishing. 50
nucletidos 10 nucletidos secuenciacin de

terminacin ha ganado preeminencia por varias


razones, no menos importante es el facilidad relativa
con la que la tcnica se puede automatizar. Como
veremos ms adelante en este captulo, con el fin de
secuenciar un genoma entero de un gran nmero de
secuenciacin individuo experimentos deben
llevarse a cabo, y que tomara muchos aos para
llevar a cabo todos stos con la mano. Tcnicas de
secuenciacin automatizados son por lo tanto
esencial para que un genoma proyecto debe ser
completado en un lapso de tiempo razonable.
Parte de la estrategia de automatizacin es disear
sistemas que permiten a muchas persona
experimentos de secuenciacin se llevaron a cabo a
la vez. Con el mtodo de terminacin de la cadena,
hasta
96
secuencias
pueden
obtenerse
simultneamente en una sola ejecucin de una
secuenciacin mquina. Esto todava no es suficiente
para satisfacer plenamente las exigencias de la
secuenciacin del genoma, y durante los ltimos
aos
un
mtodo
alternativo
llamado
pirosecuenciacin se ha convertido popular.
Pirosecuenciacin, que fue inventado en 1998,
constituye la base de una masiva estrategia paralela
que permite a cientos de miles de secuencias cortas
que se genere al mismo tiempo.

10.1.1 Cadena de secuenciacin de ADN de


terminacin
Cadena de secuenciacin de ADN de terminacin se
basa en el principio de que el ADN de una sola hebra
molculas que difieren en longitud por slo un nico
nucletido se pueden separar de uno otro por
electroforesis en gel de poliacrilamida. Esto significa
que es posible resolver una familia de molculas, lo
que representa todas las longitudes de 10 a 1500
nucletidos, en una serie de bandas en un gel de
placa o capilar (Figura 10.1).

Secuenciacin de terminacin de cadena en


contorno
El material de partida para un experimento de
secuenciacin de terminacin de cadena es una
preparacin de molculas de ADN de una sola hebra
idntica. El primer paso es para hibridar un
oligonucletido corto a la misma posicin en cada

molcula, este oligonucletido posteriormente en


calidad del cebador para la sntesis de una nueva
cadena de ADN que es complementario a la plantilla
(Figura 10.2a).
La reaccin sntesis de la cadena, que es catalizada
por una enzima ADN polimerasa y requiere los cuatro
desoxirribonucletidos trifosfato (dNTPs-dATP,
dCTP, dGTP, y dTTP) como sustratos, continuara con
normalidad hasta varios miles de nucletidos tenan
sido polimerizado. Esto no ocurre en una cadena de
secuenciacin de terminacin se aade a los
didesoxinucletidos (ddNTPs experimento-ddATP,
ddCTP, ddGTP, y ddTTP) reaccin. Cada uno de estos
didesoxinucletidos est marcado con un marcador
fluorescente diferente.
La enzima polimerasa no discrimina entre desoxi y
didesoxinucletidos, pero una vez incorporado un
didesoxinucletido bloquea la elongacin adicional
porque carece del grupo hidroxilo en 3 'necesaria
para formar una conexin con el siguiente
nucletido (Figura 10.2b). Debido a que los
desoxinucletidos
normales
tambin estn
presentes, en cantidades mayores de los
didesoxinucletidos, la sntesis de la cadena no
siempre terminan cerca al cebador: de hecho, varios
cientos de nucletidos se pueden polimerizar antes
de una didesoxinucletido es finalmente
incorporada. El resultado es un conjunto de nuevas
molculas, toda de diferentes longitudes, y cada uno
termina en un didesoxinucletido cuya identidad
indica la nucletidos A, C, G, o T-que est presente
en la posicin equivalente en la plantilla ADN (Figura
10.2c).
Para averiguar la secuencia de ADN, todo lo que
tenemos
que
hacer
es
identificar
el
didesoxinucletido al final de cada molcula de
cadena terminada. Aqu es donde el gel de
poliacrilamida entra en juego. La mezcla se carga en
un pozo de un gel de poliacrilamida losa, o en un
tubo de un sistema de gel capilar y electroforesis
llevaron a cabo para separar las molculas de
acuerdo con sus longitudes. Despus de la
separacin, las molculas se ejecutan ms all de un
fluorescente detector capaz de discriminar las
etiquetas pegadas a los didesoxinucletidos (Figura
10.3a). Por consiguiente, el detector determina si
cada molcula termina en una A, C, G, o T. La

secuencia se puede imprimir para su examen por el


operador (Figura 10.3b), o introducido directamente
en un dispositivo de almacenamiento para el anlisis
futuro.

No todas las polimerasas de ADN se pueden


utilizar para la secuenciacin
Cualquier ADN polimerasa es capaz de extender un
cebador que se ha hibridado con una singlestranded
molcula de ADN, pero no todas las polimerasas se
pueden utilizar para la secuenciacin de ADN. Esta es
porque muchas ADN polimerasas tienen una
actividad enzimtica mixta, pudiendo degradar as
como sintetizar ADN (. p 48). La degradacin puede
ocurrir ya sea en el 5 ' 3' o 3 ' 5' (Figura 10.4), y
las dos actividades son perjudiciales para la cadena
precisa secuenciacin de terminacin. El 5 ' 3'
exonucleasa permite que la polimerasa eliminar los
nucletidos de los extremos 5 'de las hebras recin
sintetizadas, el cambio de la longitudes de estas
hebras de modo que ya no se ejecutan a travs del
gel de poliacrilamida en orden apropiado. El 3 ' 5'
actividad podra tener el mismo efecto, pero lo ms
importante eliminar un didesoxinucletido que
acaba de ser aadido en el extremo 3 ', la prevencin
de cadena terminacin que se produzcan.
En el mtodo original para la secuenciacin de
terminacin de la cadena, la polimerasa Klenow se
utiliz como la enzima secuenciacin. Como se
describe en la pg. 49, esta es una versin
modificada de la DNA polimerasa I de enzima a partir
de E. coli, la modificacin de retirar el 5 ' 3'
actividad de exonucleasa de la enzima estndar. Sin
embargo, la polimerasa Klenow tiene baja
procesividad, lo que significa que slo puede
sintetizar una cadena de ADN relativamente corto
antes disociarse del molde debido a causas
naturales. Esto limita la longitud de la secuencia que
se puede obtener a partir de un nico experimento a
aproximadamente 250 pb. Para evitar este
problema, ms secuenciacin hoy en da hace uso de
una enzima ms especializada, tal como Sequenase,
una versin modificada de la ADN polimerasa
codificada por el bacterifago T7. Sequenase tiene
alta capacidad de procesamiento y ninguna actividad
exonucleasa y por lo tanto es ideal para la

terminacin de cadena secuencias de secuenciacin,


lo que permite de hasta 750 pb que se obtengan en
un solo experimento.

Secuenciacin por terminacin de la cadena


requiere un molde de ADN monocatenario
La plantilla para un experimento de terminacin de
la cadena es una versin de cadena sencilla de la
molcula de ADN a ser secuenciado. Una manera de
obtener ADN de cadena sencilla es usar un vector
M13, pero el sistema de M13, aunque diseado
especficamente para proporcionar ADN para
secuenciacin de terminacin de la cadena, no es
ideal para este propsito. El problema es que clon
Los fragmentos de ADN que son ms de
aproximadamente 3 kb son inestables en un vector
M13 y puede someterse a deleciones y
reordenamientos. Esto significa que M13 clonacin
slo se puede utilizar con piezas cortas de ADN.
Los vectores de plsmidos, que no sufren problemas
de inestabilidad, son por lo tanto ms se necesita
populares, pero algunos medios de transformacin
del plsmido de doble cadena en una forma de
cadena sencilla. Hay dos posibilidades:

De ADN de plsmido de doble cadena se


puede convertir en DNA de cadena simple
por desnaturalizacin con lcali o por
ebullicin. Este es un mtodo comn para la
obtencin de ADN molde para la
secuenciacin
de
ADN,
pero
un
inconveniente es que puede ser difcil de
preparar ADN de plsmido que no est
contaminada con pequeas cantidades de
bacterias ADN y ARN, que puede actuar como
plantillas espurias o cebadores en el DNA
experimento de secuenciacin.
El ADN puede ser clonado en un fagmido, un
vector de plsmido que contiene un M13
origen de replicacin y que por lo tanto se
pueden obtener como tanto doble y
versiones de ADN monocatenario (p. 96). Los
fagmidos evitar las inestabilidades de M13
clonacin y se puede usar con fragmentos de
hasta 10 kb o ms.

La necesidad de DNA de cadena sencilla tambin se


puede eludi mediante el uso de un termoestable
ADN polimerasa como la enzima secuenciacin. Este
mtodo, llamado secuenciacin de ciclo trmico, se
lleva a cabo de una manera similar a la PCR, pero se
utiliza un solo cebador y la reaccin mezcla incluye
los cuatro didesoxinucletidos (Figura 10.5). Debido
a que slo hay un cebador, slo una de las cadenas
de la molcula de partida se copia, y el producto se
acumula de una forma lineal, no exponencial como
es el caso en una PCR real. La presencia de los
didesoxinucletidos en la mezcla de reaccin causa
la terminacin de la cadena, como en el metodologa
estndar, y la familia de hebras resultantes pueden
ser analizados y la secuencia de lectura de la forma
habitual. Por lo tanto, la secuenciacin de ciclo
trmico puede ser usada con ADN clonado en
cualquier tipo de vector.

El cebador determina la regin de la plantilla


de ADN que se secuenci
En la primera etapa de un experimento de
secuenciacin de terminacin de cadena, un
oligonucletido cebador se recuece en la plantilla de
ADN (vase la Figura 10.2a). La funcin principal de
la imprimacin es proporcionar a la regin corta de
doble cadena que se necesita para que el ADN
polimerasa para iniciar la sntesis de ADN. El cebador
tambin juega un papel crtico segunda en la
determinacin de la regin de la molcula de
plantilla que se secuenci. Para la mayora de los
experimentos de secuenciacin se utiliza un cebador
universal, este ser uno que es complementaria a la
parte del ADN del vector inmediatamente adyacente
al punto en que el nuevo ADN se liga (Figura 10.6a).
El extremo 3 'de los puntos de cebador hacia el
insertado ADN, por lo que la secuencia que se
obtiene se inicia con un corto tramo del vector y
luego progresa en el fragmento de ADN clonado. Si
el ADN se clona en un plsmido vector, entonces
ambos cebadores universales directos e inversos se
pueden utilizar, secuencias que permiten para ser
obtenido a partir de ambos extremos de la pieza de
insercin. Esto es una ventaja si el ADN clonado es
ms de 750 pares de bases y por lo tanto demasiado
tiempo para ser secuenciados completamente en un
solo experimento. Alternativamente, es posible
extender la secuencia en una direccin por la sntesis

de un no universal cebador, diseado para hibridarse


en una posicin dentro del inserto de ADN (Figura
10.6b). 170 Parte II Las aplicaciones de la clonacin
de genes y el anlisis de ADN en la investigacin Un
experimento con esta imprimacin proporcionar
una segunda secuencia corta que se superpone a la
el anterior.

10.1.2 La pirosecuenciacin
La pirosecuenciacin es el segundo tipo importante
de la metodologa de secuenciacin de ADN que es
en uso hoy en da. Pirosecuenciacin no requiere
electroforesis o cualquier otro fragmento
procedimiento de separacin y as es ms rpida que
la secuenciacin de terminacin de la cadena. Es solo
capaz de generar hasta 150 pb en un solo
experimento, y que a primera vista podra parecer a
ser menos til que el mtodo de terminacin de
cadena, especialmente si el objetivo es secuenciar un
genoma. La ventaja con la pirosecuenciacin es que
puede ser automatizado en de manera masivamente
paralelo que permite a cientos de miles de
secuencias para ser obtenido a la vez, quizs tanto
como 1.000 Mb en una nica prueba. Por lo tanto, la
secuencia es producida mucho ms rpidamente de
lo que es posible por el mtodo de terminacin de
cadena, que explica por qu pirosecuenciacin est
tomando gradualmente el control como el mtodo
de eleccin para proyectos genoma.

Pirosecuenciacin implica la deteccin de


impulsos de quimioluminiscencia
Pirosecuenciacin, como el mtodo de terminacin
de cadena, requiere una preparacin de idntica
molculas de ADN de cadena simple como el
material de partida. Estos se obtienen por medio de
lcali desnaturalizacin de los productos de PCR o,
ms
raramente,
molculas
de
plsmido
recombinante. Despus unin del cebador, la
plantilla se copia por una ADN polimerasa en un
sencillo manera sin didesoxinucletidos aadidos. A
medida que se realiza la nueva cadena, el orden en
que se incorporan los desoxinucletidos se detecta,
por lo que la secuencia de pueden ser "ledos" segn
avanza la reaccin.

La adicin de un desoxinucletido con el extremo de


la cadena creciente es detectable porque est
acompaado por la liberacin de una molcula de
pirofosfato, que se puede convertir por la enzima
sulfurilasa en un destello de quimioluminiscencia.
Por supuesto, si todo Se aadieron cuatro
desoxinucletidos a la vez, entonces se veran
destellos de luz toda la se obtendran tiempo y no
hay informacin de la secuencia de utilidad. Cada
desoxinucletido es por lo tanto, aadido por
separado, uno tras otro, con una enzima de
nucleotidasa tambin presente en la mezcla de
reaccin de modo que si un desoxinucletido no se
incorpora en el polinucletido entonces se degrada
rpidamente antes de que el siguiente se aade
(Figura 10.7). Este procedimiento hace posible seguir
el orden en el que se incorporan los
desoxinucletidos en la cadena creciente. La tcnica
parece complicado, pero simplemente requiere que
una serie repetitiva de adiciones hacerse que la
mezcla de reaccin, precisamente el tipo de
procedimiento que se puede automatizar
fcilmente.

Pirosecuenciacin masiva en paralelo


La versin de alto rendimiento de pirosecuenciacin
por lo general comienza con el ADN genmico, en
lugar de los productos de PCR o clones. El ADN se
rompe en fragmentos entre 300 y 500 pb de longitud
(Figura 10.8a), y cada fragmento se liga a un par de
adaptadores (P. 65), un adaptador a cada extremo
(Figura 10.8b). Estos adaptadores jugar dos
importantes roles. En primer lugar, permiten que los
fragmentos de ADN que debe atribuirse a pequeas
cuentas metlicas. Esta es porque uno de los
adaptadores tiene un marcador de biotina unido a su
extremo 5 ', y las perlas estn recubiertas con
estreptavidina, a la que la biotina se une con gran
afinidad (. p 137). ADN Por lo tanto, los fragmentos
se adhieren a las perlas a travs de enlaces de biotina
estreptavidina (Figura 10.8c). La relacin de
fragmentos de ADN a los granos se ajusta de manera
que, en promedio, slo un fragmento se une a cada
cuenta.
Cada fragmento de ADN A continuacin se amplific
mediante PCR de manera que se hacen suficientes
copias para la secuenciacin. Los adaptadores ahora
juegan su segundo papel, ya que proporcionan los

recocidos sitios de los cebadores para esta PCR. Por


consiguiente, el mismo par de cebadores puede ser
usado para todos los fragmentos, a pesar de que los
fragmentos de s mismos tienen muchas secuencias
diferentes. Si la PCR se realiza inmediatamente a
continuacin, todo lo que obtendremos es una
mezcla de todos los productos, que no nos permitan
obtener las secuencias individuales de cada uno. A
resolver este problema, la PCR se lleva a cabo en una
emulsin de aceite, cada perla que reside en su
propia gotita acuosa dentro de la emulsin (Figura
10.8d). Cada gota contiene toda la Los reactivos
necesarios para la PCR, y se separa fsicamente de
todas las otras gotitas de la barrera proporcionada
por el componente de aceite de la emulsin.
Despus de la PCR, las gotitas acuosas son
transferidas en pocillos en una tira de plstico por lo
que es uno de las gotitas y, por tanto, una vez PCR
producto por pocillo, y las reacciones de
pirosecuenciacin se llevan a cabo en cada pocillo.

10.2 Cmo secuenciar un genoma


La primera molcula de ADN que se secuenci
completamente el genoma era 5.386 nucletidos
dX174 de bacterifago, que se complet en 1975.
Esto fue seguido rpidamente por secuencias de
virus SV40 (5243 pb) en 1977 y pBR322 (4363 pb) en
1978. Poco a poco secuenciacin se aplica a
molculas ms grandes. El grupo del profesor Sanger
public el secuencia del genoma mitocondrial
humano (16,6 kb) en 1981 y de bacterifago e (49
kb) en 1982. Hoy en da las secuencias de 100-200 kb
son rutinarios y ms investigacin laboratorios tiene
la experiencia necesaria para generar esta cantidad
de informacin.
Los proyectos pioneros de hoy son las iniciativas del
genoma masivas, dirigidas a cada uno la obtencin
de la secuencia de nucletidos de la totalidad del
genoma de un organismo particular. Los primera
secuencia de cromosoma, para el cromosoma III de
la levadura Saccharomyces cerevisiae, fue publicado
en 1992, y todo el genoma de la levadura se
complet en 1996. Hay son ahora las secuencias del
genoma completo para el gusano Caenorhabditis
elegans, la mosca Drosophila melanogaster, la planta
Arabidopsis thaliana, los Homo sapiens humanos, y

ms de 1000 otras especies. Incluso es posible


obtener las secuencias del genoma de extinguirse
especies como mamuts y neandertales.
Un experimento de secuenciacin de terminacin de
cadena nica produce alrededor de 750 pb de
secuencia, y un solo rendimientos pyrosequence
hasta 150 pb. Sin embargo, el tamao total de un
bastante genoma bacteriano tpico es de 4.000.000
pb y el genoma humano es 3200000000 pb (Tabla
10.1). Es evidente que un gran nmero de
experimentos de secuenciacin debe llevarse a cabo
con el fin de determinar la secuencia de un genoma
completo. En la prctica, gracias a automatizados
sistemas, la generacin de suficiente secuencia de
datos es uno de los aspectos ms rutinarios de un
proyecto del genoma. El primer verdadero problema
que se plantea es la necesidad de montar los miles o
tal vez millones de secuencias individuales en una
secuencia del genoma contigua. Dos diferentes
estrategias se han desarrollado para la secuencia de
montaje (figura 10.9):

El enfoque de escopeta, en la que el genoma


se divide aleatoriamente en corto
fragmentos. Las secuencias resultantes se
examinan para solapamientos y estos se
utilizan para construir la secuencia del
genoma contigua.
El enfoque contig clon, lo que implica una
fase previa a la secuenciacin durante el cual
una se identifica serie de clones
superpuestos. Esta serie contigua se llama un
contig. Cada pieza de ADN clonado a
continuacin, se secuencia, y esta secuencia
coloca en su posicin adecuada en el mapa
de contig con el fin de aumentar
gradualmente la secuencia del genoma de
superposicin.

10.2.1 El enfoque de escopeta secuenciacin


del genoma
El requisito clave del enfoque de escopeta es que
debe ser posible identificar solapamientos entre
todas las secuencias individuales que se generan, y
esta identificacin proceso debe ser precisa e
inequvoca de modo que la secuencia del genoma es
correcta adquirido. Un error en la identificacin de

un par de secuencias superpuestas podra conducir a


la secuencia del genoma convertirse revueltos, o
piezas que se perdi por completo. La probabilidad
de cometer errores aumenta con el tamao del
genoma de mayor tamao, por lo que el enfoque de
escopeta ha sido utilizado principalmente con los
genomas de bacterias ms pequeas.

El proyecto de secuenciacin del genoma de


Haemophilus influenzae
El acercamiento de la escopeta se utiliz primero con
xito con la bacteria Haemophilus. influenzae, que
fue el primer organismo de vida libre cuyo genoma
fue secuenciado en su totalidad, cuyos resultados
fueron publicados en 1995. El primer paso consisti
en romper el kb 1830 genoma de la bacteria en
fragmentos cortos, lo que proporcionara las
plantillas de los experimentos de secuenciacin
(figura 10.10). Una endonucleasa de restriccin
podra haber sido utilizado, pero se eligi sonicacin
porque este ADN se escinde de la tcnica de una
manera ms aleatoria la moda y por tanto, reduce la
posibilidad de lagunas que aparecen en la secuencia
del genoma.
Se decidi concentrarse en fragmentos de 1,6-2,0 kb
ya que podran producir dos secuencias de ADN, uno
de cada extremo, lo que reduce la cantidad de
preparacin y clonacin de ADN que se requera. Por
consiguiente, el ADN sonicado se fraccion por
electroforesis en gel de agarosa y los fragmentos del
tamao deseado purificado a partir del gel. Despus
de la clonacin, 28,643 experimentos de
secuenciacin de terminacin de cadena se llevaron
a cabo con 19.687 de los clones. Algunas de estas
secuencias-4339 en todo fueron rechazadas debido
estaban a menos de 400 pb de longitud. Se
introducen las secuencias restantes 24,304 en un
ordenador, que pas 30 horas el anlisis de los datos.
El resultado fue 140 contigua secuencias, cada una
un segmento diferente del genoma de H. influenzae.
Podra haber sido posible continuar la secuenciacin
de los fragmentos ms sonicadas finalmente con el
fin de cerrar las brechas entre los segmentos
individuales. Sin embargo, 11631485 pb de la
secuencia ya ha sido generada y seis veces la longitud
de la genoma-lo que sugiere que sera necesaria una
gran cantidad de trabajo adicional antes de la
fragmentos correctos eran, por casualidad,

secuenciada. En esta etapa del proyecto el ms


timeeffective enfoque era utilizar una estrategia ms
dirigida con el fin de cerrar cada uno de los huecos
individualmente. Varios mtodos se han aplicado
para la reduccin de distancias, el ms exitoso de
estos que implica anlisis de hibridacin de una
biblioteca de clones preparado en un vector e (figura
10.11).
La biblioteca se sond a su vez con una serie de
oligonucletidos cuyas secuencias correspondencia
con los extremos de cada uno de los 140 segmentos.
En algunos casos, dos oligonucletidos hibridado con
el mismo clon de correo, lo que indica que los dos
extremos del segmento representado por aquellos
oligonucletidos yaca adyacentes entre s en el
genoma. Los brecha entre estos dos extremos podra
entonces ser cerrado mediante la secuenciacin de
la parte apropiada de el e clon.

Problemas con la secuenciacin escopeta


Secuenciacin shotgun ha tenido xito con muchos
genomas bacterianos. No slo son estos genomas
pequeos, por lo que los requisitos computacionales
para la bsqueda de coincidencias de secuencia no
son demasiado grandes, pero que contienen poco o
nada de secuencias repetitivas de ADN. Estos son
secuencias, desde unas pocas pares de bases hasta
varios kilobases, que se repiten en dos o ms lugares
en un genoma. Causan problemas para el
acercamiento de la escopeta porque cuando
secuencias se montan aquellos que se encuentran
parcial o totalmente dentro de un elemento de
repeticin podra accidentalmente ser asignado un
solapamiento con la secuencia idntica presente en
una diferente elemento de repeticin (Figura 10.12).
Esto podra conducir a una parte de la secuencia del
genoma siendo colocado en la posicin incorrecta o
dejado de lado por completo. Por esta razn, ha sido
generalmente pens que la secuenciacin escopeta
no es apropiado para los genomas eucariotas, ya que
estos tienen muchos elementos de repeticin. Ms
adelante en este captulo (p. 183), veremos cmo
esta limitacin puede eludirse mediante el uso de un
mapa del genoma de montaje de secuencias
obtenidas por el dirigir acercamiento de la escopeta.

10.2.2 El enfoque contig clon

El enfoque clon contig no sufre de las limitaciones de


secuenciacin escopeta y por lo que puede
proporcionar una secuencia precisa de un gran
genoma que contiene ADN repetitivo. Su desventaja
es que implica mucho ms trabajo y por lo que toma
tiempo y cuesta ms dinero. Se necesita tiempo y
esfuerzo adicional para construir la serie de
superposicin de fragmentos de ADN clonados. Una
vez que esto se ha hecho, cada fragmento clonado
se secuenci por el mtodo de escopeta y la
secuencia del genoma construy paso a paso (vase
la figura 10.9). Los fragmentos clonados deben ser
tan largo como sea posible con el fin de minimizar el
total de nmero necesario para cubrir la totalidad del
genoma. Por lo tanto, se utiliza un vector de alta
capacidad. La primera cromosoma eucariota para ser
III cromosoma secuenciado de Saccharomyces
cerevisiae - se clon inicialmente en un vector de
csmido (p 101). Con la contig resultante que
comprende 29 fragmentos clonados. El cromosoma
III es relativamente corto, sin embargo, y el el
tamao medio de los fragmentos clonados era slo
10,8 kb. La secuenciacin de la mucho ms largo
genoma humano requiere 300.000 clones de
cromosoma artificial bacteriano (BAC) (p. 103).
Montaje de todos estos objetivos en contigs
especficos del cromosoma era una tarea enorme.

Contig montaje clon de paseo cromosmico


Una tcnica que puede utilizarse para ensamblar un
contig clon es paseo cromosmico. A comenzar un
cromosoma caminar un clon se selecciona al azar de
la biblioteca, etiquetado, y se utiliza como una sonda
de hibridacin contra todos los dems clones en la
biblioteca (Figura 10.13a). Aquellos clones que dan
seales de hibridacin son aquellas que se
superponen con la sonda. Uno de estos clones
solapados ahora se etiqueta y una segunda ronda de
sondeo llevado a cabo. Ms seales de hibridacin se
ven, algunos de estos indican solapamientos
adicionales (Figura 10.13b). Poco a poco el contig
clon se construye de una manera paso a paso. Pero
esto es un proceso laborioso y slo se intenta cuando
el contig es por un corto del cromosoma y as implica
relativamente pocos clones, o cuando el objetivo es
cerrar una o ms pequea brechas entre contigs que
han sido construidas por mtodos ms rpidos.

Los mtodos rpidos para el montaje clon


contig
La debilidad de paseo cromosmico es que comienza
en un punto de partida fijo y se acumula el paso clon
contig a paso, y por lo tanto poco a poco, a partir de
ese punto fijo. Los ms tcnicas rpidas para el
montaje contig clon no utilizar un punto de partida
fijo y en lugar tratar de identificar pares de clones
que se superponen: cuando suficientes pares
superpuestos tienen han identificado el contig se
revela (Figura 10.14). Las diversas tcnicas que se
pueden Se utiliza para identificar las superposiciones
se conocen colectivamente como las huellas digitales
clon. fingerprinting Clone se basa en la identificacin
de caractersticas de secuencia que son compartidos
por un par de clones. El enfoque ms simple es
digerir cada clon con uno o ms endonucleasas de
restriccin y para buscar pares de clones que
comparten fragmentos de restriccin del mismo
tamao, con exclusin de aquellos fragmentos que
se derivan a partir del vector en lugar del ADN
insertado. Esta tcnica puede parecer fcil de llevar
a cabo, pero en la prctica se necesita una gran
cantidad de tiempo para explorar los geles de
agarosa resultantes de fragmentos compartidos.
Tambin hay una relativamente alta posibilidad de
que dos clones que no se solapan voluntad, por
casualidad, fragmentos de restriccin de acciones
cuyos tamaos son indistinguibles por gel de agarosa
electroforesis. Resultados ms precisos pueden ser
obtenidos por PCR de ADN repetitivo, tambin
conocido como intercalados elemento de repeticin
de PCR (IRE-PCR). Este tipo de PCR utiliza cebadores
que estn diseados recocer dentro de las
secuencias repetitivas de ADN y la amplificacin
directa del ADN entre repeticiones adyacentes
(Figura 10.15). Repeticiones de un determinado tipo
se distribuyen equitativamente al azar en un genoma
eucariota, con diferentes distancias entre ellos, por
lo que una variedad de tamaos de los productos se
obtienen cuando se utilizan estos cebadores con
clones de DNA eucariota.
Si un par de clones da productos de la PCR del mismo
tamao, deben contener repeticiones que estn
idnticamente espaciados, posiblemente debido a

los fragmentos de ADN clonados se superponen.


contig montaje clon mediante anlisis de contenido
del sitio secuencia de etiquetado Una tercera
manera de montar un contig clon es la bsqueda de
pares de clones que contienen una secuencia
especfica de ADN que se produce en una sola
posicin en el genoma en estudio. Si dos clones
contienen esta funcin, entonces es claro que deben
solaparse (Figura 10.16). Una secuencia de este tipo
que se llama una secuencia de marcados sitio (STS).
A menudo, un STS es un gen que ha sido secuenciado
en un proyecto anterior. Como se conoce la
secuencia, un par de cebadores de PCR pueden
disearse que son especficos para ese gen y luego
se utiliza para identificar qu miembros de una
biblioteca de clones contienen el gen. El STS no tiene
que ser un gen y puede ser cualquier pieza corta de
secuencia de ADN, siendo el nico requisito que
ocurre slo una vez en el genoma.

gentico entre los genes presentes en el mismo


cromosoma, lo que permite las posiciones relativas
de los genes para ser deducidas y un mapa gentico
para ser construidos.
Ms recientemente, se han ideado tcnicas para el
mapeo gentico de secuencias de ADN que no son
genes pero que todava muestran variabilidad en la
poblacin humana. El ms importante de estos
marcadores de ADN es:

10.2.3 Usar un mapa para ayudar al


ensamblaje de secuencia
Mapeo de secuencias etiquetadas contenido del sitio
es un mtodo particularmente importante para
contig clon montaje, porque a menudo las posiciones
de los SPB dentro del genoma hubieren determinado
por la cartografa gentica o la cartografa fsica. Esto
significa que las posiciones de STS se pueden utilizar
para anclar el contig clon en un mapa del genoma, lo
que permite la posicin de la contig dentro de un
cromosoma que se determine. Ahora vamos a ver
cmo estos mapas son adquiridos.

Los mapas genticos


Un mapa gentico es uno que se obtiene por
estudios genticos utilizando principios mendelianos
y la participacin de los programas de mejoramiento
dirigidas a los organismos experimentales o pedigr
anlisis para los seres humanos. En muchos casos los
loci que son objeto de estudio son los genes, cuya
herencia patrones se siguen mediante el control de
los fenotipos de la descendencia producida despus
de una cruzar entre los padres en contraste con las
caractersticas (por ejemplo, alto y bajo para el
guisante plantas estudiadas por Mendel). Los
patrones de herencia revelan el grado de ligamiento

Polimorfismos de nucletido nico (SNP),


que son posiciones en un genoma donde
cualquiera de los dos nucletidos diferentes
pueden ocurrir (figura 10.17). Algunos
miembros de la especies tienen una versin
del SNP y algunos tienen la otra versin. Los
SNP son generalmente escrito con sondas de
oligonucletidos cortos que se hibridan con
la alternativa formas y por lo tanto distinguir
que est presente.
Polimorfismos de longitud de fragmentos de
restriccin (RFLP) son tipos especiales de
SNPs, los que dan como resultado un sitio de
restriccin siendo cambiadas. Cuando se
digiere con una endonucleasa de restriccin
de la prdida del sitio se revela porque dos
fragmentos
permanecer
unido.
Originalmente, se tipificaron los RFLP
mediante hibridacin Southern de ADN
genmico restringido, pero este es un
proceso que consume tiempo, por lo que hoy
en da la presencia o ausencia del sitio de
restriccin es generalmente determinada por
PCR (Figura 10.18).
Short repeticiones en tndem (STRs),
tambin llamados microsatlites, estn
compuestos de corta secuencias repetitivas
de 1-13 nucletidos de longitud, unidos
cabeza a la cola. El nmero de repeticiones
presentes en un STR en particular vara, por
lo general entre 5 y 20. El nmero se puede
determinar mediante la realizacin de una
PCR utilizando cebadores que se reasocian
cualquiera lado del STR y, a continuacin,
examinar el tamao del producto resultante
por agarosa o electroforesis en gel de
poliacrilamida (figura 10.19).

Todos estos marcadores de ADN son


variables y as existen en dos o ms formas
allicas. Sus patrones de herencia se pueden
determinar por anlisis de ADN preparado a
partir de los padres y los hijos de un cruce
gentico, y los datos utilizados para colocar el
ADN marcadores en un mapa gentico,
exactamente de la misma manera que los
genes se asignan.

Los mapas fsicos


Un mapa fsico se genera por mtodos que localizan
directamente las posiciones de especfica secuencias
de una molcula de ADN cromosmico. Al igual que
en el mapeo gentico, los loci que son puede ser
estudiado los genes o marcadores de ADN. Este
ltimo podra incluir las etiquetas de secuencias
expresadas (EST), que son secuencias cortas
obtenidas a partir de los extremos de ADN
complementarios (ADNc) (p. 133). Etiquetas de
secuencias expresadas son por lo tanto las
secuencias de genes parciales, y cuando utilizado en
la construccin de mapas que proporcionan una
forma rpida de localizar las posiciones de los genes,
a pesar de que la identidad del gen podra no ser
evidentes a partir de la secuencia EST.
Dos tipos de tcnicas se utilizan en la cartografa
fsica:

El examen directo de molculas de ADN


cromosmico, por ejemplo, hibridacin in
situ fluorescente (FISH). En esta tcnica, un
ADN clonado fragmento est marcado con un
marcador fluorescente y despus se hibrid
con una preparacin de cromosomas
inmovilizados sobre un portaobjetos de
vidrio. La posicin fsica del fragmento de
ADN en el cromosoma entonces se revela
simplemente el examen de la preparacin
con un microscopio (figura 10.20). Si se lleva
a FISH simultneamente con dos sondas de
ADN, cada uno marcado con un diferente
fluorocromo,
las
posiciones
correspondientes en el cromosoma de los
dos marcadores representado por las sondas
puedan visualizarse. Tcnicas especiales para
trabajar con cromosomas largos, cuyas

molculas de ADN se estiran hacia fuera en


lugar de firmemente enrollado como en los
cromosomas
normales,
activar
los
marcadores para ser posicionado con un alto
grado de precisin.
cartografa fsica con un reactivo de mapeo,
que es una coleccin de superposicin Los
fragmentos de ADN que abarcan el
cromosoma o genoma que se est
estudiando. Pares de marcadores que se
encuentran dentro de un nico fragmento
debe estar ubicada cerca de la otra en el
cromosoma: lo cerca puede ser determinada
mediante la medicin de la frecuencia con el
que el par se produce juntos en diferentes
fragmentos en el reactivo de mapeo (Figura
10.21). El reactivo de mapeo puede ser una
biblioteca de clones, posiblemente uno que
es tambin est montado en un contig antes
de la secuenciacin de ADN. hbridos de
radiacin son un segundo tipo de reactivo de
mapeo
y
fueron
particularmente
importantes en el ser humano Proyecto
Genoma. Estas son lneas de clulas de
hmster que contienen fragmentos de
humano cromosomas, preparados por un
tratamiento que incluye la irradiacin (de ah
su nombre). Mapping se lleva a cabo por
hibridacin de las sondas marcadoras a un
panel de lneas celulares, cada uno que
contiene una parte diferente del genoma
humano.

La importancia de un mapa en la secuencia de


montaje
Es posible obtener una secuencia del genoma sin el
uso de un mapa gentico o fsico. Esto se ilustra por
el proyecto influenzae H. que seguimos en la p. 174,
y muchos otros genomas bacterianos se han
secuenciado sin la ayuda de un mapa. Sin embargo,
un mapa es muy importante cuando se secuenci un
genoma ms grande, ya que proporciona una gua
que se puede utilizar para verificar que la secuencia
del genoma est siendo ensamblado correctamente
desde el muchas secuencias cortas que emergen del
secuenciador automtico. Si un marcador que tiene
han mapeado por medios genticos y / o fsicas

aparece en la secuencia del genoma en una posicin


inesperada, a continuacin, se sospecha de un error
en la secuencia de montaje. Los mapas genticos y /
o fsicos detallados han sido importantes en el
Genoma Humano Proyecto, as como las de
levadura, mosca de la fruta, C. elegans, y A. thaliana,
todos los cuales eran basado en el enfoque clon
contig. Los mapas tambin estn siendo utilizados
para dirigir la secuencia de montaje en proyectos
que utilizan el enfoque de escopeta. Como se
describe en la pg. 176, el principal problema cuando
la aplicacin de la secuenciacin de escopeta en gran
genoma es la presencia de repetidas secuencias y la
posibilidad de que la secuencia de ensamblado
"salta" entre dos repeticiones, por lo que parte del
genoma est fuera de lugar o hacia la izquierda
(vase la figura 10.12). Estos errores se pueden
evitarse si la secuencia de montaje hace referencia
constante a un mapa del genoma. Porque evita la
laboriosa construccin de contigs clones, este
enfoque es dirigido escopeta convirtindose en el
mtodo de eleccin para la secuenciacin de
grandes genomas.

You might also like