You are on page 1of 13

CAPTULO 4: LIGAMIENTO GENTICO EN HUMANOS

Tema 4. Ligamiento gentico en humanos


El concepto de ligamiento: fraccin de recombinacin y distancia gentica.
Informatividad de los marcadores utilizados en estudios de ligamiento. El
clculo del LOD score. Ligamiento no paramtrico y su utilizacin en
gentica humana. Estudios de asociacin (GWAS) y deteccin de variantes
raras de alto riesgo relativo: hacia los genomas individuales y la medicina
genmica.

El concepto de ligamiento gentico: fraccin de recombinacin y distancia


gentica
Aunque algunos autores ya haban sugerido la presencia de determinados genes en cromosomas
concretos, no hubo evidencia clara de esto hasta el descubrimiento del ligamiento del locus white de
Drosophila al cromosoma X, hecho por T.H. Morgan en torno a 1910. Poco despus, Morgan identific
nuevos mutantes, entre ellos otro llamado rudimentary, que tambin mostraba ligamiento al
cromosoma X. Esto llev a Morgan a estudiar la segregacin simultnea de estos dos genes: si siempre
se heredan juntos, esto sugerira que estn cerca en el mismo cromosoma, ya que no ha habido
recombinacin entre ellos. En efecto, segn las leyes de la herencia mendeliana dos loci que estn en
cromosomas distintos segregarn de manera independiente, es decir, los dos alelos de cada locus se
distribuirn en los gametos de modo aleatorio. En cambio, cuando los dos loci estn en el mismo
cromosoma (se dice entonces que son sintnicos), cabe pensar que siempre se heredar la misma
combinacin de alelos y un miembro de la descendencia que herede un alelo concreto de uno de los loci
tambin heredar el alelo del otro locus que estaba en el mismo cromosoma parental. Por el contrario, si
se produce una recombinacin (con sobrecruzamiento) en algn punto intermedio entre ambos loci
durante la meiosis, los gametos llevarn combinaciones allicas que no estaban presentes en ninguno de
los progenitores, es decir, se formen gametos recombinantes. Morgan comprob que poda darse
recombinacin entre el locus white y el locus rudimentary en Drosophila, pero al estudiar otras
mutaciones (especialmente el color amarillo del cuerpo y el color blanco de los ojos) observ que nunca
se detectaba recombinacin con otros loci localizados en el mismo cromosoma, y llam ligamiento a
ese fenmeno. Alfred Sturtevant, un estudiante de Morgan, demostr que la probabilidad de que haya
una recombinacin entre dos loci depende de la distancia fsica que los separa, y por tanto la frecuencia
con que aparecen recombinantes puede utilizarse para deducir la distancia que separa dos genes que
estn en el mismo cromosoma; Sturtevant construy en una noche el primer mapa gentico de
ligamiento, en el que se representaba el orden y la distancia de cinco genes localizados en el
cromosoma X de Drosophila. Poco despus, Calvin Bridges detect los primeros casos de ligamiento
entre genes localizados en autosomas, y poco a poco se fueron describiendo distintos grupos de
ligamiento. El concepto de ligamiento gentico, por tanto, va intrnsecamente unido al de distancia
fsica entre genes, que es la que origina distintas proporciones de individuos recombinantes en la
descendencia.
Cuando ambos loci estn suficientemente alejados (aunque estn en el mismo cromosoma) existe una
probabilidad tan alta de que haya un sobrecruzamiento entre ellos que segregarn de manera similar a
una segregacin independiente, produciendo gametos recombinantes en la mitad de la descendencia
(50% de gametos recombinantes y 50% de gametos no-recombinantes). En este sentido, es

CAPTULO 4: LIGAMIENTO GENTICO EN HUMANOS


importante recordar que el sobrecruzamiento tiene lugar entre dos cromtides, cada una perteneciente a
un cromosoma homlogo; las otras dos cromtides no se recombinan, de ah que un sobrecruzamiento
da lugar a cuatro gametos de los cuales dos son recombinantes y los otros dos son idnticos a los
cromosomas originales. Sin embargo, a medida que dos loci sintnicos se sitan ms cerca uno del
otro, la probabilidad de que haya un sobrecruzamiento entre ellos es cada vez menor, y por tanto la
probabilidad de formacin de gametos recombinantes tambin va decreciendo. Puede llegarse a
un punto en que los loci estn tan juntos que nunca se d un sobrecruzamiento entre ellos, de
modo que no se originarn gametos recombinantes y no se encontrarn individuos recombinantes en la
descendencia. Por tanto, la cuantificacin del nmero de eventos de recombinacin entre dos loci nos
permite estimar la distancia gentica entre ellos: a mayor proximidad, menor probabilidad de
recombinacin y por tanto el porcentaje de individuos recombinantes ser menor.

En Gentica Humana, la cuantificacin de la frecuencia de recombinacin se hace estudiando la


segregacin de dos secuencias de ADN en los individuos de una familia, e identificando aquellos
individuos cuyo genotipo slo pueda explicarse por una recombinacin en la meiosis de uno de los
progenitores. Las secuencias que se utilizan en estudios de ligamiento se denominan marcadores
genticos, que son secuencias que se encuentran en distintas formas (distintos alelos) en la poblacin
general, ya que para detectar si ha habido recombinacin debemos ser capaces de distinguir los distintos
alelos. Adems, los estudios de ligamiento entre marcadores sirven para establecer mapas de ligamiento
en los que estos marcadores estn en un orden determinado, separados por distancias precisas. Por
tanto, los marcadores utilizados en estudios de ligamiento son polimorfismos genticos, es decir,
secuencias que se encuentran en la poblacin en varias formas posibles. Diferentes individuos de la
poblacin pueden tener, por tanto, distintos genotipos (distintas combinaciones de alelos) para un
marcador concreto. Los principales tipos de polimorfismos genticos que se utilizan como marcadores en
estudios de ligamiento han sido explicados con detalle al hablar del genoma humano.
Para realizar mapas de ligamiento entre marcadores, es necesario ante todo genotipar cada uno de los
marcadores en todos los miembros de una varias familias. Al analizar los genotipos de cada individuo y
la segregacin de los diferentes alelos, se pueden identificar los individuos recombinantes, aquellos
cuyo genotipo slo puede explicarse por una recombinacin en uno de sus progenitores. La cantidad de
individuos recombinantes en la descendencia nos permite calcular la fraccin de recombinacin
(representada por la letra griega ), que se define como el nmero de individuos recombinantes dividido
por el nmero total de individuos en la descendencia. Adems de estudiar la distancia entre marcadores,
en los estudios de ligamiento que se realizan en Gentica Humana es frecuente buscar cul es la
distancia entre un marcador y el locus responsable de una enfermedad gentica. En estos casos, el
anlisis de ligamiento nos permitir calcular la distancia entre el marcador y el gen responsable
de una enfermedad. Utilizando esta metodologa se han identificado los genes responsables de muchas
enfermedades genticas, mediante una estrategia denominada clonaje posicional: al conocer la
distancia que separa el locus responsable de una enfermedad de varios marcadores genticos concretos,
se simplifica enormemente la tarea de identificar el gen causal.

CAPTULO 4: LIGAMIENTO GENTICO EN HUMANOS

La fraccin de recombinacin, calculada tal y como se ha explicado en la Figura anterior, nos permite
estimar la distancia gentica entre dos loci, distancia que se mide en centimorgans (cM): cuando
entre dos loci se detecta una fraccin de recombinacin = 0,01 (1% de individuos recombinantes), se
dice que ambos loci estn a una distancia gentica de 1 cM. Esta distancia gentica (1 cM) equivale
aproximadamente a 1 Mb (megabase) de distancia fsica, aunque esta equivalencia vara a lo largo del
genoma y hay funciones matemticas ms exactas para convertir la distancia gentica en distancia
fsica. En cualquier caso, es importante comprender que la fraccin de recombinacin nunca podr ser
mayor a 0,5 (50%), ya que ste es precisamente el porcentaje de individuos recombinantes que se
producen en ausencia de ligamiento (cuando siempre hay una recombinacin, como se ha explicado ms
arriba) o en el caso de que ambos loci estn situados en cromosomas distintos.

Informatividad de los marcadores utilizados en estudios de ligamiento


Como acabamos de explicar, para poder realizar estudios de ligamiento es necesario identificar los
individuos recombinantes para determinar la fraccin de recombinacin. Por desgracia, en ocasiones es
imposible establecer si un individuo de la descendencia es recombinante o no, bien porque el individuo
que transmite la enfermedad es homocigoto para el marcador analizado, o bien porque es heterocigoto
idntico al otro progenitor; estas situaciones dan lugar a lo que denominamos familias noinformativas o semi-informativas, respectivamente.

Lo posibilidad de perder informatividad subraya la importancia de usar marcadores para los que todos
los rboles analizados sean informativos, lo cual depender directamente de la informatividad de los
marcadores utilizados. La informatividad de un marcador refleja la probabilidad de encontrar
individuos heterocigotos para ese marcador en la poblacin general, y es funcin del nmero de alelos
posibles para el marcador y de las frecuencias relativas de cada alelo en la poblacin. Teniendo en
cuenta las caractersticas de cada tipo de marcador, es posible calcular dos parmetros que definen la
informatividad de un marcador gentico: el ndice de heterocigosidad y el PIC (contenido de
informacin de un polimorfismo, Polymorphism Information Content en ingls). Estos parmetros se
calculan mediante la siguiente frmula:

CAPTULO 4: LIGAMIENTO GENTICO EN HUMANOS

n-1

PIC = 1 - pi -
2

i=1

i=1

heterocigosidad

2pi2 pj2

j=i+1

% heterocigotos idnticos

El primer miembro (1 - pi 2) es la heterocigosidad, es decir, el porcentaje de individuos de la


poblacin general que son heterocigotos para ese marcador. Ya hemos visto que si el individuo que
transmite la enfermedad es homocigoto para un marcador, esa familia no ser informativa para ese
marcador, de ah que la heterocigosidad sea una medida de la informatividad de un marcador
gentico. Como pi2 es la frecuencia de homocigotos para cada alelo del marcador, el sumatorio de
todos los posibles homocigotos se le resta a 1 y se obtiene as el porcentaje de heterocigotos. Como
criterio general, se puede decir que la heterocigosidad de un marcador aumenta: (a) con el
nmero de alelos que ese marcador presenta en la poblacin general; y (b) cuanto ms parecidas
son las frecuencias de los distintos alelos de ese marcador.

El segundo miembro de la ecuacin le resta a la heterocigosidad la probabilidad de que una familia


no sea informativa debido a que ambos padres son heterocigotos idnticos (en cuyo caso, como
hemos visto antes, la mitad de la descendencia ser informativa (homocigotos) y la mitad ser noinformativa (los heterocigotos). Como es sabido, para dos alelos i y j con frecuencias allicas pi y pj
la frecuencia de heterocigotos es 2pipj. Por tanto, la probabilidad de que dos individuos sean
heterocigotos idnticos es 2pipj x 2pipj = 4(pi2pj2), pero como slo se pierde informatividad en la
mitad de la descendencia, en la ecuacin se resta slo 2(pi2pj 2 .

Algunos ejemplos del clculo del PIC ilustrarn la informatividad de los distintos tipos de marcadores
genticos. Por ejemplo, un marcador biallico (el caso tpico sera un RFLP) con frecuencias allicas
iguales (p1=p2=0,5) tendra:
2

Heterocigosidad = [1 (p1 +p2 )] = [1 (0.5 + 0.5 )] = 1 0.5 = 0.5


PIC = 1 (p12+p22) 2(p1 2 x p2 2) = 1 (0.5 2+ 0.5 2) 2(0.5 2 x 0.5 2) = 0.375
En cambio, un marcador con cuatro alelos (alelos 1, 2, 3 y 4) en el que cada alelo tiene una
frecuencia p = 0,25, presentar en principio 6 posibles combinaciones de heterocigotos, con genotipos
(1-2), (1-3), (1-4), (2-3), (2-4) y (3-4). Por tanto, para calcular todos los posibles casos de
heterocigotos idnticos en la poblacin, habr que sumar [2(p12 p22)] + [2(p12 p32)] + [2(p12 p42)]

+ [2(p22 p32)] + hasta completar las seis posibles combinaciones de heterocigotos. Aplicando la
frmula general:

Heterocigosidad = [1 (0,252+ 0,252+ 0,252+ 0,252 )] = 0,75


PIC= 1 (0,252+ 0,252+ 0,252+ 0,252 ) 6 [2(0,252 x 0,252 )] = 0,703
Como se ve, el hecho de que un marcador tenga 4 posibles alelos en vez de 2 aumenta su
informatividad casi al doble. De hecho, un marcador con 10 alelos arrojara, aplicando la frmula
anterior, un PIC de 0,891 si las frecuencias allicas son iguales. Por tanto, de los distintos marcadores

CAPTULO 4: LIGAMIENTO GENTICO EN HUMANOS


que se han mencionado, los ms informativos son los de tipo microsatlite, seguidos por SNP y
RFLP. De todas formas, como ya se ha comentado, la posibilidad de estudiar a la vez miles de SNPs de
forma automatizada (algo que no es posible con los microsatlites), junto con su alta densidad a lo largo
del genoma, hace que los SNP sean hoy en da los marcadores de mayor utilidad en los estudios de
asociacin que se explicarn ms adelante.
Sea cual sea el tipo de marcador utilizado, los estudios de ligamiento requieren genotipar a todos los
miembros de una familia para detectar la presencia de individuos recombinantes y as poder calcular la
fraccin de recombinacin. En el ejemplo de la familia con una enfermedad autosmica dominante
presentado en la Figura 4.2, hemos podido establecer que el individuo transmisor de la enfermedad
transmita a la vez el alelo 2 del marcador, ya que ambos se localizan a poca distancia en el mismo
cromosoma. Sabemos esto porque este individuo, a su vez, hered la enfermedad de su padre, que
tambin le transmiti el alelo 2 del marcador. Cuando en un individuo que transmite una enfermedad
podemos determinar inequvocamente el origen parental tanto del alelo que causa la enfermedad como
de los alelos del marcador es decir, podemos determinar qu alelos de cada uno de los dos loci van en
el mismo cromosoma se dice que conocemos la fase de ligamiento de ese individuo. Precisamente es
el hecho de conocer la fase de ligamiento en el individuo transmisor lo que hace que todas las meiosis
de este individuo sean informativas, y nos permite determinar con certeza si los individuos de la
descendencia son recombinantes o no. Se recordar que en el caso concreto de esta familia haba un
individuo recombinante de un total de 6, lo que sugiere que ambos loci (el marcador y el gen de la
enfermedad) estn en ligamiento a una distancia que produce 1 recombinante de cada 6 individuos
(fraccin de recombinacin =1/6=0,17, es decir a una distancia gentica de 17 cM). El principal
problema es que este resultado podra haberse dado por azar: tericamente es posible que no haya
ligamiento y que una descendencia ms numerosa nos mostrase una fraccin de recombinacin ms
cercana al 50% de individuos recombinantes. Frente a esta "hiptesis nula" (no ligamiento) tenemos una
hiptesis alternativa de que existe ligamiento entre ambos loci, a una distancia tal que origina una =
0,17. Cmo podemos determinar cul de las dos hiptesis es la verdadera , al menos, la que mejor
explica los datos obtenidos en esta familia?

El clculo del LOD score


Para cuantificar la significacin de cada una de estas hiptesis, los estudios de ligamiento utilizan un
mtodo llamado "Estimacin de la Mxima Verosimilitud" ("verosimilitud" es la traduccin del
trmino ingls likelihood). Este mtodo consiste en estimar la verosimilitud de cada hiptesis, calculando
la probabilidad de encontrarnos con esa fraccin de recombinacin cuando se verifica esa hiptesis. Por
ejemplo, para estimar la verosimilitud de la hiptesis de ligamiento, calculamos la probabilidad de
obtener 1 recombinante de cada 6 individuos en el caso de que exista ligamiento a una distancia de 17
cM; para estimar la verosimilitud de la hiptesis nula, calculamos la probabilidad de obtener 1
recombinante de cada 6 individuos en el caso de que no exista ligamiento, y as sucesivamente. La
siguiente caja ilustra el razonamiento matemtico que se sigue para estimar estas probabilidades,
con un ejemplo del lanzamiento de monedas:

La manera de estimar la verosimilitud de una hiptesis se puede ilustrar muy bien con el
ejemplo de una moneda que se tira al aire 10 veces, produciendo 8 caras y 2 cruces. Con estos
datos experimentales, podramos formular una hiptesis H1 segn la cul la moneda est
deformada o trucada y siempre producir 8 caras de cada 10. Segn esta hiptesis, la

CAPTULO 4: LIGAMIENTO GENTICO EN HUMANOS


probabilidad de obtener cara es

P(cara)=8/10 y la probabilidad de obtener cruz es

P(cruz)=2/10. Por tanto, la probabilidad de obtener 8 caras es P(8 caras) = 0,88 y la


probabilidad de obtener 2 cruces es P(2 cruces) = 0,22. En conjunto, la verosimilitud de que la
hiptesis de trucaje explique 8 caras y dos cruces es L(H1) = 0,88 x 0.22 = 0,0067.
La hiptesis nula H0, en cambio, afirmara que la moneda es normal y que estos datos
experimentales son fruto del azar. Segn esta hiptesis, por tanto, la probabilidad de obtener
una cara es igual a la de obtener cruz, P(cara)=P(cruz)=1/2. La probabilidad de obtener 8 caras
y dos cruces en estas condiciones sera 0,58 x 0,52 = 0,001.
Cul es la hiptesis ms verosmil para explicar nuestros datos experimentales? Por supuesto
H1, pero cunto ms verosmil que H0? Para esto calculamos el cociente de verosimilitudes,
llamado en ingls LIKELIHOOD RATIO, que se obtiene siemplemente dividiendo la verosimilidad
de la hiptesis H1 entre la verosimilitud de la hiptesis nula H0, es decir, Likelihood Ratio = L
(H1) / L(H0). En nuestro caso, este cociente sera 0,0067/0,001 = 6,7, es decir la hiptesis H1
es 6,7 veces ms verosmil que la hiptesis nula.
Aumentando el nmero de veces que se lanza la moneda aumenta progresivamente la
verosimilitud de la hiptesis aunque se mantengan los mismos porcentajes, ya que el cociente
de verosimilitudes se hace mayor. Por ejemplo, si tiramos la moneda 50 veces y obtenemos 40
caras y 10 cruces (la misma proporcin de caras y cruces que en el caso anterior), ahora
L(H1)= 0,840 x 0,210 = 13,6 x 10-12 mientras que la verosimilitud de la hiptesis nula es
L(H0)=0,550= 8,9 x 10-16. El cociente de verosimilitudes es ahora L(H1)/L(H0)= 1.5 x 104.

Aplicando esta forma de proceder al rbol que hemos venido

estudiando, recordamos que hay 5

individuos no-recombinantes y 1 recombinante, luego formulamos la hiptesis H1 de que la distancia


entre el locus de la enfermedad y el locus del marcador es tal que producen una frecuencia de
recombinacin =1/6. Por tanto, bajo esta hiptesis, la probabilidad de encontrar un individuo
recombinante es P(R)=1/6, y la probabilidad de encontrar un no-recombinante es P(NR)=5/6. La
verosimilitud de que esta hiptesis (H1, =1/6) explique nuestros datos experimentales (5 norecombinantes y 1 recombinante) se calcula aplicando la frmula general:

L (H1) = R x (1- )NR


Por el contrario, la verosimilitud de la hiptesis nula para explicar nuestros datos sera:

L (H0) = (R + NR)
Para calcular cuntas veces ms verosmil es nuestra hiptesis que la hiptesis nula, hallamos el
cociente de verosimilitudes (likelihood ratio). En gentica humana, para que este cociente sea
significativo al 95% se requiere que sea mayor o igual a 1000. Es fcil darse cuenta que uno de los
principales problemas que nos encontramos es el tamao pequeo de las generaciones, al contrario de
los estudios de ligamiento que se hacen en otras especies. Una forma de solventar este problema es
repetir el anlisis en varias familias distintas, y combinar los resultados obtenidos en cada una de ellas
con el fin de aumentar la potencia estadstica de los estudios de ligamiento. Para poder combinar

CAPTULO 4: LIGAMIENTO GENTICO EN HUMANOS

resultados de familias distintas, Newton Morton ide el concepto del Lod score (que podra traducirse
como "puntuacin lod" y se representa por la letra Z), que es el log

10

del cociente de verosimilitudes. Por

tanto, un cociente de verosimilitudes = 1000 equivale a un lod score igual a 3 (Z=3), y ste es
precisamente el valor mnimo de Z que se requiere para poder afirmar que existe ligamiento significativo
entre dos loci.
Para hallar el lod score mximo de todos los posibles, es habitual utilizar programas de ordenador que
calculan directamente el lod score que se obtiene para varias hiptesis de ligamiento y a distintos
valores de . Adems, como los resultados de una sola familia raras veces sern significativos,
necesitamos combinar los resultados obtenidos a partir de los datos de varias familias. Para ello, se
suman los lod scores (Z) obtenidos para cada en las distintas familias que estamos analizando, hasta
identificar la fraccin de recombinacin a la que obtenemos el lod score mximo en el conjunto de
las familias analizadas. ste es el valor que finalmente nos permitir afirmar si existe o no ligamiento
significativo entre el gen de la enfermedad y este marcador. Adems, como la Z mxima se obtiene a
una fraccin de recombinacin concreta, podemos tambin estimar la distancia gentica ms probable
entre ambos loci, expresada como siempre en centimorgans. Por ejemplo, si la Z mxima se obtuvo
a una = 0,16, la distancia gentica entre ambos loci estar en torno de 16 cM, con un intervalo de
confianza cuyo clculo es tambin sencillo.

Figura 4.4 El clculo del LOD score (Z) puede ilustrarse con el ejemplo de
esta familia, en la que se indica el nico individuo recombinante de la
generacin III con una flecha. La fraccin de recombinacin es 0,17, por lo
que se calcula la verosimilitud (likelihood) de la hiptesis de ligamiento a
esa fraccin de recombinacin y a la fraccin de recombinacin que
obtendramos si no hubiese ligamiento (0,5). Tras calcular el cociente de
ambas verosimilitudes, calculamos el LOD score tal y como se indica.

CAPTULO 4: LIGAMIENTO GENTICO EN HUMANOS


Como se muestra en este video, se puede calcular el LOD score para todas
las fracciones de recombinacin posibles, representando grficamente los
resultados.
Como los resultados de una sola familia no son suficientes para detectar ligamiento, lo habitual es
combinar los resultados obtenidos para varias familias y sumar los LOD score a cada fraccin de
recombinacin. Por ejemplo, si combinamos los resultados de 5 familias como la anterior, obtenemos:

Ahora, el valor ms alto de LOD score aparece a una fraccin de recombinacin de 0,20. De todas
formas, para calcular el LOD score mximo (Zmax) hemos de representar grficamente esos datos,
buscar los valores con Z>3 y detectar el punto ms alto de la curva:

Estos resultados indican que, efectivamente, el LOD score mximo se obtiene a una fraccin de
recombinacin de 0,16. Como Z>3 en ese punto, se puede concluir que existe ligamiento entre este
marcador y el gen que causa la enfermedad, y que la distancia ms probable entre ambos es de 16 cM.
Un problema muy importante en los estudios de ligamiento es que muchas veces no podemos deducir la
fase de ligamiento en el progenitor que transmite la enfermedad, al no poder establecer con exactitud

CAPTULO 4: LIGAMIENTO GENTICO EN HUMANOS


si un alelo concreto del marcador est en el mismo cromosoma que lleva el alelo mutado o si est en el
cromosoma homlogo. Lgicamente, esto impide establecer si un individuo de la descendencia es
recombinante o no, y por tanto complica mucho el clculo de la fraccin de recombinacin. De
hecho, hay dos posibles fases de ligamiento que tienen la misma probabilidad, y esto ha de tenerse en
cuenta a la hora de estimar la verosimilitud de cada hiptesis. As, se calcula el cociente de
verosimilitudes para cada una de las fases de ligamiento alternativas y se halla el lod score promedio de
ambas:

Z () = log 10 [1/2 [R(1- )

NR

(R+NR)

/ 0.5

] + 1/2 [NR(1- ) R/ 0.5 (R+NR)]]

Lgicamente, el desconocimiento de la fase de ligamiento en el individuo que transmite la enfermedad


hace que el valor final del lod score sea ms bajo, por lo que si los loci estudiados estn realmente en
ligamiento ser necesario estudiar un mayor nmero de familias para poder alcanzar el valor umbral
de Z=3.
Es muy til representar los valores que adopta el lod score Z en funcin de los distintos valores de la
fraccin de recombinacin . Cuando se hace esto, podemos observar varios tipos posibles de curva:

Si no se ha encontrado ningn individuo recombinante en ninguna de las familias


estudiadas, esto quiere decir que los dos loci que estamos estudiando (el locus de la
enfermedad y el del marcador) estn en ligamiento y tan cercanos entre s que no se
producen sobrecruzamientos entre ellos. El lod score es mximo a = 0, para ir bajando
hasta Z=0 para una = 0,5.

Cuando existe ligamiento, lo ms habitual es hallar una curva de forma parablica, con
un pico mximo de lod score a una determinada fraccin de recombinacin. En estos casos
el lod score a la fraccin de recombinacin = 0 debe ser ( ), ya que hemos encontrado
individuos recombinantes en alguna de las familias y esto hace imposible la hiptesis de
que la fraccin de recombinacin sea cero. El intervalo de confianza de la fraccin de
recombinacin mxima se calcula trazando una horizontal una unidad de lod score por
debajo de la Z mxima, y viendo dnde corta ambas ramas de la curva. Como siempre, el
lod score Z se hace 0 para una fraccin de recombinacin =0.5, pues en este caso el
cociente de verosimilitudes L(H1)/L(H0) = 1, y el log10 de 1 es igual a 0.

En ocasiones, la curva alcanza valores de Z inferiores a 2. En estas circunstancias


podemos afirmar que NO existe ligamiento por debajo de una determinada fraccin de
recombinacin y por tanto ambos loci necesariamente estn a una distancia gentica
superior a la indicada por esa fraccin de recombinacin (si es que efectivamente estn en
ligamiento).

Finalmente, hay ocasiones en que no encontramos ligamiento significativo, pero tampoco


podemos excluirlo para ninguna de las estudiadas, puesto que no hay ningn valor de lod
score que sea superior a +3 o inferior a 2. En estos casos no podemos extraer ninguna
informacin til de los datos obtenidos de estas familias.

CAPTULO 4: LIGAMIENTO GENTICO EN HUMANOS

10

Ligamiento no paramtrico y su utilizacin en gentica humana


Como acabamos de ver, uno de los requisitos para poder hacer estudios de ligamiento mediante el
clculo de lod score es conocer el tipo de herencia de la enfermedad que estamos estudiando, ya que sin
esta informacin es imposible detectar la presencia de individuos recombinantes. De hecho, los
programas de ordenador que realizan los clculos para el anlisis de ligamiento exigen que se
introduzcan varios parmetros indicando el tipo de herencia (autosmica dominante, recesiva, etc). Por
desgracia, la mayora de las enfermedades complejas (aquellas que estn determinadas por varios
genes y por factores ambientales) no siguen un patrn hereditario mendeliano tpico, por lo que los
estudios de ligamiento clsicos que se han estudiado hasta ahora no se pueden aplicar. En estos casos
hay que acudir a mtodos de ligamiento que no requieren ajuste de la muestra a un modelo concreto de
herencia, llamados por tanto mtodos no-paramtricos o independientes de modelo. Hay
bsicamente dos tipos de pruebas, las que detectan ligamiento y las que detectan asociacin allica.
Es muy importante darse cuenta de la diferencia entre ambos conceptos: el ligamiento es un fenmeno
que afecta a loci se dice, por ejemplo, que dos loci estn en ligamiento a una distancia determinada
pero el alelo del marcador que "viaja" en el con el alelo de la enfermedad puede ser diferente en familias
distintas. Por ejemplo, en una familia concreta podemos detectar ligamiento porque la enfermedad
siempre segrega junto con al alelo A1 de un marcador, pero en otra familia distinta (con la misma
enfermedad) el alelo mutado puede viajar con el alelo A5 de ese mismo marcador. Ambos loci (el
marcador y el gen de la enfermedad) estn en ligamiento pero en cambio no siempre se dan las mismas
asociaciones de alelos en todas las familias. Esto es as porque existe una situacin de equilibrio entre
ambos loci, de manera que cada alelo de un locus puede encontrarse con cualquiera de los alelos del
otro locus. Los mtodos de ligamiento no paramtrico ms utilizados son ASP (affected sib-pair,
parejas de hermanos afectados) y APM (affected pedigree member, miembro afectado del rbol
familiar), pero perdieron popularidad a partir del ao 2005 cuando comenzaron a realizarse estudios de
asociacin allica a escala genmica.
Los mtodos de anlisis de ligamiento no paramtricos que detectan asociacin allica buscarn
precisamente desviaciones de la situacin de equilibrio entre los alelos de loci muy cercanos, detectando
la presencia de un haplotipo que se encuentre con mayor frecuencia de la que cabra esperar si esos
loci estuviesen en equilibrio. Si demostramos que, incluso en familias distintas, la enfermedad se asocia
significativamente con un alelo concreto del marcador, podemos decir que existe asociacin allica;
como la principal causa de asociacin allica es el desequilibrio de ligamiento por cercana fsica de
ambos loci (estn tan cercanos uno al otro que no se ha alcanzado todava el equilibrio entre ellos), la
asociacin allica se traduce en cercana fsica. Por tanto, podemos servirnos de la asociacin allica
para localizar genes responsables de enfermedades complejas, si detectamos ligamiento con algn
marcador conocido. Inicialmente se utilizaron unas pruebas llamadas TDT (Transmission-Disequilibrium
Test, prueba de transmisin del desequilibrio) HRR (Haplotype Relative Risk, riesgo relativo de un
haplotipo), que utilizaban familias compuestuas por los dos padres y un solo descendiente enfermo.
Las

nuevas

tecnologas

de

genotipaje

que

utilizan

marcadores

tipo

SNP

(Single

Nucleotide

Polymorphisms, ya vistos anteriormente) han acelerado enormemente la identificacin de genes que


confieren susceptibilidad a enfermedades comunes. En este sentido, es importante detectar los SNP que
pueden ser ms informativos en estos estudios: se estima que en toda la poblacin mundial se
encuentran ms de 10 millones de SNPs en los que ambas variantes allicas tienen una frecuencia
mayor o igual a 1%. A pesar del indudable inters que tienen estos polimorfismos para realizar estudios
de asociacin allica, genotipar todos estos SNPs en un nmero grande de individuos es impracticable.
Podemos salvar este obstculo gracias a que muchos SNP, por estar muy cerca fsicamente, se heredan

CAPTULO 4: LIGAMIENTO GENTICO EN HUMANOS

11

juntos en pequeos bloques de desequilibrio de ligamiento. La combinacin concreta de alelos de los


distintos SNP que estn en un mismo bloque constituye un haplotipo caracterstico de ese bloque. Por
tanto, un grupo reducido de SNPs de cada haplotipo pueden ser representativos de todo ese haplotipo
(por lo que reciben el nombre de tag-SNPs, o SNP-etiqueta); de este modo, no es necesario genotipar
todos los SNPs del genoma, sino slo los SNP-etiqueta. De hecho, la metodologa actual permite analizar
500.000 a 1 milln de SNPs rutinariamente, lo cual es suficiente para cubrir todos los haplotipos del
genoma humano. El Proyecto Internacional Hapmap, del que se ha hablado en el Captulo 1, ha
construido un catlogo con todos los haplotipos de SNPs presentes en diversas poblaciones humanas,
detallando la estructura y el tamao de los bloques de desequilibrio de ligamiento del genoma. Esto hace
posible llevar a cabo estudios de asociacin para identificar las regiones donde residen los genes que
confieren susceptibilidad a enfermedades comunes. Dichos estudios se explican a continuacin.

Estudios de asociacin (GWAS) y deteccin de variantes raras de alto


riesgo relativo: hacia los genomas individuales y la medicina genmica.
Dado que los estudios de ligamiento y de asociacin allica clsicos tienen poca potencia para detectar
regiones del genoma responsables de enfermedades complejas (polignicas y multifactoriales), y merced
a los datos proporcionados por el Proyecto Hapmap, en los ltimos aos se han utilizado tecnologas
de genotipado masivo de SNPs (basadas en microarrays) para establecer asociacin entre regiones
genmicas concretas y la predisposicin a sufrir enfermedades comunes con un componente gentico
demostrado (cardiovasculares, neurodegenerativas, diabetes, cncer, etc). A continuacin se explica
cmo se llevan a cabo estos estudios, conocidos como GWAS (en ingls, Genome Wide Association
Study).
1. Seleccin de SNPs a genotipar: Utilizando herramientas bioiformticas es relativamente sencillo
visualizar la posicin y tamao de los bloques haplotpicos a lo largo del genoma (bloques de SNPs
que estn en desequilibrio de ligamiento). La posicin y tamao de estos bloques nos ayuda

seleccionar los SNPs ms adecuados para cubrir todo el genoma con el menor nmero posible de
sondas. Este trabajo previo de seleccin habitualmente lo hacen los fabricantes de microarrays de SNPs,
que actualmente analizan en torno a los 500.000 1.000.000 de SNPs por microarray.
2. Toma de muestras de las cohortes a estudiar: Los estudios de asociacin "genome-wide" requieren un
gran nmero de muestras, para poder detectar seales de asociacin dbiles. Idealmente, deben
utilizarse cohortes (casos y controles, por lo general) de al menos 1.000 individuos cada una, sin
diferencias de sexo, edad y procedencia tnica.
3. Anlisis de resultados: Utilizando distintas herramientas, se generan los haplotipos y se buscan
seales de asociacin, es decir, SNPs en los que un alelo est estadsticamente sobrerepresentado en los casos (enfermos) respecto a los controles (sanos). Esto se hace utilizando un test
de Chi-cuadrado o de Fisher, con correccin para pruebas mltiples.

CAPTULO 4: LIGAMIENTO GENTICO EN HUMANOS

12

La Figura 4.5 muestra el valor de asociacin (en el eje Y) para varios miles
de SNPs distribuidos por todo el genoma. Hay dos SNP con valores de
asociacin significativamente elevados. La posicin de estos SNP indica
que en esa regin existe uno o varios genes implicados en el desarrollo del
rasgo fenotpico que se est analizando (una enfermedad, por ejemplo).
Imagen obtenida de http://www.goldenhelix.com/images/solutions/visualization/manhattan.png

4. Refinar la asociacin y replicar los resultados: En la etapa final, las regiones para las que se detect
asociacin deben refinarse genotipando ms SNPs en esa zona concreta, para as delimitar mejor la
regin implicada. Adems, los resultados deben confirmarse estudiando cohortes distintas con un
nmero de casos y controles similar al del primer estudio.
Los estudios de asociacin a escala genmica estn dando resultados muy valiosos. En los aos 2007 y
2008 se han publicado bastantes estudios que encuentran regiones claramente asociadas con diversas
enfermedades multifactoriales. Uno de estos trabajos,

desarrollado

por el Wellcome Trust Case

Control Consortium (WTCCC), estudi 2.000 muestras de pacientes britnicos con una de las siete
enfermedades multifactoriales ms comunes (depresin, enfermedad coronaria, enfermedad de Crohn,
hipertensin, artritis reumatoide, diabetes tipo 1 y diabetes tipo 2). Estas cohortes (14.000 individuos en
total) fueron comparadas con 3.000 controles sanos, y en cada uno de los 17.000 individuos se
genotiparon 500.000 SNPs, encontrando asociacin significativa con varias regiones del genoma.
A finales de 2010, se haban publicado ms de 1.200 estudios de GWAS en todo el mundo, con datos de
asociacin para ms de 200 enfermedades o rasgos genticos (el catlogo completo puede consultarse
en http://www.genome.gov/gwastudies/). En cualquier caso, los estudios de asociacin slo detectan
variantes genticas comunes (el alelo de menor frecuencia est presente en, al menos, el 5% de la
poblacin), por lo que su efecto sobre la enfermedad es por definicin- pequeo (el riesgo de los
individuos que lo portan aumenta poco en relacin al riesgo general). Se acepta que deben existir otras

CAPTULO 4: LIGAMIENTO GENTICO EN HUMANOS

13

variantes ms raras (frecuencia menor al 5%) con mayor efecto fenotpico, que estn situadas cerca
de las seales de asociacin. La deteccin de estas variantes, implicadas directamente en el desarrollo
de las enfermedades, requerir la secuenciacin exhaustiva del genoma completo de casos y
controles.
Con estas nuevas metodologas, es previsible que en los prximos aos se identifiquen las principales
variantes que confieren susceptibilidad a las enfermedades ms frecuentes. Por ejemplo, podemos
pensar que en un futuro no muy lejano un paciente hipertenso que acuda a la consulta gentica ser
estudiado para detectar variantes de predisposicin en varios genes, y gracias a los resultados se le
clasificar dentro de un grupo molecular determinado que permitir asignarle un tratamiento diettico o
farmacolgico especfico. Desde este punto de vista, el genotipado de polimorfismos concretos puede
convertirse en un anlisis de rutina en el diagnstico de un nmero creciente de enfermedades humanas
en el prximo decenio.

You might also like