Professional Documents
Culture Documents
MGC8.0
201
2361
protena retinoblastoma RB1
928
198
27
2.4
179
6668
CFTR (fibrosis qustica
receptor transmembrana)
1480
250
27
2.4
227
9100
La titina
34350
283
363
40
315
466
utrofina
3433
567
74
2.2
168
7464
La distrofina
3685
2400
79
0,6
180
30.770
Donde isoformas son evidentes, las cifras indicadas representan las isoformas
ms grandes. Como los genes se hacen ms grandes, el tamao exn permanece
bastante constante, pero los tamaos de intrones CAN
llegar a ser muy grande. exones internos tienden a ser bastante uniforme en
tamao, pero el exn terminal o algunos exones cerca del extremo 3 pueden ser
muchos kilobases de largo;
por ejemplo, el exn 26 del APOB gen es de 7,5 kb de longitud. Tenga en cuenta
el extraordinariamente alto contenido de exn y comparativamente pequeos
tamaos de intrones en los genes
codificacin de colgeno tipo VII y titina. Adems de SRY , otros genes que
codifican protenas de un solo exn en el genoma nuclear incluyen retrogenes
(vase
Tabla 9.8) y los genes que codifican otras protenas SOX, interferones, histonas,
muchos receptores acoplados a la protena G, protenas de choque trmico,
muchos ribonucleasas,
y varios receptores de neurotransmisores y receptores de hormonas.
Genes que codifican protenas
pgina 12
organismos, tales como seres humanos, genes son mucho ms grandes, y hay
menos agrupacin de
secuencias codificantes de protenas ( Tabla9.5 ).
la densidad de genes vara enormemente de un cromosoma en el cromosoma y
dentro de diferentes regiones del mismo cromosoma. En las regiones
cromosmicas con
alta densidad de genes, la superposicin de genes puede ser hallado, por lo
general se transcriben
a partir de hebras de ADN opuestas. Por ejemplo, la regin de la clase III del
complejo HLA
en 6p21.3 tiene una densidad de genes promedio de alrededor de un gen por cada
15 kb y es conocida
para contener varios ejemplos de parte superposicin de genes ( Figura9.7a ).
Todo el genoma anlisis muestran que alrededor del 9% de los genes codificantes
de protenas humanas
solapar otro de tales genes. Ms de 90% de los solapamientos implican genes
trandescrito a partir de hebras opuestas. A veces los solapamientos son parciales,
pero en otra
maletines genes codificadores de protenas se encuentran dentro de los intrones
de los genes ms grandes.
La NF1 gen (neurofibromatosis tipo I), por ejemplo, tiene tres pequeas interna
genes transcritos de la cadena opuesta (Figura 9.7B).
Anlisis recientes tambin han demostrado que los genes de ARN con frecuencia
se pueden superponer progenes protena codificante. El posicionamiento de los genes de ARN se trata en la
Seccin 9.3.
Los genes transcritos de forma divergente o co-transcriben a partir de un
comn
promotor
Algunos genes codificadores de protenas comparten un promotor. En muchos
casos los 5 extremos de los dos
los genes son a menudo separados por unos pocos cientos de nucletidos y los
genes son
transcrito en direcciones opuestas desde el promotor comn. Este tipo de bidiorganizacin de genes direccional puede proporcionar una regulacin comn del
par de genes.
Como alternativa, los genes con un promotor comn se transcriben en la misma
direccin para producir transcripciones multignicas que a continuacin se
escinden para producir una
pgina 13
267
TABLA GENOMA HUMANO Y ESTADSTICA 9.5 de genes humanos
TAMAO DE COMPONENTES GENOMA
genoma mitocondrial
16.6 kb
genoma nuclear
3.1 Gb
un
componente euchromatic
2,9 Gb (93%)
Altamente conservadas fraction150 Mb (5%)
sequences35 ADN codificante de la protena Mb (1,1%)
Otros DNA115 altamente conservada Mb (3,9%)
DNA160 segmentally duplicado Mb (5,5%)
DNA1.6 altamente repetitivo Gb (50%)
heterocromatina constitutiva 200 Mb (7%; Tabla 9.3)
repeats1.4 basado en transposn Gb (45%, Tabla 9.12)
ADN por cromosoma
48 MB-249 Mb (Tabla 9.3)
el nmero de genes
genoma nuclear
> 26.000
genoma mitocondrial
37
genes que codifican protenas 20,000-21,000
genes de ARN
> 6000 (Figura exacta no se conoce)
Pseudogenes relacionados con genes que codifican protenas
> 12.000
la densidad de genes
genoma nuclear
> 1 por 120 kb (pero considerable incertidumbre)
genoma mitocondrial
1 por 0,45 kb
LONGITUD DE LOS GENES PROTEINCODING
Longitud promedio
53.6 kb
Pequesimo
unos pocos cientos de pares de bases de largo (varios ejemplos)
ms grande
2.4 Mb (distrofina)
NMERO DE GENES exn en PROTEINCODING
Promedio del nmero de exones en un gen
segundo
9.8
el nmero ms grande de un gen
363 (en el gen de la titina)
nmero ms pequeo de un gen
1 (no hay intrones-vanse las Tablas 9.4 y 9.7, por ejemplo)
TAMAO DE LOS GENES exn en PROTEINCODING
tamao medio de exn
288 pb (exones pero en 3 final de genes tienden a ser
gran)
Pequesimo
<10 pb (varios, por ejemplo el exn 3 del gen de la troponina I
TNNI1 est a slo 4 pb de longitud)
ms grande
18.2 kb (exn 6 en MUC16 isoforma-201)
Intrn tamao en los genes PROTEINCODING
Pequesimo
<30 pb (varios)
ms grande
1.1 Mb (intrn 5 en kcnip4 )
ARN TAMAO
Ms pequeo ARN no codificante
<20 nucletidos (por ejemplo, muchas de inicio transcripcional
ARN-sitio asociado al menos 18 nucletidos)
ARN no codificante ms grande
Cientos de miles de nucletidos; por ejemplo UBE3A
RNA antisentido es probable que sea cerca de 1 Mb
ARNm ms grande
> 103 kb (ARNm titina, isoforma NF-2A)
TAMAO polipptido
Pequesimo
decenas de aminocidos (varios neuropptidos)
ms grande
34.350 aminocidos (titina, isoforma NF-2A)
un
Tenga en cuenta que el tamao total puede variar entre los haplotipos debido a
variacin en el nmero de copias.
segundo
Para el
isoforma ms larga. Los datos se obtuvieron en gran medida de liberacin
Ensembl 55 conjuntos de datos.
Genes que codifican protenas
pgina 14
CYP
21B
CYP
21Ps
C4B
G8 C2 C9a
G7a
G3a
K18L
G3 G1
G7 G8
G2
G6
G5
G4
C4A
ZB
XA
YA ZA
G11
G10
HOM
Hsp70
G11a
G7B
G5b CKIIB
G7c
BAT5
G7d
RD
bf
G9 2
1C7
B144
LTB
TNF
LTA
NB6
1kBL
BAT1
MICB
PERB6
PERB10
MICA
NOB1
NOB2
P5-6
DHFRPs
17
NOB3
alianzas de inversin pblicoprivada
(UN)
(SEGUNDO)
0
900 kb
exn 27b
exn 28
27b intrn
OGMP
EVI2B
EVI2A
2.2 kb
10 kb
4 kb
cadena con sentido
de NF1 gen
cadena antisentido
de NF1 gen
5
3
3
5
pgina 15
269
Las diferentes clases de las familias de genes humanos pueden ser reconocidos de
acuerdo con la
grado de similitud de secuencia y la similitud estructural de sus productos
proteicos.
Si dos genes diferentes hacen productos de protenas muy similares, que son ms
propensos a
se origin por una duplicacin de genes evolutivamente muy reciente, muy
probablemente
re
segundo
un
2
un
1
q
y
x1
y
a2
y
a1
hGH-N CS-L
CS-A
hGH-V CS-B
ALBA
AFP
ALF
GC / PAD
gen expresado
expresado, pero en estado desconocido
pseudogen
Figura 9.8 Ejemplosdehumanoagrupados
familias de genes. Los genes en un grupo son a menudo
estrechamente relacionados en secuencia y son tpicamente
transcrito a partir de la misma cadena. Gene
grupos a menudo contienen una mezcla de expresado
genes y pseudogenes no funcionales. los
el estado funcional de la q-globina y CS-L
genes es incierto. Las escalas superior
(globina y la hormona del crecimiento clusters) y
la parte inferior (cluster albmina) estn en kilobases.
Genes que codifican protenas
pgina 16
> 900
cerca de 25 grandes grupos dispersos por todo el genoma
muchos
Las familias de genes ENTREMEZCLADOS
aldolasa
5
tres genes funcionales y dos pseudogenes en cinco
diferentes cromosomas
muchos
PAZ
9
los nueve son genes funcionales
muchos
NF1 (neurofibromatosis de tipo I)
> 12
un gen funcional en 22q11; otros estn nonprocessed
pseudogenes o fragmentos de genes (Figura 9.11)
muchos, la mayora pericentromeric
cadena pesada de ferritina
20
un gen funcional en el cromosoma 11; la mayora son
pseudogenes procesados
muchos
pgina 17
271
Dos ejemplos importantes de superfamilias de genes son la Ig (inmunoglobulina)
y GPCR (receptor acoplado a protena G) Superfamilias. Los miembros de la
super-Ig
familia todos tienen dominios globulares se asemejan a los encontrados en las
inmunoglobulinas,
y adems de inmunoglobulinas que incluyen una variedad de superficie de la
clula proprotenas solubles y protenas implicadas en el reconocimiento, unin, o ceso de
adhesin
eses de clulas (vase la Figura 4.22 para ver algunos ejemplos). La superfamilia
GPCR es muy
con al menos 799 miembros de larga duracin en grandes nicas, distribuidos en
todo el
Genoma humano. Todas las protenas GPCR tienen una estructura comn de siete
a-hlice
segmentos transmembrana, pero por lo general tienen una baja secuencia (menos
de 40%)
similitud entre s. Ellos median la sealizacin celular inducida por ligando a
travs de interaccin
cin con las protenas G intracelulares, y la mayor parte del trabajo como
receptores de rodopsina.
la duplicacin de genes que dan lugar a las familias multignicas tambin
crear pseudogenes y fragmentos de genes
Las familias de genes con frecuencia tienen copias de genes defectuosos, adems
de funcional
genes. Una copia del gen defectuoso que contiene por lo menos varios exones de
una funcin
gen cional se conoce como un pseudogen ( Box9,2 ). Otras copias del gen
defectuoso puede
tener partes solamente limitadas de la secuencia del gen, a veces un solo exn, y
tambin lo son
a veces descrito como fragmentos de genes .
familias de genes agrupados a menudo tienen copias de genes defectuosos que
han surgido por
duplicacin en tndem. Estos son ejemplos de pseudogenes no procesados
. Proceso de copiar
se puede ver que se han realizado a nivel de ADN genmico, porque no
pseudogenes procesados contienen homlogos de ambos exones e intrones y
a veces tambin de regiones promotoras aguas arriba. Sin embargo, incluso si la
copia tiene
secuencias que corresponden a la longitud completa del gen funcional, ms cerca
de examen
nacin identificar los codones de terminacin inapropiadas en los exones,
empalme aberrante
uniones, y as sucesivamente. Ejemplos clsicos de pseudogenes no procesados
se encuentran
en la A-globina y grupos de genes b-globina (vase la Figura 9.8). A veces, ms
pequea
copias de genes truncados y copias fragmento de gen tambin son evidentes, ya
que en la clase I
Familia de genes HLA ( Figura9.10 ).
Unas pocas familias de genes que se distribuyen en diferentes localizaciones
cromosmicas
Tambin puede tener copias de pseudogenes no procesados de un gen funcional
nica.
(SEGUNDO)
Un xx G x GKT
ARG x D
HRIGR COOH
PTRELA
GG
TPGR
SBADO
MUERTO
NUEVA HAMPSHIRE
2
22-42
6-94
23-41
19-29
17-29
17-23
19-51
115-192
20-25
repeticin WD
GH
WD
n = 4-14
ncleo
Figura 9.9 Algunasfamiliasdegenescodifican
protenas funcionalmente relacionadas con corta
motivos conservados de aminocidos. (A) MUERTO
motivos cuadro de la familia. Esta familia de genes codifica
productos implicados en los procesos celulares
que implica la alteracin de ARN secundaria
estructura, tal como la iniciacin de traduccin y
empalme. Ocho amino muy altamente conservada
motivos de cido son evidentes, incluyendo el DEAD
caja (Asp-Glu-Ala-Asp). Los nmeros se refieren a
con frecuencia se encuentran rangos de tamao para intervenir
secuencias de aminocidos; X representa cualquier
aminocidos. repetir motivos familiares (B) de WD.
Esta familia de genes codifica productos que
estn involucrados en una variedad de regulador
funciones, como la regulacin de la divisin celular,
comn (vase la tabla siguiente), sobre todo si son transcritos por la ARN
polimerasa III (genes transcritos por la ARN polimerasa III tienen a menudo
promotores internos).
Como se describe en la Seccin 12.4, la repeticin Alu, el ms
abundantes secuencia en el genoma humano, parece haberse originado
por la copia de las transcripciones de ARN 7SL, y otros muchos altamente
repetidas intercaladas familias de ADN en los mamferos son copias de ARNt.
Por lo tanto, en cierto sentido, pseudogenes de ARN han llegado a ser los ms
comunes
elementos de la secuencia de los genomas de mamferos.
Todos los pseudogenes se encuentran en el genoma nuclear, pero
no incluir copias defectuosas de genes que residen en el mitocondrial
genoma ( pseudogenes mitocondriales ). El genoma mitocondrial
originado a partir de un genoma bacteriano mucho ms grande y durante un largo
evolutivo escala de tiempo la mayor parte del ADN de la gran precursor
genoma mitocondrial migr en una serie de integracin independiente
eventos en lo que ahora es el genoma nuclear. pseudogenes ADNmt
Ahora representar al menos el 0,016% del ADN nuclear (o aproximadamente 30
veces las
contenido del genoma mitocondrial).
La funcionalidad de pseudogenes ha sido un debate inconcluso,
y se han previsto diferentes clases de pseudogenes. Un significante
nmero de pseudogenes (pseudogenes procesados en su mayora) son
transcritas, y las transcripciones antisentido pseudogene pueden regular
los genes de los padres. Los pseudogenes tambin se han implicado directamente
en
la produccin de siRNAs endgenos que regulan transposones, como
se describe en la Seccin 9.3. Por ltimo, algunas secuencias pueden ser
pseudogene
cooptado para una funcin diferente. Han sido descritos como exapted
pseudogenes . Un ejemplo es proporcionado por el XIST gen. Se hace una
ARN no codificante que regula la inactivacin del cromosoma X, y dos de
Se conocen sus seis exones que se origin a partir de una copia de pseudogen
un gen codificante de la protena.
(UN)
(SEGUNDO)
la duplicacin de genes
UN
UN
UN
UN
UN
yA
yA
mutacional
restriccin
mutacional
flexibilidad
transcripcin
y el procesamiento
marcha atrs
transcriptasa
mutacin
cromosmico
integracin
ARNm
ADNc
promotor
inactivando
mutacin
no inactivante
mutacin
Figura 1 Orgenesdenonprocessedyprocesado
pseudogenes. (A) La copia de ADN genmico
secuencia que contiene el gen A puede producir duplicado
copias de las necesidades de presin de seleccin Fuerte gen A.
para ser aplicado a una de las copias para mantener
la funcin de genes (flecha en negrita), pero la otra copia
se puede permitir que mutar (flecha discontinua). Si se
recoge inactivacin de las mutaciones (crculos rojos), una
puede surgir pseudogen nonprocessed (YA).
(B) Un procesado pseudogene surge despus celular
transcriptasas inversas convertir una transcripcin de un gen
en un ADNc que luego es capaz de integrarse de nuevo en
el genoma (vase la figura 9.12 para ms detalles). La falta
secuencias de importantes tales como un promotor generalmente
resulta en una copia del gen inactivo.
ARN de la familia
Nmero de
genes humanos
Cantidad de trastornos
pseudogenes
U6 snRNA
49 800
U7 snRNA
1
85
Y ARN
41000
Recuadro 9.2 Los orgenes, la prevalencia y la funcionalidad de pseudogenes
pgina 19
273
transcripciones tales como ARNm para hacer cDNA que luego pueden integrar en
cromosoma
ADN Somal ( Figura9.12 ). Pseudogenes procesados son comunes en
intercaladas
familias de genes (vase la Tabla 9.5).
pseudogenes procesados carecen de una secuencia promotora y por lo general no
son
expresado. A veces, sin embargo, los ADNc copia integra en un cromosoma
sitio de ADN que sucede, por casualidad, ser adyacente a un promotor que puede
conducir
expresin de la copia del gen procesado. La presin de seleccin puede garantizar
que la
de copias de genes procesado contina haciendo un producto gnico funcional,
en cuyo caso
que se describe como un retrogene . Una variedad de retrogenes intronless se
sabe que tienen
Prueba especfica de patrones de expresin y son homlogos tpicamente
autosmicos de una
-intrn que contiene el gen ligado al cromosoma X ( Tabla9.8 ).
Una razn fundamental para retrogenes puede ser un requisito fundamental para
superar la
la falta de expresin de ciertas secuencias ligadas al cromosoma X en los
testculos durante la meiosis masculina.
Durante la meiosis masculina, los cromosomas X e Y se convierten en pares
heterosexuales
la cromatina, la formacin de la altamente condensada y transcripcionalmente
inactiva cuerpo XY .
retrogenes autosmicos pueden proporcionar la sntesis continua de clulas de
testculos de cer-
Tain productos de importancia crucial que ya no son sintetizadas por los genes en
el
muy condensada cuerpo XY.
L
TM CY
un
1
un
2
L una
1
un
2
un
3
TM CY
CY
un
2
un
3
TM CY
un
2
un
2
un
3
TM CY
un
3
un
3
3 UTR
3 UTR
3 UTR
3 UTR
3 UTR
2.2 Mb
segundo
do
mi
UN
GRAMO
F
Y
1
2
3
4
5
67
Y
Y
Y
(UN)
(SEGUNDO)
NF1
17q11.2
10b
(UN)
(SEGUNDO)
13
27b
2q12-q13
15p11.2 (2 copias)
14p11 <> q11
22p11 <> q11
18p11.2
21p11 <> q11
dispersa NF1
pseudogenes
PKD1
16p13.3
Y PKD1
gene
racimo
16p13.11
Y1
Y2
Y3
Y4
Y5
Y6
Figura 9.11 Dispersindenonprocessed
NF1 y PKD1 pseudogenes como consecuencia
de pericentromeric o subtelomrico
inestabilidad. (A) El NF1 neurofibromatosis
gen de tipo I est situado cerca de la
centrmero del cromosoma humano 17. Se
abarca 283 kb y tiene 58 exones. Los exones son
representada por las cajas verticales delgadas; intrones
se muestran por los galones de conexin (^).
copias defectuosas altamente homlogas de la
NF1 genes se encuentran a las nueve o ms de otros
genoma lugares, sobre todo en pericentromeric
regiones. Cada copia tiene una parte de la completa
gen de longitud, con los dos exones e intrones.
Siete ejemplos se muestran aqu, tales como
dos copias, en 15 peniques que tienen genmica intacta
secuencias que abarcan los exones 13 y 27b.
Reordenamientos en ocasiones han causado
la supresin de los exones e intrones (que se muestra
por asteriscos). (B) El 46 kb PKD1 poliqustico
gen de la enfermedad renal se encuentra cerca de la
telmero de 16p y tiene ms de 40 exones. Como
consecuencia de la duplicacin eventos segmentarias
durante la evolucin de los primates, piezas de gran tamao
de este gen se han duplicado y seis
PKD1 pseudogenes se encuentran en 16p13.11,
con grandes bloques de secuencia (que se muestra como el azul
cajas) copiados de la PKD1 gen (asteriscos
representar la ausencia de los homlogos para
PKD1 secuencias).
Figura 9.10 ElIfamiliadegenesHLAdeclase:una
familia de genes agrupados con nonprocessed
pseudogenes y fragmentos de genes.
(A) Estructura de una clase I HLA-cadena pesada
mRNA. El ARNm de longitud completa contiene una
secuencia que codifica un polipptido con una
secuencia lder (L), tres extracelular
dominios (a
1
, un
2
Y una
3
), Una transmembrana
secuencia (TM), una cola citoplsmica (CY), y
una regin no traducida 3 (3 UTR). El tres
dominios extracelulares son cada codificada
esencialmente por un solo exn. La muy pequea
5 UTR no se muestra. (B) La clase I HLA pesada
grupo de genes de cadena se encuentra en 6p21.3 y
comprende aproximadamente 20 genes. Incluyen seis
los genes expresados (cajas azules llenos), cuatro
De larga duracin pseudogenes no procesados
(Cajas abiertas largo rojo etiquetados y), y una
variedad de copias de genes parciales (corto rojo abierto
cajas etiquetadas 1-7). Algunos de estos ltimos son
truncado en el extremo 5 (por ejemplo, 1, 3, 5, y 6),
algunos estn truncados en el extremo 3 (por ejemplo, 7), y
algunos contienen exones individuales (por ejemplo, 2 y 4).
Genes que codifican protenas
pgina 20
TTTTTN
norte
AAAAAN
norte
TTTTTN
norte
5
3
Figura 9.12 pseudogenesprocesados
y retrogenes se originan por la inversa
transcripcin a partir de transcritos de ARN.
(A) En este ejemplo, un gen que codifica la protena
con tres exones (E1-E3) se transcribe a partir
un promotor aguas arriba (P), y son intrones
extirpados de la transcripcin para producir un ARNm.
El ARNm se puede convertir entonces naturalmente
en un ADNc de una sola cadena antisentido por
utilizando la funcin de la transcriptasa inversa celular
(Proporcionado por LINE-1 repite). (B) Integracin
del ADNc se prev en escalonada
descansos (indicadas por las flechas rizado) en A-rica
secuencias, pero podran ser asistidos por el
LINE-1 endonucleasa. Si la secuencia A-rica
se incluye en un voladizo 5 , se podra formar
un hbrido con el extremo distal de la poli (T)
del ADNc, facilitando segunda hebra
sntesis. Debido a las pausas escalonadas
durante la integracin, la secuencia insertada
ser flanqueado por repeticiones directas cortas
(Secuencias en caja).
TABLA 9.8 EJEMPLOS DE HUMANO intronless retrogenes Y SUS
PADRES homlogos INTRON CONTAINING
retrogene
Intrn que contiene homlogo
Producto
GK2 en 4q13
GK1 en Xp21
glicerol quinasa
PDHA2 en 4q22
PDHA1 en Xp22
piruvato deshidrogenasa
PGK2 en 6p12
PGK en Xq13
fosfoglicerato quinasa
TAF1L en 9p13
TAF1 en Xq13
caja TATA de unin al factor protena asociada, 250 kD
MYCL1 en 1p34
MYCL2 en Xq22
homlogo de oncogn v-Myc
GLUD1 en 10q23
GLUD2 en Xq25
glutamato deshidrogenasa
RBMXL en 9p13
RBMX en Xq26
ARN-protena de unin importante en el desarrollo del cerebro
pgina 21
275
Sabemos desde hace muchas dcadas que diversas clases ncRNA ubicuas son
esencial para la funcin celular. Hasta hace poco, sin embargo, hemos sido en
gran parte acosbrado a pensar en NcRNA como no mucho ms que una serie de accesorios que
son
necesaria para procesar los genes para producir protenas. ARN de transferencia
son necesarios en el muy
el final de la va, que sirve para decodificar los codones en el ARNm y
proporcionar amino
cidos en el orden en que son necesarias para su insercin en cadenas de
polipptido en crecimiento.
ARN ribosomal son componentes esenciales de los ribosomas, el complejo
ribosoma
fbricas de nucleoprotena de la sntesis de protenas.
Se conocen otros ncRNAs ubicuos para funcionar ms arriba en la va de
garantizar el trabajo de los precursores de ARNm, ARNr, ARNt y. Varios
ARN pequeos son componentes de ribonucleoprotenas complejos involucrados
en diferentes
reacciones de procesamiento, incluyendo corte y empalme, la escisin de rRNA y
tRNA precursores,
y las modificaciones de base que son necesarios para la maduracin del
ARN. Normalmente, estos
ARN funcionan como gua RNAs , por apareamiento de bases con secuencias
complementarias en el
ARN precursor.
Tambin hemos sido siempre consciente de algunas ncRNAs que tienen otras
funciones, tales
como ARN implicados en la inactivacin del cromosoma X y la impresin, y el
componente ARN de
la ribonucleoprotena telomerasa necesaria para la sntesis del ADN de los
telmeros
(Vase la Figura 2.13). Pero estos ARN parecan haber excepciones peculiares.
En la ltima dcada ms o menos, sin embargo, no ha habido una revolucin en
la forma en que vemos
RNA. Muchos miles de diferentes ncRNAs se han identificado recientemente en
aniLas clulas mal. Muchos de ellos estn regulados por el desarrollo y se ha
demostrado que
tienen un papel crucial en toda una variedad de diferentes procesos que ocurren
en especialzados tejidos o etapas especficas del desarrollo. Varios ncRNAs ya han sido
implicado en el cncer y la enfermedad gentica.
Ahora que el genoma humano se sabe que tiene cerca de 20.000 codificacin de
protenas
genes, casi lo mismo que en el de 1 mm nematodo Caenorhabditis elegans , que
slo alrededor de 1000 tiene clulas que la pregunta ahora es si la regulacin
basada en el ARN es
la caracterstica clave en la explicacin de nuestra complejidad. Ciertamente, la
complejidad de ARN
la regulacin de genes basado aumenta notablemente en organismos complejos,
como se describe
en el Captulo 10. Tal vez es hora para ver el genoma ms como una mquina de
ARN
que una simple mquina de protenas.
Las protenas no pueden auto-replicarse, y as muchos genetistas evolutivos
considerar que autocataltico
cidos nucleicos deben haber protenas son anteriores y fueron capaces de
replicarse sin la ayuda de
protenas. La hiptesis del mundo de ARN desarrollado a partir de las ideas
propuestas por Alexander Rich y
Carl Woese en la dcada de 1960. Se imagina que el ARN tena un doble papel en
las primeras etapas de la vida, actuando
ya que tanto el material gentico (con la capacidad de auto-replicacin) y
tambin como molculas efectoras.
Ambas funciones son hoy todava evidente: algunos virus tienen genomas de
ARN y ARN no codificante molculas
puede funcionar como molculas efectoras con actividad cataltica. ARNasa P,
por ejemplo, es una ribozima que
puede escindir ARN sustrato sin ningn requisito para la protena, y ciertos tipos
de intrn
son autocataltico y capaz de empalmar a salir de las transcripciones de ARN sin
la ayuda de
protenas (ver texto). Otra observacin consistente con ARN de ser el primer
cido nucleico es que
desoxirribonucletidos se sintetizan a partir ribonucletidos en vas celulares.
Adems de almacenar informacin gentica, el ARN se ha imaginado que se han
utilizado
posteriormente para sintetizar protenas a partir de aminocidos. Diferentes ARN,
incluyendo rRNA y
tRNA, son esenciales para ayudar a la sntesis de polipptidos. Muchas protenas
ribosomales se pueden eliminar
sin afectar la funcin del ribosoma, y la actividad de la peptidil transferasa
fundamental enzima
que cataliza la formacin de pptidos bonos es una ribozima. Sin embargo, el
ARN tiene una bastante rgido
columna vertebral y por tanto no se adapta muy bien como una molcula
efectora. Las protenas son mucho ms flexibles
y tambin ofrecen variedad ms funcional ya que los 20 aminocidos pueden
tener muy diferentes
estructuras y ofrecer ms posibilidades de combinacin de secuencia (un
decapptido proporciona 20
10
o alrededor
10
13
diferentes secuencias de aminocidos posibles, mientras que un decanucleotide
tiene 4
10
o alrededor de 10
6
diferentes secuencias posibles).
La sustitucin de ARN con ADN como una molcula de almacenamiento de
informacin proporcionado significativa
ventajas. ADN es mucho ms estable que el ARN, y as es ms adecuado para
esta tarea. su azcar
5
3
3
gen 1
gen 2
gen 4
gen 3
adelante
hebra
transcripciones
marcha atrs
hebra
transcripciones
anotado exones
novedosas alquitranes
5
(UN)
(SEGUNDO)
3
3
5
5
3
3
5
ARNs cortos
ARNs cortos
ARNs cortos
antisentido
ncRNA
antisentido
ncRNA
ARNs cortos
ARNsno
ncRNA
miARN
que codifica la protena RNA
Figura 1 difuminacindeloslmitesdegenesaniveldetranscripcin. Enel
pasado,loscuatrogenes
en la parte superior sera de esperar que se comporten como unidades discretas
que no se solapan de transcripcin.
277
La figura 9.13 daunaperspectivamodernasobreladiversidadfuncionalde
ARN. En
esta seccin se consideran las funciones de genes y las organizaciones de los
diferentes
clases de ARN humano ( Tabla9.9 ). Numerosas bases de datos se han
desarrollado
recientemente para documentar datos sobre ncRNAs ( Tabla9.10 ).
Ms de 1000 genes humanos codifican un rRNA o tRNA, la mayora
dentro de grandes grupos de genes
los genes del RNA ribosomal
Adems de las dos molculas de ARNr mitocondrial (12S y 16S rRNA), hay
cuatro tipos de citoplsmico rRNA, tres asociados con el gran ribosoma subunidad (28S, 5.8S y 5S rRNAs) y otro con la subunidad pequea del ribosoma
(18S
rRNA). Los genes 5S rRNA se producen en pequeos grupos de genes, siendo la
ms grande de un clster
de 16 genes en el cromosoma 1q42, cerca del telmero. Slo unos pocos 5S
rRNA
los genes se han validado como funcional, y hay muchos dispersa
pseudogenes.
Las 28S, 5.8S y 18S ARNr estn codificados por un solo transcripcin multigenic
unidad (ver Figura 1.22) que se repite en tndem para formar tamao de
megabases
ADN ribosomal matrices (alrededor de 30-40 repeticiones en tndem, o
aproximadamente 100 genes rRNA)
en los brazos cortos de cada uno de los cromosomas acrocntricos humanos 13,
14, 15, 21,
y 22. No sabemos el nmero de genes precisos debido a que el ADN ribosomal
arrays fueron excluidos del Proyecto Genoma Humano, como resultado de la
tcnica
dificultades en la obtencin de cal de pedido inequvoca de la superposicin de
clones de ADN para
regiones largas compuestas de repeticiones en tndem muy similares.
protena
sntesis
y exportacin
ARN
maduracin
escote
base
modificacin
ARNm
snRNA
rRNA
ARNt
ARN 7SL
ADN
sntesis
gene
regulacin
general
transcripcin
regulacin
TERC
Y ARN
transposn
controlar
piRNA
endo-siRNA
RNasa
MRP
empalme
RNasa P
de pre-tRNA
scaRNA
de snRNA
ARNsno
de rRNA
RNasa MRP
U1 snRNA
U2 snRNA
basado en RNAi
silenciamiento gnico
miARN
ARNs largos como
trans -actuando
reguladores
AIRE CALIENTE
ARN largos en
cis -antisense
regulacin
TSIX
especfico
empalme
regulador
HBII-52
ARNsno
AIRE
endo-siRNA
epigentica
gene
regulacin
XIST
H19
HBII-85
ARNsno
ARN SRA1
ARN 7SK
de pre-rRNA
Figura 9.13 LadiversidadfuncionaldeARN. VariosARNubicuosfuncionar
ensusactividadesdelimpiezaenlasclulasyenlasntesisdeprotenas
y exportacin de protenas a partir de clulas (usando 7SL ARN, el componente
ARN de la partcula de reconocimiento de seal). ARN implicados en el ARN
la maduracin incluyen spliceosomal pequeos ARN nucleares (snARN),
pequeos RNAs nucleolar (snoRNAs), pequeos RNAs cuerpo Cajal (scaRNAs),
y dos ribonucleasas de ARN. la sntesis de ADN de los telmeros se lleva a cabo
por una ribonucleoprotena que consiste de TERC (el ARN de telomerasa
componente) y una transcriptasa inversa (vase la Figura 2.13). La familia Y
RNA estn implicadas en la replicacin del ADN cromosmico, y RNasa
MRP tiene un papel crucial en la iniciacin de la replicacin del ADNmt, as
como en la escisin de precursores de pre-rRNA en el nucleolo. Diversas clases
de
ARN tienen una funcin reguladora en la expresin gnica. Aunque algunos
tienen funciones accesorias generales en la transcripcin, reguladora
ARN a menudo se componen en su expresin a determinados tipos de clulas y /
o etapas de desarrollo. Tres clases de pequeos ARN uso de ARN
de interferencia (RNAi), los caminos para actuar como reguladores: Piwi ARNprotena interaccin (piRNAs) regulan la actividad de los transposones en
Las clulas de la lnea germinal; microARN (miARN) regulan la expresin de los
genes diana; y corto de interferencia ARN endgenos (endo-siRNAs)
actuar como reguladores de genes y tambin regular algunos tipos de
transposn. Algunos miembros de la familia, tales como ARNsno HBII-85,
ARNsno
estn implicados en la regulacin epigentica de los genes. Un gran nmero de
ARNs largos estn involucrados en la regulacin de varios genes, a menudo en el
nivel de la transcripcin. Algunos se sabe que estn implicados en la regulacin
epigentica de los genes en la impronta, X-inactivacin, y as
sucesivamente. ARN
familias se muestran en tipo negro; ARNs individuales se muestran en rojo.
genes de ARN
pgina 24
278
TABLA 9.9 clases principales de ARN no codificante HUMANO
clase de ARN
o subclase
evolutivo/
funcional
subfamilia
No. de
diferente
tipos
Funcin
organizacin de genes, la biognesis, etc.
ribosomal
RNA (rRNA),
120-5000
nucletidos
12S rRNA, 16S rRNA
1 de cada
componentes de los ribosomas mitocondriales
escindido a partir de transcritos producidos multignicas
por H hebra de ADN mitocondrial (Figura 9.3)
5S rRNA, 5.8S rRNA,
18S rRNA, 28S rRNA
1 de cada
componentes de los ribosomas citoplasmticos
5S rRNA es codificada por mltiples genes en
varios grupos de genes; 5.8S, 18S, y 28S
rRNA se escinden de transcripciones multignicas
(Figura 1.22); los multigenic 5.8S-18S-28S
unidades de transcripcin se repiten en tndem en
cada uno de 13p, 14p, 15p, 21p, 22p y (= ADNr
clusters)
Transferir
RNA (tRNA),
70-80
nucletidos
familia mitocondrial
22
decodificar ARNm mitocondrial para hacer 13
protenas en los ribosomas mitocondriales
los genes de una sola copia. tRNAs se escinden de
279
Transferir genes de ARN
Las 22 ARNt mitocondriales diferentes son hechas por 22 genes de ARNt en el
ADNmt. los
listas de bases de datos genmica tRNA ms de 500 genes de ARNt humanos que
hacen que un cytoplasARNt micrfono con una especificidad definida anticodn. Los genes se pueden
clasificar en 49
89 persona
racimos
> 15.000
menudo derivado de repeticiones; expresada
slo en las clulas de la lnea germinal, donde
limitar el exceso de actividad transposn
89 grandes grupos distribuidos en todo el genoma;
grupos individuales se extienden a partir de 10 kb a 75 kb
con un promedio de 170 piRNAs por racimo
Endgeno
de interferencia corto
RNA (endosiRNA), 21-22
nucletidos
muchos
probablemente
mas que
10.000
un
menudo derivado de pseudogenes,
repeticiones invertidas, etc .; envuelto en
la regulacin de genes en las clulas somticas y
tambin pueden estar involucrados en la regulacin de
algunos tipos de transposn
racimos en muchos lugares en el genoma
de largo no codificante
ARN regulador,
a menudo> 1 kb
muchos
> 3000
involucrados en la regulacin del gen
expresin; Algunos estn involucrados
en la expresin monoallelic
(X-inactivacin, imprinting), y / o como
reguladores antisentido (Tabla 9.11)
por lo general copias de genes individuales; transcripciones menudo
someterse a la limitacin, de empalme y de poliadenilacin
pero ARN antisentido son tpicamente reguladores largo
transcripciones que no sean objeto de empalme
un
Basndose en la extrapolacin de estudios en clulas de ratn.
genes de ARN
pgina 26
Codones no glicina en cajas de cuatro codones. Cajas de cuatro codones son
aquellos en los que U, C, A, G y
en la tercera, bamboleo, posicin todos codifican el mismo aminocido. Aqu la
posicin de oscilacin T / C
es decodificada por un adenosina modificados qumicamente, conocida como la
inosina, en el 5 posicin en el
anticodn (cajas sombreadas azules; vase la figura 11.31 para la estructura de la
inosina). inosina puede
par de bases con A, C, o U. Por ejemplo, en la parte inferior izquierda, los
GU U y GU C codones de la
cuadro de valina de cuatro codn se decodifican por un ARNt con un anticodn
de A AC, que es sin duda
modificado para I AC. El I anticodn de CA puede reconocer cada uno de
GU U , GU C , y GU A . Para evitar
posible interpretacin errnea de la traduccin, ARNt con inosina en los
extremos 5 base del anticodn no puede
ser utilizado en cajas de dos codones.
UUU
AAA NVND
GAA 12
UUA
UAA 7
UUG
CAA 7
Phe
Leu
UCU
11 AGA
UCC
GGA UCA
UGA 5
UCG
CGA 4
Ser
UAU
AUA 1
UAC
GUA 14
UAA
UUA UAG
CUA Tyr
detener
detener
UG
ACA UGC
ACG 30
UGA
UCA - (3)
UGG
CCA 9
Cys
detener
Trp
CUU
AAG 12
CUC
GAG CUA
UAG 3
CUG
CAG 10
Leu
CCU
AGG 10
CCC
GGG CCA
UGG 7
CCG
CGG 4
Pro
CAU
a AUG CAC
GUG 11
CAA
UUG 11
CAG
CUG 20
Su
gln
UGE
ACG 7
CGC
GCG CGA
UCG 6
CGG
CCG 4
Arg
AUU
AAU 14
AUC
GAU 3
AUA
UAU 5
AGOSTO
CAU 20
Ile
Reuni
ACU
AGU 10
ACC
GGU ACA
UG 6
ACG
UGE 6
Thr
AAU
AUU 2
AAC
GUU 32
AAA
UUU 16
AAG
CUU 17
Asn
Lys
AGU
ACU AGC
GCU 8
AGA
UCU 6
AGG
CCU 5
Ser
Arg
GUU
AAC 11
GUC
GAC GUA
UAC 5
GUG
CAC 16
Val
GCU
AGC 29
GCC
GGC GCA
UGC 9
GCG
CGC 5
Ala
GAU
ABC GAC
GUC 19
GAA
NVND 13
MORDAZA
13 CUC
spid
Glu
GGU
ACC GGC
15 GCC
GGA
UCC 9
GGG
CCC 7
Gly
Figura 1 Msde500diferentehumana
ARNt citoplasmticos decodificar los 61
los codones que especifican el 20 estndar
aminocidos. Las relaciones entre
los 64 codones posibles (posicionado prximo
a los aminocidos de la izquierda de los cuatro
principales columnas) y la correspondiente
anticodones (a la derecha de los cuatro
columnas) se muestran. El nmero al lado de
cada anticodn es el nmero de diferentes
281
ARNsn molculas se unen diversas protenas y funcionan como
ribonucleoprotenas
(SnRNPs).
Posteriormente, varios snARNs, entre ellos algunos de los primeros en
clasificarse,
se encontr que estar involucrados en el procesamiento post-transcripcional de
precursores rRNA
en el nuclolo; Por lo tanto, se re-clasificados como pequeos ARN nucleolar
( SnoRNAs ), por ejemplo U3 y U8 snoRNAs. Ms recientemente, miembros de
la
las clases se ha basado en la clasificacin estructural y funcional.
Un tercer grupo de pequeos RNAs han sido identificados pero que se asemejan
a snoRNAs
se limitan a los rganos Cajal (tambin llamados cuerpos en espiral ), estructura
nuclear discreta
U6atac snRNA
Estructura
vase la Figura 9.14A
vase la Figura 9.14B
transcrito por
ARN polimerasa II
ARN polimerasa III
protenas del ncleo Bound
protenas Sm (SMB, SmD1, SmD2, SmD3, SME, SMF, por SMG)
siete LSM protenas (LSM2-LSM8)
Ubicacin
sintetizado en el ncleo y luego se exporta a la
citoplasma, donde cada uno de ellos asociado con siete Sm
protenas y someterse a 5 3 y procesamiento final; luego
re-importados en el ncleo para someterse a ms de ARN
procesamiento de los rganos Cajal, antes de acumular en
motas para llevar a cabo la funcin spliceosomal
nunca deje el ncleo; someterse a la maduracin in
el nucleolo y luego se acumulan en motas a
realizar la funcin de spliceosomal
nucletidos especfica del sitio
modificacin
realizado por scaRNAs en los cuerpos de Cajal del ncleo
realizado por snoRNAs en el nuclolo
un
Aunque no es un spliceosomal snRNA, U7 snRNA tiene una estructura similar a
la clase Sm de ARNsn y cinco de sus siete protenas del ncleo son idnticas al
ncleo
protenas unidas por el Sm snARNs.
CH
3
CH
3
CH
3
OCH
3
GpppApNp
AAUUUUUGG
consenso
(UN)
El sitio Sm
3 madre
TMG tope
CH
3
pppGp
UUUUU
(SEGUNDO)
El sitio de LSM
3 madre
casquillo MPG
Figura 9.14 EstructurasdetipoSmysnARNsspliceosomaldetipoLSM.
De tipo Sm (A) snARNs contienen tres elementos de reconocimiento
importantes: una
5 -trimethylguanosine (TMG) gorra, un sitio de unin a protenas Sm (Sm
sitio), y
una estructura de tallo-bucle 3 . Se requieren el sitio Sm y los 3 elementos
madre
para el reconocimiento por el complejo de la supervivencia de las neuronas
motoras (SMN) para el montaje
en ribonucleoprotenas bsicas estables (RNPs). El consenso sitio Sm dirige el
montaje de un anillo de las siete protenas Sm bsicos (vase el cuadro 9.10). El
TMG tope
y se requieren las protenas del ncleo Sm reunidos para el reconocimiento por el
nucleares
maquinaria de importacin. (B) de tipo snARNs Lsm contienen un 5
-monomethylphosphate
guanosina (MPG) gorra y un vstago 3 , y terminan en un tramo de uridina
residuos (el sitio LSM) que est obligado por las siete protenas del ncleo LSM.
genes de ARN
pgina 28
genes que se transcriben ms grandes por la ARN polimerasa II. Estos snoRNAs
son proproducida por el procesamiento del ARN intrnica, por lo que la regulacin de su
sntesis
est acoplado a la del gen de acogida. Muchos genes snoRNA se dispersan de
una sola copia
genes. Otros se producen en racimos. Por ejemplo, la gran estampar SNURFSNRPN
unidad de transcripcin en el 15q12 contiene seis tipos diferentes de casilla C / D
del gen snoRNA,
dos de los cuales estn presentes en grandes grupos de genes: uno contiene
aproximadamente 45 casi
idnticos genes HBII-52 snoRNA y los otros 29 genes HBII-85 snoRNA (vase
Figura 11.22).
La mayora de los snoRNAs se expresan de forma ubicua, pero algunos son de
tejidos especficos. por
ejemplo, los seis tipos de gen snoRNA dentro de la SNURF-SNRPN transcripcin
la unidad se expresa predominantemente en el cerebro de slo el cromosoma
paterno
(UN)
(SEGUNDO)
GRAMO
GRAMO
UN
UN
T
T
R
norte
un
un
gramo
gramo
gramo
u
u
u
u
do
GRAMO
UN
T
do
metro
metro
P
gorra
OH
P
gorra
la casilla D
la casilla D
5
5
5
3
3
3
casilla C
casilla C
Nueva York
Nueva York
Anann
H cuadro
ACANNN
OH
cuadro de ACA
Figura 9.15 Estructurayfuncinde
snoRNAs. (A) / D cuadro snoRNAs gua C
- 2 O modificaciones metilacin. La caja
C y D y motivos a 5 , 3 -terminal
STEM formada por el apareamiento de bases intrastrand
(Que se muestra como una serie de roja horizontal corta
lneas) constituyen un motivo estructural al retorcimiento su vez
que est especficamente reconocido por la
15,5 kD snoRNP. El C y D cajas
representar interna, con frecuencia imperfecta
copias de las cajas C y D. C / caja de D
snoRNAs y sus ARN de substrato forman una
10 a 21 pb de doble hlice en la que el objetivo
residuo a ser metilado (que se muestra aqu por
la letra m en un crculo) se coloca exactamente
283
15. algunas funciones no estndar se conocen ni esperan para algunos genes
snoRNA
que no tienen secuencias complementarias a las secuencias de rRNA. Por
ejemplo, el
HBII-52 snoRNA tiene una secuencia de 18 nucletidos que es perfectamente
complementaria
a una secuencia dentro de la HTR2C gen (serotonina 2c receptor) en XP24, y
regula splicing alternativo de este gen. Los vecinos HBII-85 snoRNAs
recientemente han sido implicados en la patognesis del sndrome de PraderWilli
(OMIM 176270).
genes de ARN pequeo cuerpo Cajal
Los scaRNAs asemejan snoRNAs y realizan una funcin similar en la
maduracin del ARN,
pero sus objetivos son snARNs spliceosomal y realizan modifica- especfica del
sitio
cationes de precursores snRNA spliceosomal en los rganos de Cajal del ncleo.
Hay por lo menos 25 genes humanos, cada especificacin de un tipo de
scaRNA. Me gusta
snoRNA genes, los genes scaRNA se encuentran normalmente dentro de los
intrones de los genes
transcrito por la ARN polimerasa II.
pgina 30
poli (A)
gorra
poli (A)
gorra
poli (A)
ADN
ARN degradado
activada RISC
Hace + Otros
protenas RISC
RITS activados
Hace + Otros
protenas RITS
DNMT
HMT
metilacin de las histonas
la metilacin del ADN
la transcripcin reprimidos
pgina 31
285
ARN pol II
compleja RNASEN
complejo Dicer
compleja ARGONAUTE
gorra
poli (A)
pri-miARN
pre-miARN
pre-miARN
dplex miARN
miARN
ncleo
MIR
(UN)
citoplasma
un grupo miARN y se escinde de un multi-miARN transcripcin comn
unidad ( Figura9.17A ). Otra clase de genes miARN formar parte de un
compuesto
unidad de transcripcin que se dedica a hacer otros productos, adems de
miARN, o bien otro tipo de NcRNA (Figura 9.17B) o una protena (Figura
9.17C).
gramo
u
do
do
do
un
gramo
un
u
do
u
pri-miARN
u caaguaa ccaggauaggcu gu
GCA guucauu gguucuaucc ggua
gramo
California
gramo
gramo
u
do
do
do
un
u
do
u
pre-miARN
u ccaggauaggcu caaguaa
uucaaguaauccaggauaggcu
5
3
3
5
GCA guucauu gguucuaucc
u
do
u
dplex miARN
miARN
compleja RNASEN
complejo Dicer
compleja ARGONAUTE
genes de ARN
Figura 9.16 miARNhumanosntesis. (A)Esquemageneral.Eltranscrito
primario,primiARN,tieneunatapa5
(metro
7
GpppG) y una cola 3 poli (A). precursores miARN tienen un prominente
estructura de doble cadena de ARN (ARN
horquilla), y el procesamiento se produce a travs de las acciones de una serie de
complejos de ribonucleasa. En el ncleo,
Rnasen, el homlogo humano de Drosha, escinde el pri-miARN para liberar el
ARN de horquilla (pre-miARN); esta
a continuacin, se exporta al citoplasma, donde se escinde por la enzima Dicer
para producir un dplex miARN.
El ARN dplex est unido por un complejo Argonaute y la hlice se desenrolla,
con lo cual una hebra (el
de pasajeros ) es degradada por la ribonucleasa Argonaute, dejando el miARN
maduro (la hebra gua ) unido
a Argonaute. MIR, genes miARN. (B) Un ejemplo concreto: la sntesis de miR26A1 humano. repeticiones invertidas
(Muestran como secuencias resaltados overlined por flechas largas) en el primiARN se someten emparejamiento de bases para formar
una horquilla, por lo general con unos pocos desajustes. Las secuencias que van a
formar la hebra gua madura se muestran en la
rojo; las de la hebra de pasajeros aparecen en azul. La escisin por tanto la
Drosha y Dicer humana (verde
flechas) es normalmente asimtrica, dejando un dplex de ARN con
sobresaliendo por 3 dinucletidos.
pgina 32
287
Ms de 3000 genes humanos sintetizan una amplia variedad de
medianas a grandes ARN regulador
Muchos miles de diferente largo ncRNAs, a menudo muchos kilobases de
longitud, son
Tambin cree que tienen un papel regulador en las clulas animales. Incluyen
antisentido transcripts que por lo general no se someten a corte y empalme y que pueden regular
la superposicin
transcripciones sentido, adems de una amplia variedad de largos ncRNAs
mRNA similar a que se someten
nivelacin, corte y empalme y poliadenilacin, pero no parecen codificar
cualquier considerable
polipptido, aunque algunos contienen ncRNAs internos tales como snoRNAs y
piRNAs. Las funciones de la gran mayora de la ARNm como ncRNAs son
desconocido. Algunos, sin embargo, son conocidos por ser especfica de tejido y
que participan en el gen
regulacin. Recientemente, en un esfuerzo sistemtico para identificar ncRNAs
largos, 3300 diferente
ncRNAs largos humanos fueron identificados como la asociacin con la
cromatina modificacin
complejos, lo que afecta la expresin gnica.
Algunos ncRNAs largo de ARNm-como que estn implicados en la regulacin
epigentica tienen
sido ampliamente estudiado. El XIST gen codifica una larga NcRNA que regula
inactivacin del cromosoma X, el proceso bywhich uno de los dos cromosomas
X
se selecciona al azar para ser condensado en mamferos hembras, con grandes
regiones
convertirse en transcripcionalmente inactiva. Muchos otros ncRNAs largos,
como el H19
ARN, estn implicados en la represin de la transcripcin de cualquiera de los
paterno o
metilacin
(En mamferos)
histona
modificaciones
Figura 9.18 transposnbasadoenpiRNA
silenciamiento en clulas animales. (A) primaria
piRNAs (po-protenas que interaccionan con los ARN) son
24-31 nucletidos de longitud y son procesados
a partir de precursores de ARN transcritos largos
de loci llamados cmulos Pirna definidos.
Cualquier transposn insertado en el reverso
la orientacin de la agrupacin piRNA puede dar lugar
a piRNAs antisentido (en rojo).
(B) piRNAs antisentido se incorporan en
una protena po y directa su actividad en la mquina de cortar
transcripciones sentido transposn. La escisin 3
el producto est obligado por otra protena po
y se recorta al tamao piRNA. Este sentido piRNA
est, a su vez, se utiliza para escindir clster piRNA
transcripciones y para generar ms antisentido
piRNAs. (C) antisentido piRNAs objetivo del po
complejos a cDNA para la metilacin del ADN
(Izquierda) y / o modificacin de las histonas (derecha).
DNMT, metiltransferasa de ADN; HMT, histona
metiltransferasa; HP1, heterocromatina
1. protena [De Girard A & Hannon GJ (2007)
Trends Cell Biol . 18, 136-148. Con permiso
de Elsevier.]
genes de ARN
pgina 34
res, pero uno de ellos, de aire caliente, se encontr que era un trans reguladoractuando (vase la tabla
9,12).
Algunos de los ARN funcionales, tales como XIST y aire, que no han sido tan
bien
conservado durante la evolucin. Las secuencias funcionales de mayor evolucin
en el
genoma humano incluye componentes de ncRNAs largos primates especficos
que son
fuertemente expresado en el cerebro. Consideramos las implicaciones evolutivas
de tales
genes en el captulo 10.
**
**
**
yA
yA
UN
yA
5
horquilla
UN
+
jugador
21-nucletido
siRNA
RISC
mRNA divisin
duplicacin
y
inversin
duplicacin
retrotransposicin
ARN
ARNm
transcrito antisentido
5
5
ncleo
citoplasma
TSIX
37.0 kb
Xq13
1 exn
regulador antisentido de XIST
H19
2.3 kb
11p15
5 exones que abarcan 2,67 kb
involucrado en la impronta en el 11p15 clster impresa
asociado con el sndrome de Beckwith-Wiedemann
KCNQTOT1 (= LIT1)
59.5 kb
11p15
1 exn
regulador de antisentido en el clster impreso en 11p15
PEG3
1,8 kb
un
19q13
nmero variable de exones, pero
hasta 9 exones que abarcan 25 kb
maternalmente impreso y se sabe que la funcin de tumor
supresin por p53 activacin
AIRE CALIENTE
2.2 kb
12q13
6 exones que abarca 6,3 kb
trans gen regulador-actuando; aunque parte de una
regin reguladora en el HOX-C clster en 12q13, HOTAIR
RNA reprime la transcripcin de una regin 40 kb en el
HOX-D grupo en el cromosoma 2q31
un
isoformas mayores.
pgina 35
289
9.4 de ADN altamente repetitivas: HETEROCROMATINA
Y repite transposn
Los genes contienen algunas secuencias repetitivas de ADN, incluyendo el ADN
de codificacin repetitiva.
Tamao o secuencia de
unidad de repeticin
localizacin cromosmica Major (s)
ADN satlite
segundo
a menudo cientos de
kilobases
asociado con la heterocromatina
un (ADN alfoide)
171 pb
heterocromatina centromrica de todos los cromosomas
b ( Sau familia 3A)
68 pb
en particular, la heterocromatina centromrica de 1, 9, 13, 14, 15,
21, 22, e Y
satlite 1
25-48 pb (rica en AT)
heterocromatina centromrica de la mayora de los cromosomas y
otras regiones heterocromatnicas
satlite 2
formas divergentes de
ATTCC / GGAAT
la mayora de, posiblemente todos, cromosomas
satlite 3
ATTCC / GGAAT
13p, 14p, 15p, 21p, 22p, y heterocromatina en 1q, 9Q,
y Yq12
DYZ19
125 kb bp400 en Yq11
DYZ2
Rica en AT
Yq12; mayor periodicidad de 2470 pb
ADN minisatlite
0,1-20 kb
en o cerca de los telmeros de todos los cromosomas
minisatlite telomrica
TTAGGG
todos los telmeros
minisatlites hipervariables
9-64 pb
todos los cromosomas, asociados a la eucromatina, sobre todo en
regiones sub-telomricas
ADN microsatlite
<100 pb
menudo 1-4 pb
ampliamente dispersa a lo largo de todos los cromosomas
un
La distincin entre el satlite, minisatlite, y de microsatlites se hace sobre la
base de la longitud de la matriz total, no el tamao de la unidad de repeticin.
segundo
arrays de ADN satlite que consisten en unidades de repeticin simples a menudo
tienen composiciones de base que son radicalmente diferente de la media 41% G
+C
(y por lo tanto podran ser aislados por centrifugacin en gradiente de densidad
de flotacin, cuando se diferencian a partir del ADN principal y aparecen
como satlite
bandas -de ah el nombre).
ADN altamente repetitivo: la heterocromatina como transposn REPEATS
pgina 36
entre las especies. Su funcin exacta an no est claro, aunque algunos humana
ADN satlite estn implicados en la funcin de centrmeros cuyo ADN consiste
gran parte de diversas familias de ADN satlite.
El centrmero es un dominio epigenetically definido. Su funcin es la
independencia
ent de la secuencia de ADN subyacente; en cambio, su funcin depende de su
particular
organizacin de la cromatina lar, que, una vez establecido, tiene que ser
mantenido de forma estable
a travs de mltiples divisiones celulares. De las diversas familias de ADN
satlite asociados
con centrmeros humanos, slo la de un satlite se sabe que est presente en
todos los seres humanos
centrmeros, y sus unidades de repeticin a menudo contienen un sitio de unin
para un cen- especfica
tromere protenas, CENPB. Clonado un satlite arrays se ha demostrado que las
semillas de
novo centrmeros en las clulas humanas, lo que indica que un satlite debe tener
una importancia
papel muy en funcin del centrmero.
El ADN telomrico especializada consiste en matrices de tamao medio slo
algunos
kilobases de longitud y constituye una forma de ADN minisatlite . A diferencia
del ADN satlite,
ADN minisatlite telomrica ha sido extraordinariamente conservado durante la
vertebrate evolucin y tiene un papel integral en funcin de los telmeros. Se
compone de arrays
de repeticiones en tndem de la TTAGGG hexanucleotide que son sintetizados
por el
ribonucleoprotena telomerasa (ver Figura 2.13).
repeticiones transposn derivados constituyen ms del 40% de la
genoma humano y surgi principalmente a travs de intermediarios de ARN
Casi todo el ADN no codificante repetitiva intercalada en el genoma humano es
derivados de transposones (tambin llamados elementos de transposicin ), el
ADN mvil
secuencias que pueden migrar a diferentes regiones del genoma. Cerca de 45%
de
el genoma puede ser reconocido como perteneciente a esta clase, pero gran parte
de los restantes
ing ADN nico, se debe derivar de copias de transposones antiguos que tienen
291
transposones LTR humanos
transposones LTR incluyen elemento autnomo y no autnomo similar a
retrovirus
mentos que estn flanqueadas por repeticiones terminales largas (LTR) que
contienen necesario
elementos reguladores de la transcripcin. secuencias retrovirales
endgenas contienen gag
y pol genes, que codifican una proteasa, la transcriptasa inversa, ARNasa H
inversa, y
integrasa. Por tanto, son capaces de incorporar de forma independiente. Hay tres
principales
clases de secuencia retroviral endgena humana (HERV), con un acumulado
el nmero de copias de aproximadamente 240.000, lo que representa un total de
alrededor de 4,6% de la humana
genoma (ver Figura 9.20).
Muy muchos HERVs son defectuosos, y la transposicin es extremadamente raro
durante los ltimos millones de aos. Sin embargo, el grupo muy pequeo
HERV-K
muestra la conservacin de los genes retrovirales intactos, y algunos miembros
de la HERVK10 subfamilia han sido objeto de transposicin relativamente poco durante
lucin
lucin. Elementos no autnomos similares a retrovirus carecen de la pol gen y, a
menudo tambin
la mordaza del gen (la secuencia interna de haber sido perdido por recombinacin
homloga
cin entre las LTRs flanqueantes). La familia MaLR de tales elementos
representa
casi 4%, o del genoma.
fsiles de transposones de ADN humano
transposones de ADN tienen repeticiones terminales invertidas y codifican una
transposasa que
regula la transposicin. Ellos representan cerca del 3% del genoma humano y
pueden agruparse en diferentes clases que se pueden subdividir en muchas
familias
con orgenes independientes (vase la base de datos de secuencias repetidas
Repbase en
http://www.girinst.org/repbase/index.html). Existen dos grandes familias humana
mentiras, MER1 y MER2, adems de una variedad de familias menos frecuentes
(vase la Figura 9.20).
Prcticamente todas las secuencias de transposones de ADN humano residentes
ya no estn
activo; por lo tanto son los fsiles de transposones. transposones de ADN tienden
a tener corta
otros
(Incluyendo marina, etc.)
213.000
68.000
60.000
retrovirus (transposones LTR)
familias HERV
MaLR240,000
285.000
autnomo
no autnoma
ORF1 ORF2 ( pol )
(UN)
norte
(UN)
norte
P
P
6-8 kb
100-400 pb
6-11 kb
1,5-3 kb
80 bp-3 kb
2-3 kb
LTR
LTR
LTR
LTR
gag pol (env)
(mordaza)
transposasa
Figura 9.20 transposnmamferos
familias. Slo una pequea proporcin de
miembros de cualquiera de transposn se ilustra
familias pueden ser capaces de transposicin;
muchos han perdido esa capacidad despus de
la adquisicin de mutaciones que inactivan, y muchos
son copias truncadas cortos. Las subclases de
las cuatro familias principales se enumeran, junto con
los tamaos en pares de bases. ORF, el marco de lectura abierto.
[Adaptado de Genoma Humano Internacional
AAAAAA
TTTTTT
AAAAAA
TTTTTT
UN
segundo
monmero izquierda
elemento de repeticin (B) Alu
5 UTR
3 UTR
ORF1
ORF2
(A) elemento LINE-1 repeticin
monmero derecha
32 pb
p40
endonucleasa
marcha atrs
transcriptasa
Pensilvania
Figura 9.21 ElLINE1humanayAlu
repetir elementos. (A) El 6,1 kb LINE-1
elemento tiene dos marcos de lectura abiertos: ORF1,
un marco de lectura abierto de 1 kb, codifica p40,
una protena de unin al ARN que tiene una nucleico
actividad chaperona de cidos; el 4 kb ORF2
especifica una protena con tanto endonucleasa
y revertir las actividades de la transcriptasa. UN
promotor interno bidireccional se encuentra dentro de
la regin no traducida 5 (UTR). En el
otro extremo, hay una A
norte
/T
norte
secuencia, a menudo
descrito como el 3 poli (A) de la cola (pA). los
LINE-1 endonucleasa corta una hebra de un
Dplex de ADN, preferiblemente dentro de la secuencia
TTTTA, y los usos de la transcriptasa inversa
la largada 3 finales -OH en ADNc de primera
sntesis. Nuevos sitios de insercin estn flanqueadas
293
que contiene slo una de las dos repeticiones en tndem, y varias versiones
truncadas
de dmeros y monmeros tambin son comunes, dando un promedio de todo el
genoma
230 pb.
Mientras que SINE como el MIR (mamferos de toda la repeticin intercalados)
familias
mentiras se encuentran en una amplia gama de mamferos, la familia Alu es de
comparativamente
origen evolutivo reciente y se encuentra solamente en primates. Sin embargo,
sub-Alu
familias de diferentes edades evolutivas pueden ser identificados. En el pasado 5
millones o
por lo aos desde la divergencia de los seres humanos y los simios africanos, slo
alrededor de 5000 cobre
IES de la repeticin Alu han sido objeto de transposicin; la mayora de las
secuencias Alu mviles
son miembros de las subfamilias Y y S.
Al igual que otros mamferos Sines, repeticiones Alu se origin a partir de copias
de ADNc
pequeos ARN transcritos por la ARN polimerasa III. Genes transcritos por la
ARN
polimerasa III tienen a menudo promotores internos, y as copias de ADNc de
transcripciones
llevar con ellos sus propias secuencias promotoras. Tanto la repeticin Alu y,
inde-
slo una copia del genoma nuclear mucho ms grande. Considerando que el
mitocondrial
genoma tiene algunas similitudes con los genomas de procariotas compactas, las
genoma nuclear humano es mucho ms complejo en su organizacin, con
solamente
1,1% de las protenas del genoma de codificacin y 95% que comprende
nonconserved, y
a menudo altamente repetitivo, secuencias de ADN.
La secuenciacin del genoma humano ha revelado que, contrariamente a lo
esperado,
hay relativamente pocos genes codificadores de protenas, aproximadamente
20,000-21,000 de acuerdo
ing con las estimaciones ms recientes. Estos genes varan ampliamente en
tamao e interna
organizacin, con los exones de codificacin a menudo separadas por grandes
intrones, que a menudo
contener secuencias de DNA altamente repetitivas. La distribucin de genes a
travs de la
genoma es desigual, con algunos genes relacionados funcionalmente y
estructuralmente encontrados
en grupos, lo que sugiere que surgieron por la duplicacin de genes individuales
o mayor
segmentos de ADN. Los pseudogenes se pueden formar cuando se duplica un gen
y
a continuacin, una del par acumula mutaciones deletreas, impidiendo su
expresin
sin. Surgen otras pseudogenes cuando un transcrito de ARN se transcribi de
forma inversa y
el ADNc se vuelve a insertar en el genoma.
La mayor sorpresa de la era post-genoma es el nmero y la variedad de la no
ARN codificantes de protenas transcritas del genoma humano. Al menos 85% de
la
genoma euchromatic ahora se sabe que se transcribe. El ncRNAs familiarizado
sabe que tienen un papel en la sntesis de protenas se han sumado otros que
tienen
funciones en la regulacin de genes, incluyendo varias clases prolficos de ARN
regulador diminutos
y miles de diferentes ncRNAs largos. Nuestra visin tradicional del genoma es
siendo revisada radicalmente.