You are on page 1of 35

CAPTULO

5
Protenas: Estrutura Primria
1. Diversidade Polipeptdica
2. Purificao e Anlise de Protenas
A. Introduo Purificao de Protenas
B. Solubilidade das Protenas
C. Cromatografia
D. Eletroforese
E. Ultracentrifugao
3. Seqenciamento de Protenas
A. Passos Preliminares
B. Clivagem de Polipeptdeos
C. Degradao de Edman
D. Seqenciamento por Espectrometria de
Massas
E. Reconstruo da Seqncia das Protenas
4. Evoluo das Protenas
A. Evoluo da Seqncia das Protenas
B. Duplicao de Genes e Famlias de Protenas
C. Mdulos Proticos
A grande variao estrutural e
funcional das protenas o reflexo do
nmero astronmico de possibilidades
de seqncias dos seus aminocidos
existem mais possibilidades de
seqncias de aminocidos do que
estrelas no universo. De que modo
essa diversidade pode ser avaliada
no laboratrio, e o que ela revela
acerca da relao evolutiva entre
as protenas? (PhotoDisc, Inc./Getty
Images.]
Voet_Pratt_05.indd 114 19.07.07 10:38:18
Fundamentos de Bioqumica 115
As protenas esto no centro da ao nos processos biolgicos. Praticamente todas
as transformaes moleculares que definem o metabolismo celular so mediadas
pela catlise protica. As protenas exercem tambm funes regulatrias, contro-
lando as condies intracelulares e extracelulares e mandando informaes para
outros componentes da clula. Alm disso, as protenas so componentes estrutu-
rais essenciais das clulas. Uma lista completa de funes conhecidas das prote-
nas teria milhares de tens, incluindo protenas que transportam outras molculas e
protenas que geram foras mecnicas e eletroqumicas. Uma tal lista no incluiria
milhares de protenas cujas funes ainda no esto inteiramente elucidadas ou, em
muitos casos, so mesmo completamente desconhecidas.
Uma pea-chave para decifrar a funo de uma dada protena o entendimen-
to da sua estrutura. Assim como as outras principais macromolculas biolgicas,
os cidos nuclicos (Seo 3-2) e os polissacardeos (Seo 8-2), as protenas so
polmeros formados por molculas menores. Porm, ao contrrio dos cidos nucli-
cos, as protenas no apresentam estruturas regulares e uniformes. Isso se deve, em
parte, ao fato de os 20 aminocidos dos quais as protenas so feitas apresentarem
propriedades fsicas e qumicas muito distintas (Seo 4-1C). A seqncia na qual
esses aminocidos esto enfileirados pode ser analisada diretamente , como descre-
veremos neste captulo, ou indiretamente via seqenciamento do DNA (Seo 3-4).
Em ambos os casos, a informao sobre a seqncia permite o entendimento das
propriedades fsicas e qumicas das protenas, suas relaes com outras protenas e,
finalmente, seus mecanismos de ao nos seres vivos.
1
Diversidade Polipeptdica
Do mesmo modo que todas as molculas polimricas, as protenas podem ser
descritas em termos de nveis de organizao, nesse caso, suas estruturas primria,
secundria, terciria e quaternria. A estrutura primria de uma protena consiste
na seqncia de aminocidos da sua cadeia polipeptdica ou das suas cadeias
polipeptdicas, no caso de ela ser constituda por mais de uma cadeia. Um exem-
plo de seqncia de aminocidos mostrado na Figura 5-1. Cada resduo est
ligado ao prximo por uma ligao peptdica (Figura 4-3). Os nveis mais altos
da estrutura das protenas secundrio, tercirio e quaternrio referem-se s
formas tridimensionais das cadeias polipeptdicas dobradas e sero descritos no
prximo captulo.
As protenas so sintetizadas in vivo por uma polimerizao passo a passo dos
aminocidos na ordem especificada pela seqncia de nucleotdeos em um gene.
A correspondncia direta entre um polmero linear (DNA) e outro (polipeptdeo)
ilustra a elegante simplicidade dos sistemas vivos e permite-nos extrair informaes
de um polmero e aplic-las a outro.
As Possibilidades Tericas para os Polipeptdeos So Ilimitadas. Com 20 possibilidades
disponveis para cada resduo de aminocido em uma cadeia polipeptdica, v-se
claramente que um nmero muito grande de molculas de protenas possvel. Para
uma protena de n resduos, existem 20
n
possveis seqncias. Uma molcula de
r y T a l A Asn Gly Asn Gln u e L u l G Ile Val Cys Cys u l G r e S s y C l a V r e S
21 10
Tyr Gln Leu
15 5
Cys
Cys Leu His Gln Asn Val Phe
S S
Gly His Ser Leu Val Ala Glu Leu Tyr Leu Val Cys
S
S
S
S
20 15 10
Gly Glu Arg Gly Phe Phe
25
Tyr Thr Pro Lys Ala
30 5
Cadeia B
Cadeia A
Figura 5-1 A estrutura primria da insulina bovina. Observe as ligaes dissulfeto intracadeia e intercadeia.
Voet_Pratt_05.indd 115 19.07.07 10:38:19
116 Donald Voet, Judith G. Voet, Charlotte W. Pratt
protena relativamente pequena seria uma simples cadeia polipeptdica contendo
100 resduos. Nesse caso, teramos 20
100
1,27 10
130
cadeias polipeptdicas
possveis com esse comprimento, uma quantidade bem maior do que o nmero total
estimado de tomos no universo (9 10
78
). Evidentemente, a evoluo produziu
somente uma pequena frao de todas as possibilidades tericas uma frao que,
contudo, representa um nmero astronmico de polipeptdeos diferentes ( possvel
aument-lo ainda mais no laboratrio; ver o Quadro 5-1).
Os Polipeptdeos Encontrados Esto, de Certa Forma, Limitados em Tamanho e em
Composio. Em geral, as protenas possuem pelo menos 40 resduos ou ao redor
disso; polipeptdeos menores so chamados de peptdeos. O maior polipeptdeo
conhecido a titina, de 26.926 resduos, uma protena gigante (2.990 kD), que
ajuda a arranjar a estrutura repetida das fibras musculares (Seo 28-2A). Contudo,
a maioria dos polipeptdeos contm entre 100 e 1.000 resduos (Tabela 5-1). As
protenas multissubunidades possuem vrias cadeias idnticas ou no-idnticas
chamadas de subunidades. Algumas protenas so sintetizadas em polipeptdeos
simples, que so posteriormente clivados em duas ou mais cadeias que permanecem
associadas; a insulina um exemplo disso (Figura 5-1).
A faixa de tamanho na qual a maioria dos polipeptdeos se situa provavelmente
reflete a otimizao de vrios processos bioqumicos:
1. O limite mnimo para uma cadeia polipeptdica dobrar-se em uma forma de-
finida e estvel, que lhe permita desempenhar uma funo especfica, parece
ser de 40 resduos.
2. Os polipeptdeos que contm centenas de resduos esto no limite da efici-
ncia da maquinaria de sntese de protenas. Quanto maior for o polipept-
deo (e quanto maior for seu correspondente mRNA e seu gene), maior ser
a probabilidade de introduo de erros durante a transcrio e a traduo.
O que a natureza no cria, tenta-se criar no laboratrio, pelo menos
no mbito permitido pela diversidade peptdica. Em um trabalho
pioneiro na dcada de l980, Mario Geysen mostrou que poss-
vel sintetizar quimicamente um grande nmero de oligopeptdeos
cujos resduos variam de modo sistemtico em posies seleciona-
das. Por exemplo, um hexapeptdeo sinttico pode ter a seqncia
X-X-A-B-X-X, em que X representa qualquer um dos 20 aminocidos
incorporados aleatoriamente, sendo A e B determinados. O mto-
do de Geysen para sntese de hexapeptdeos transforma uma tarefa
impossvel (sintetizar todas seqncias possveis, que resultaria em
um montante de 20
6
, ou 64 milhes, de peptdeos diferentes) em
uma tarefa possvel (sintetizar e testar 20
2
, ou 400 peptdeos). As
chamadas bibliotecas de peptdeos so, portanto, de grande valia no
desenvolvimento de novas drogas e sondas da funo de protenas.
A biblioteca de 400 hexapeptdeos pode ser rapidamente triada
para verificar as suas habilidades de se ligarem com outras mol-
culas (anticorpos, que foi o experimento original de Geysen) ou de
produzirem efeitos biolgicos. Uma seqncia X-X-A-B-X-X posi-
tiva pode, ento, tornar-se o ponto de partida para sintetizar um
novo conjunto de 400 hexapeptdeos com a seqncia X-A-Y-Z-B-X,
em que Y e Z representam os dois resduos no-variveis escolhi-
dos. claro que as bibliotecas combinacionais peptdicas no es-
to restritas aos peptdeos.
Uma seqncia extensa com atividade biolgica pode ser cons-
truda pela repetida sntese e testes. De certa forma, o qumico
explora os mesmos princpios que guiam a evoluo, porm, em
uma escala de tempo muito mais curta. As bibliotecas de peptdeos
podem conter peptdeos novos os que no aparecem na natureza
ou os que so produzidos, mas so impossveis de localizar e pu-
rificar a partir das fontes naturais.
Usando princpios similares, as bibliotecas de oligonucleotdeos
tm sido sintetizadas in vitro e seus produtos peptdicos tem sido
testados quanto a sua capacidade de ligao com outras molculas
ou de catalisar reaes qumicas. Se os oligonucleotdeos forem in-
corporados em um vetor de expresso, os oligopeptdeos correspon-
dentes podero ser sintetizados em um organismo hospedeiro apro-
priado e a desejada atividade pode ser avaliada em sistemas vivos.
As bibliotecas de oligonucleotdeos possuem a vantagem adicional
de que uma simples cpia de um oligonucleotdeo pode, posterior-
mente, ser amplificada por PCR (Seo 3-5C) e seqenciada.
Q U A D R O 5 - 1
Bibliotecas Combinatoriais
Perspectivas em Bioqumica
Voet_Pratt_05.indd 116 19.07.07 10:38:19
Fundamentos de Bioqumica 117
Alm dessas limitaes de tamanho, os polipeptdeos esto sujeitos a limita-
es mais severas na composio de aminocidos. Os 20 aminocidos-padro no
aparecem com igual freqncia nas protenas (a Tabela 4-1 relaciona a ocorrncia
mdia de cada resduo de aminocido). Por exemplo, os aminocidos mais abun-
dantes nas protenas so Leu, Ala, Gly, Ser, Val e Glu; os mais raros so Trp, Cys,
Met e His.
Pelo fato de cada resduo de aminocido possuir propriedades fsicas e qumi-
cas caractersticas, sua presena em uma dada posio em uma protena influencia
suas propriedades. Em particular, como veremos adiante, a forma tridimensional
de uma cadeia polipeptdica dobrada uma conseqncia das foras intramole-
culares entre os seus vrios resduos. Em geral, os resduos hidrofbicos de uma
protena agrupam-se em seu interior, evitando o contato com a gua, ao passo que
as suas cadeias laterais hidroflicas tendem a posicionar-se na superfcie externa
da protena.
As caractersticas de uma protena dependem mais da seqncia de amino-
cidos do que da composio de aminocidos propriamente dita, pela mesma ra-
zo que amor e seu anagrama roma so palavras bem diferentes. Alm disso,
muitas protenas no so constitudas somente de resduos de aminocidos. Elas
podem formar complexos com ons metlicos, tais como Zn
2+
e Ca
2+
, podem ligar
covalentemente ou de modo no-covalente certas molculas orgnicas e podem ser
covalentemente modificadas aps a traduo pela ligao de grupos fosfato e car-
boidrato, por exemplo.
2
Purificao e Anlise de Protenas
Felizmente, as variaes de tamanho e de composio qumica existentes entre os
polipeptdeos tornam fcil a tarefa de escolher um mtodo para separar as prote-
nas umas das outras, bem como das demais molculas biolgicas. A purificao
um passo fundamental no estudo de macromolculas, mas no necessariamente
fcil. Em geral, uma substncia que participa em menos de 0,1% do peso de um
tecido seco purificada at ~98% de pureza. A tarefa de efetuar uma purificao
dessa magnitude considerada extremamente difcil pela maioria dos qumicos.
As sees seguintes mostraro algumas das tcnicas mais comuns de purificao e,
em certo sentido, tambm de caracterizao de protenas e outras macromolculas.
Com pequenas modificaes, a maioria dessas tcnicas pode ser usada para cidos
nuclicos e para outros tipos de molculas biolgicas.
Tabela 5-1 Composies de Algumas Protenas
Resduos de Massa
Protena Aminocidos Subunidades Molecular (D)
Inibidor de proteinase III (melo) 30 1 3.427
Citocromo c (humano) 104 1 11.617
Mioglobina (cavalo) 153 1 16.951
Interferon- (coelho) 288 2 33.842
Corismato-mutase (Bacillus subtilis) 381 3 43.551
Triose-fosfato-isomerase (E. coli) 510 2 53.944
Hemoglobina (humana) 574 4 61.986
RNA-polimerase (bacterifago T7) 883 1 98.885
Nucleosdeo-difosfato-cinase 930 6 100.764
(Dictyostelium discoideum)
Piruvato-descarboxilase (levedura) 2.252 4 245.456
Glutamina-sintetase (E. coli) 5.616 12 621.264
Titina (humana) 26.926 1 2.993.428
Voet_Pratt_05.indd 117 19.07.07 10:38:19
118 Donald Voet, Judith G. Voet, Charlotte W. Pratt
A. Introduo Purificao de Protenas
A tarefa de purificar protenas presentes em baixas concentraes era muito dif-
cil, de forma que as primeiras protenas caracterizadas foram as encontradas em
abundncia e as fceis de isolar. A hemoglobina, por exemplo, que participa em
um tero da massa dos glbulos vermelhos, foi historicamente a protena mais
estudada. A maioria das enzimas que participam de processos metablicos bsicos
ou que esto envolvidas na expresso e na transmisso da informao gentica
comum a todas as espcies. Por essa razo, certa protena , com freqncia,
escolhida de certa fonte por convenincia, como tecidos de animais domsticos
ou microrganismos de fcil obteno, como E. coli e Saccharomyces cerevisiae
(levedura do fermento de po).
O desenvolvimento das tcnicas de clonagem molecular (Seo 3-5) permite o
isolamento de qualquer gene codificador de uma protena modificado genetica-
mente, se assim se desejar e sua expresso em nveis elevados em um microrga-
nismo. De fato, a protena clonada pode constituir at 40% da protena celular total
do microrganismo (Figura 5-2). Essa elevada produo de protena no microrga-
nismo torna o seu isolamento muito mais fcil do que a partir do seu organismo de
origem (no qual ele pode ocorrer em quantidades bastante reduzidas).
O primeiro passo para isolar uma protena ou outra molcula biolgica re-
mov-la da clula e coloc-la em soluo. Muitas clulas requerem um tipo de
dilaceramento mecnico para liberar seu contedo. A maioria dos procedimentos
para romper as clulas usa algum tipo de esmagamento ou moagem, seguido
por filtrao ou centrifugao para remover as partculas insolveis maiores. Se
a protena de interesse estiver fortemente associada membrana lipdica, um
detergente ou solvente orgnico poder ser usado para solubilizar os lipdeos,
liberando a protena.
Estabilizao das Protenas. Uma vez removida a protena do seu ambiente natural,
ela fica exposta a muitos agentes que podem danific-la de forma irreversvel. Tais
influncias devem ser cuidadosamente controladas em todo o processo de purifica-
o. Os seguintes fatores devem ser considerados:
1. pH. Os materiais biolgicos so rotineiramente dissolvidos em solues-
tampo com valores de pH nos quais os materiais so estveis (os tampes
so descritos na Seo 2-2C). Descuidos com esse aspecto podem causar a
desnaturao (deformao estrutural) e at mesmo a degradao qumica.
2. Temperatura. A estabilidade trmica das protenas muito variada. Embo-
ra algumas protenas sejam desnaturadas em temperaturas baixas, a maioria
desnatura em temperaturas elevadas ou, em alguns casos, em temperaturas
pouco superiores do seu ambiente natural. As purificaes de protenas
so, em geral, conduzidas a temperaturas prximas a 0C.
3. Presena de enzimas degradativas. As enzimas degradativas tambm so
liberadas sempre que so destrudos os tecidos para liberar a molcula de in-
teresse. Essas enzimas incluem as nucleases (enzimas que degradam cidos
nuclicos) e as proteases (enzimas que hidrolisam as ligaes peptdicas
das protenas). As enzimas degradativas podem ser inibidas ajustando-se o
pH ou a temperatura em valores que desativem as enzimas (desde que esses
valores no afetem de forma adversa a protena de interesse) ou pela adio
de compostos que bloqueiem sua ao de modo especfico.
4. Adsoro s superfcies. Muitas protenas so desnaturadas pelo contato
com a interface ar-gua ou com as interfaces vidro-gua ou plstico-gua.
Portanto, as solues de protena so manipuladas no sentido de minimizar
a formao de bolhas e so mantidas relativamente concentradas.
5. Armazenamento por longo tempo. Todos os fatores listados devem ser
levados em conta quando se deseja manter de forma estvel uma protena
purificada. Ademais, processos como a lenta oxidao ou a contaminao
Figura 5-2 Corpo de incluso. Um organismo gene-
ticamente modificado que produz grandes quantidades
de uma protena estranha em geral fica acumulado nos
corpos de incluso. Esta micrografia eletrnica mostra
um corpo de incluso da protena procimosina em clulas
de E. coli. (Cortesia de Teruhiko Beppu, Nikon University,
Japo.)
Voet_Pratt_05.indd 118 19.07.07 10:38:20
Fundamentos de Bioqumica 119
microbiana devem ser prevenidos. Muitas vezes, as solues de protenas
so armazenadas em atmosferas de nitrognio ou gs argnio (em vez de ar,
que contm ~2l% de O
2
) e/ou congeladas a 80C ou a 196C (temperatura
do nitrognio lquido). No entanto, algumas protenas ditas crio-lbeis so
instveis abaixo de uma temperatura caracterstica.
Ensaios de Protenas. Purificar certa substncia requer tambm um meio de detec-
t-la quantitativamente. Portanto, deve-se procurar um ensaio que seja especfico
protena de interesse, altamente sensvel e fcil de usar (em especial se ele tiver que
ser repetido a cada estgio do processo de purificao).
Entre os ensaios de protenas mais diretos esto aqueles de enzimas que catali-
sam uma reao cujos produtos so prontamente detectados, pois a taxa de forma-
o do produto proporcional quantidade de enzima presente. Substncias com
produtos coloridos ou fluorescentes tm sido desenvolvidas com esse propsito.
Na indisponibilidade de tal substncia para a enzima em processo de ensaio, o
produto da reao enzimtica pode ser convertido em uma outra substncia mais
facilmente mensurvel, e isso pode ser feito, por exemplo, pela ao de uma outra
enzima. Esse processo conhecido como reao enzimtica acoplada. As pro-
tenas que no se constituem em enzimas podem ser detectadas pela sua capacida-
de de se ligar especificamente a determinadas substncias ou de produzir efeitos
biolgicos observveis.
Os mtodos imunoqumicos esto entre as tcnicas de ensaio mais sensveis. Os
imunoensaios usam anticorpos, que so protenas produzidas pelo sistema imuno-
lgico dos animais em resposta introduo de corpos estranhos (um antgeno).
Os anticorpos, coletados do soro sangneo de um animal imunizado ou de uma
cultura de clulas imortalizadas produtoras de anticorpos, ligam-se especificamente
protena antgeno original.
Uma protena pode ser detectada em uma mistura complexa pela sua proprie-
dade de ligar-se ao seu anticorpo correspondente. Em uma das tcnicas, conhecida
como radioimunoensaio (RIE), a protena detectada indiretamente por meio da
medida do seu grau de competio com uma protena-padro marcada radioativa-
mente para ligar um anticorpo. Uma outra tcnica, o imunoensaio enzimtico ou
ELISA, possui muitas variaes, uma das quais est mostrada na Figura 5-3.
A concentrao de uma substncia em soluo pode ser medida por espectros-
copia de absorbncia. Uma soluo contendo um soluto que absorve luz o faz de
acordo com a lei de Beer-Lambert,

A log

cl
I
0

I
[5-1]
Onde A absorbncia do soluto (ou sua densidade ptica), I
0
a intensidade da
luz incidente a um dado comprimento de onda , sua intensidade de transmisso
em . o grau de absoro molar (ou coeficiente de extino molar) do soluto
em , c a sua concentrao molar, e l o comprimento do caminho da luz em cm.
O valor de varia com ; uma curva de A ou versus para o soluto denominada
espectro de absoro. Se for conhecido o valor de de uma substncia, sua con-
centrao pode ser determinada espectroscopicamente.
Substratc Substratc
lrcdutc
deteotvel
lrcdutc
deteotvel
lrlmelrc
antlocrpc
lmcblllzar c prlmelrc
antlocrpc nc supcrte
slldc
&
lnoublc ocm a
amcstra ocntendc
a prctena
'
^dlolcnar um segundc
antlocrpc que est llgadc
ocvalentemente a uma
enzlma ensalvel
(
Lavar e ensalar
a enzlma
)
Segundc
antlocrpc
lrctena
Lnzlma
Supcrte slldc
Figura 5-3 Ensaio ELISA (imunoensaio enzimtico). (1) Um anticorpo imobilizado em uma
protena de interesse em um slido inerte, como poliestireno. (2) A soluo a ser analisada apli-
cada na superfcie coberta de anticorpos. O anticorpo liga-se protena de interesse, e as demais
protenas so removidas por lavagem. (3) Faz-se a reao de uma segunda protena especfica
na qual uma enzima est ligada com o complexo protena-anticorpo, gerado na etapa ante-
rior. (4) A quantidade de complexos anticorpo-enzima medida por meio do teste da atividade da
enzima. A quantidade de substrato convertido em um produto detectvel indica a quantidade de
protena presente. Ver Figuras Animadas.
Voet_Pratt_05.indd 119 19.07.07 10:38:20
120 Donald Voet, Judith G. Voet, Charlotte W. Pratt
Os polipeptdeos absorvem fortemente na regio ultravioleta
(UV) do espectro ( = 200 a 400 nm) principalmente porque as
cadeias laterais aromticas (as de Phe, Trp e Tyr) tm coeficientes
de extino molar particularmente grandes nesta regio do espec-
tro (em torno de dezenas de milhares; Figura 5-4). No entanto, os
polipeptdeos no absorvem luz visvel ( = 400 a 800 nm), sendo,
portanto, incolores. No obstante, se uma protena possuir um cro-
mforo que absorve na regio visvel do espectro, sua absorbncia
pode ser usada para detectar a presena dessa protena em uma
mistura de protenas.
Para acompanhar a purificao de uma protena, importante
medir sua quantidade total em cada estgio do processo. A espec-
troscopia de absorbncia a 280 nm uma maneira conveniente de
faz-lo. Contudo, o fato de muitas substncias que provavelmente
estejam presentes durante o procedimento de purificao da pro-
tena (p. ex., cidos nuclicos) possurem altos graus de absoro
molar na mesma regio do espectro da protena e as propores
de resduos aromticos variarem entre as protenas faz com que as
medidas espectroscpicas na regio do UV forneam apenas esti-
mativas da quantidade de protena presente (embora possam deter-
minar precisamente a quantidade de uma protena pura de grau de
absoro molar conhecido). Alm disso, os mtodos espectroscpicos so modera-
damente sensveis para protena; eles detectam de 50 a 100 g de protena por mL.
Tm sido desenvolvidas vrias tcnicas para contornar essas dificuldades. Na
mais amplamente utilizada, o ensaio de Bradford, a ligao do corante azul bri-
lhante de Coomassie
N
CH
2
H
5
C
2
C
2
H
5
OC
2
H
5
O
3
S SO
3
Azul brilhante de Coomassie
N
CH
2
R R
NH
R250: R H
G250: R CH
3
protena em soluo cida altera a absoro mxima do corante de 465 nm para
595 nm. Desta forma, a absorbncia a 595 nm em um ensaio de Bradford fornece
uma medida direta da quantidade de protena presente. Alm disso, esse ensaio
altamente sensvel, podendo detectar 1 g de protna por mL.
Tcnicas de Separao. As protenas so purificadas por procedimentos de fra-
cionamento. Em uma srie de passos independentes, as vrias propriedades fsico-
L(nm)
E
320 300 280 260 240
Trp
Tyr
lhe
220 200
20
10
50
200
100
500
1.000
2.000
5.000
10.000
20.000
40.000
Figura 5-4 Espectro de absorbncia em UV dos trs
aminocidos aromticos: fenilalanina, triptofano e
tirosina. Note que a absorbncia molar, , est apre-
sentada em escala logartmica. (Segundo Wetlaufer, D.B.,
Adv. Prot. Chem. 7, 310 [1962].)
Voet_Pratt_05.indd 120 19.07.07 10:38:21
Fundamentos de Bioqumica 121
qumicas da protena de interesse so usadas para separ-la das demais substncias.
A idia no necessariamente minimizar as perdas da protena desejada, mas eli-
minar seletivamente os demais componentes da mistura, de forma que somente a
substncia de interesse permanea.
Provar que uma substncia pura pode ser filosoficamente impossvel. Na
prtica, a pureza estabelecida mostrando-se que a amostra contm somente um
componente, segundo os mtodos analticos disponveis. Os padres de pureza so
continuamente revisados conforme novos mtodos de separao so desenvolvidos.
A experincia tem mostrado que uma substncia pura muitas vezes mostra-se
heterognea quando submetida a uma nova tcnica de separao.
A purificao das protenas considerada mais uma arte do que uma cincia,
com muitas opes disponveis em cada etapa. Enquanto o mtodo de tentativa e erro
funcionar, conhecer algo sobre a protena-alvo (ou sobre as protenas a partir das quais
se deseja separ-la) simplifica a escolha do procedimento de separao. Algumas pro-
priedades das protenas e de outras biomolculas usadas nos vrios procedimentos de
separao so solubilidade, carga inica, volume hidrodinmico, tamanho molecular
e especificidade de ligao com outras molculas biolgicas. Algumas propriedades
das protenas e procedimentos-alvo da nossa discusso so os seguintes:
Caracterstica da Protena Procedimento de Purificao
Solubilidade Salting out
Carga inica Cromatografia de troca inica
Eletroforese
Focalizao isoeltrica
Polaridade Cromatografia de interao hidrofbica
Tamanho Cromatografia de filtrao em gel
SDS-PAGE
Ultracentrifugao
Ligao especfica Cromatografia por afinidade
B. Solubilidade das Protenas
Em funo de as protenas possurem muitos grupos carregados, sua solubilidade
depende da concentrao dos sais dissolvidos, da polaridade do solvente, do pH e
da temperatura. Algumas ou todas essas variveis podem ser manipuladas para pre-
cipitar seletivamente algumas protenas, ao passo que outras se mantm solveis.
A solubilidade de uma protena em uma soluo com baixa concentrao de
ons aumenta proporo que os sais so adicionados, fenmeno chamado de sal-
ting in. Os ons adicionados blindam as vrias cargas da protena, enfraquecendo
as foras de atrao entre as molculas individuais de protena (tais foras levam
agregao e precipitao). Contudo, na medida em que mais e mais sal adiciona-
do, principalmente sais de sulfato, a solubilidade da protena decresce novamente.
Esse efeito (chamado de salting out) basicamente resultante da competio por
molculas de gua pelo sal adicionado e por outros solutos dissolvidos. Em concen-
traes de sal muito elevadas, h tantos ons solvatados que resta pouco solvente
para dissolver as outras substncias, incluindo as protenas.
Visto que as diferentes protenas so precipitadas em diferentes concentraes
de sal, a adio de sal um dos procedimentos mais comumente usados para pu-
rificar protenas. Por precipitao, podem-se remover as protenas indesejadas de
uma mistura por meio do simples ajuste da concentrao de sal at mais ou menos
o ponto de precipitao da protena a ser purificada (Figura 5-5). Assim, aps remo-
ver por filtrao ou por centrifugao a protena precipitada, a concentrao de sal
da soluo remanescente aumentada ainda mais de forma a precipitar a protena
de interesse. Esse procedimento resulta em uma purificao e concentrao signifi-
cativa de grandes quantidades de protena. O sulfato de amnio, (NH
4
)
2
SO
4
, o sal
mais comumente usado para precipitar protenas, porque sua alta solubilidade (3,9
molar em gua a 0C) permite a precipitao em solues com elevada fora inica.
(c (b (a
lrctena
alvc
Scbrenadante
lreolpltadc
Figura 5-5 Fracionamento por salting out. (a) O sal
escolhido, com freqncia o sulfato de amnio, adicio-
nado soluo de macromolculas at uma concentrao
bem prxima do ponto de precipitao da protena de inte-
resse. (b) Aps a centrifugao, as protenas precipitadas
e no-desejadas (esferas vermelhas) so descartadas
e mais sal adicionado ao sobrenadante at uma con-
centrao suficiente para precipitar a protena desejada
(esferas verdes). (c) Aps uma segunda centrifugao, a
protena recuperada como um precipitado, e o sobrena-
dante descartado.
Voet_Pratt_05.indd 121 19.07.07 10:38:21
122 Donald Voet, Judith G. Voet, Charlotte W. Pratt
O pH pode ser ajustado at aproximadamente o ponto isoeltrico (pI) da protena
desejada, uma vez que as protenas so menos solveis quando sua carga nula. Os
pIs de algumas protenas esto listados na Tabela 5-2.
C. Cromatografia
O processo de cromatografia (do grego, chroma, cor + graphein, escrever) foi
descoberto em 1903 por Mikhail Tswett, que separou pigmentos de plantas solubi-
lizados usando adsorventes slidos. Na maioria dos procedimentos cromatogrficos
modernos, a mistura de substncias a ser fracionada dissolvida em um lquido (a
fase mvel), e ele passado atravs de uma coluna contendo uma matriz slida e
porosa (a fase estacionria). medida que os solutos fluem atravs da coluna,
eles interagem com a fase estacionria e sua eluio retardada. Tal retardamento
depende das propriedades de cada soluto. Se a coluna for comprida o suficiente,
substncias com diferentes taxas de migrao sero separadas. Os procedimentos
cromatogrficos mais teis para purificar protenas so classificados de acordo com
a natureza da interao entre a protena e a fase estacionria.
Uma das primeiras tcnicas de cromatografia usava tiras de papel-filtro como
fase estacionria, em um processo designado cromatografia de papel. Na moderna
cromatografia de coluna, usam-se derivados da celulose ou dextran (polmeros de
carboidratos) ou substncias sintticas, como a poliacrilamida com ligaes cruza-
das. A cromatografia lquida de alta performance (HPLC, do ingls high perfor-
mance liquid chromatografy) emprega sistemas automticos com aplicao precisa
da amostra, fluxos controlados em altas presses (at 5.000 psi), matriz cromato-
grfica fabricada especialmente com esferas de vidro ou de plstico, de 3 a 300 m
de dimetro, revestidas com uma camada uniforme de material cromatogrfico e
um detector de amostra em linha. Isso melhora significativamente a velocidade, a
resoluo e a reprodutibilidade da separao propriedades que so muito desejadas
quando as separaes cromatogrficas so repetidas muitas vezes, ou quando so
usadas com fins analticos em vez de preparativos.
Cromatografia de Troca Inica. Na cromatografia de troca inica, as molculas
carregadas ligam-se aos grupos de carga de sinal contrrio imobilizados na matriz.
Os nions ligam-se aos grupos catinicos nos trocadores de nions, e os ctions
ligam-se aos grupos aninicos nos trocadores de ctions. Talvez o trocador de
nions mais freqentemente usado seja o grupo dietilaminometil (DEAE) ligado a
uma matriz e o trocador de ctions mais freqentemente usado seja a matriz ligada
ao grupo carboximetila (CM)
DEAE: MatrizCH
2
CH
2
NH(CH
2
CH
3
)
+
2
CM: MatrizCH
2
COO

Resinas base de celulose e agarose so as matrizes mais freqentemente usadas


nas cromatografias de troca inica para protenas.
Protenas e outros polieletrlitos (polmeros polinicos) que possuem cargas
positivas e negativas podem ligar-se a trocadores de ctions e nios, conforme sua
carga. A afinidade de ligao de uma protena depende da presena de outros ons
que competem com ela pela ligao ao trocador de ons e do pH da soluo, que
influencia na carga lquida da protena.
As protenas a serem separadas so dissolvidas em soluo-tampo contendo
pH e concentrao de sais apropriados, e so em seguida aplicadas na coluna con-
tendo o trocador de ons. A coluna , ento, lavada com a soluo-tampo (Figura
5-6). medida que a coluna lavada com a soluo-tampo, as protenas com
pouca afinidade pelo trocador de ons passam mais rapidamente do que as protenas
com afinidade elevada. O fluxo da coluna coletado em uma srie de fraes. As
protenas que se ligam fortemente ao trocador de ons podem ser eludas (removi-
das da coluna), aplicando um novo tampo, chamado de eluidor, que contm uma
Tabela 5-2 Ponto Isoeltrico de Vrias Protenas
Comuns
Protena pI
Pepsina < 1,0
Ovalbumina (galinha) 4,6
Albumina do soro (humano) 4,9
Tropomiosina 5,1
Insulina (bovina) 5,4
Fibrinognio (humano) 5,8
-Globulina (humana) 6,6
Colgeno 6,6
Mioglobina (cavalo) 7,0
Hemoglobina (humana) 7,1
Ribonuclease A (bovina) 9,4
Citocromo c (cavalo) 10,6
Histona (bovina) 10,8
Lisozima (galinha) 11,0
Salmina (salmo) 12,1
Voet_Pratt_05.indd 122 19.07.07 10:38:22
Fundamentos de Bioqumica 123
elevada concentrao de sais ou um pH que reduz a afinidade da protena retida
pela matriz. O efluente da coluna pode ser monitorado para a presena da protena
por meio da medida da sua absorbncia a 280 nm. Pode-se tambm fazer ensaios
mais especficos para a protena de interesse na frao eluda (ver anteriormente).
Cromatografia de Interao Hidrofbica. As interaes hidrofbicas entre as protenas
e a matriz cromatogrfica podem ser exploradas para purificar uma dada protena.
Na cromatografia de interao hidrofbica, o material da matriz levemente
enriquecido de grupos octila ou fenila. Em concentrao salina alta, os grupos no-
polares na superfcie das protenas interagem com esses grupos hidrofbicos; isto
, esses grupos so excludos pelo solvente polar. O eluente tipicamente uma so-
luo-tampo aquosa com concentrao de sal decrescente (os efeitos hidrofbicos
so aumentados pelo aumento da fora inica). O eluidor um tampo aquoso com
concentrao salina decrescente, com concentrao de detergente crescente (que
rompe as interaes hidrofbicas) ou com pH varivel.
Cromatografia de Filtrao em Gel. Na cromatografia de filtrao em gel (tambm
chamada de cromatografia de excluso por tamanho ou peneira molecular), as
molculas so separadas de acordo com seu tamanho e forma. A fase estacionria
consiste de esferas de gel contendo poros cujos intervalos de tamanhos so relati-
vamente estreitos. O tamanho dos poros determinado pela quantidade de ligaes
cruzadas entre os polmeros do material do gel. Se uma soluo aquosa de molcu-
Tampc de
elulc ocm
pcuoc sal
Tampc
de elulc
ocm alta
ocnoentrac
de sal
^lta
ocnoentrac
de sal lcuoc sal
Nmerc da frac cu vclume dc eluente
C
c
n
o
e
n
t
r
a

c

d
e

p
r
c
t
e

n
a
(a (b (c (J
Mlstura da amcstra
Ccluna orcmatcgrfloa
Fraes seqenolalmente ocletadas
Figura 5-6 Cromatografia de troca inica. A regio mais escura da coluna
representa o trocador de ons, e as bandas coloridas representam as protenas.
(a) Uma mistura de protenas dissolvida em um pequeno volume de tampo
aplicada no topo da matriz da coluna. (b) Conforme a eluio progride, as pro-
tenas separam-se em bandas discretas como resultado das suas diferentes
afinidades pelo trocador. No diagrama, a primeira protena (em vermelho) pas-
sou pela coluna e foi isolada como uma frao separada. As outras protenas
permanecem perto do topo da coluna. (c) A concentrao de sal no eluente
aumentada para eluir as protenas remanescentes. (d) Diagrama de eluio da
mistura de protenas da coluna. Ver Figuras Animadas.
Voet_Pratt_05.indd 123 19.07.07 10:38:22
124 Donald Voet, Judith G. Voet, Charlotte W. Pratt
las de vrios tamanhos for passada atravs da coluna que contm tal peneira mole-
cular, as molculas que forem muito grandes para entrar nos poros sero excludas
do volume de solvente no interior das esferas, permanecendo na soluo que as
contorna. Portanto, as molculas grandes atravessam a coluna mais rapidamente
que as molculas pequenas que passam atravs dos poros (Figura 5-7). Pelo fato de
os poros das esferas possurem certo intervalo de tamanho, a filtrao em gel pode
ser usada para separar uma ampla variedade de molculas; as molculas maiores
com acesso a um nmero menor de poros eluiro primeiro (i.e., em um volume de
menor eluio), comparadas com as molculas um pouco menores que possuem
acesso a um nmero maior de poros.
Dentro do intervalo de tamanhos separados por uma matriz de tamanho mdio
de poro, existe uma relao linear entre o volume de eluio relativo de uma subs-
tncia e o logartimo de sua massa molecular (considerando-se que as molculas
tenham formas parecidas). Se uma certa coluna de filtrao em gel for calibrada
com vrias protenas de massa molecular conhecida, ento o peso molecular de uma
protena desconhecida poder ser estimado pela sua posio de eluio.
Cromatografia de Afinidade. Uma propriedade marcante de muitas protenas a sua
capacidade de se ligarem fortemente a certas molculas sem a mediao de ligaes
covalentes. Essa propriedade pode ser usada para purificar protenas por cromato-
grafia de afinidade (Figura 5-8). Nessa tcnica, uma molcula (um ligante) que
se liga de forma especfica protena de interesse (p. ex., um anlogo no-reativo
Sclvente
vclume de elulc

u
a
n
t
l
d
a
d
e

d
e

s
c
l
u
t
c
(a (b (c (J
Lsferas
de gel
(c
Matrlz
de gel
Lsfera
de gel
Mcloulas
grandes
Mcloulas
pequenas
Figura 5-7 Cromatografia de filtrao em gel. (a) Uma esfera de gel
consiste em uma matriz de gel (linhas slidas curvas) que possui um espao
interno para o solvente. As molculas pequenas (pontos vermelhos) podem
entrar livremente no espao interno das esferas de gel. As molculas grandes
(crculos azuis) no conseguem entrar nos poros do gel. (b) A amostra apli-
cada no topo da coluna (as esferas de gel esto representadas como esferas
marrons). (c) As molculas pequenas podem penetrar o gel e, conseqente-
mente, migrar atravs da coluna mais lentamente que as molculas grandes
que so excludas do gel. (d) As molculas grandes eluem primeiro e so
coletadas como fraes. As molculas pequenas requerem um volume maior
de solvente para eluir. (e) O diagrama de eluio, ou cromatograma, indica a
separao completa dos dois componentes. Ver Figuras Animadas.
Voet_Pratt_05.indd 124 19.07.07 10:38:22
Fundamentos de Bioqumica 125
de um substrato enzimtico) ligada covalentemente a uma matriz inerte. Quando
uma soluo impura de protenas passada atravs desse material cromatogrfico,
a protena desejada liga-se ao ligante imobilizado, enquanto as demais substncias
so lavadas atravs da coluna com o tampo. A protena desejada poder ser cole-
tada, com alto grau de pureza, alterando-se as condies de eluio de forma a libe-
r-la da matriz. A grande vantagem da cromatografia por afinidade reside no fato de
podermos explorar as propriedades bioqumicas singulares das protenas, em lugar
de nos fundamentarmos nas pequenas diferenas fsico-qumicas existentes entre
elas e que so usadas nos demais mtodos cromatogrficos. O poder de separao
da cromatografia de afinidade para uma protena especfica freqentemente maior
do que o das outras tcnicas cromatogrficas.
As colunas da cromatografia de afinidade podem ser construdas por meio da li-
gao qumica de pequenas molculas ou protenas em uma matriz cromatogrfica.
Na cromatografia de imunoafinidade, um anticorpo ligado na matriz cromato-
grfica de forma que a protena contra a qual o anticorpo foi desenvolvido possa ser
purificada. Em todos os casos, o ligante deve ter uma afinidade grande o suficiente
para capturar a protena de interesse, mas no grande demais a ponto de impedir a
subseqente liberao da protena sem desnatur-la. A protena ligada pode ser elu-
da lavando-se a coluna com uma soluo que contenha alta concentrao do ligante
livre ou uma soluo de pH ou fora inica diferente.
Na cromatografia de afinidade por quelante de metal, um on metlico di-
valente como Zn
2+
ou Ni
2+
ligado matriz cromatogrfica de sorte que protenas
contendo grupos quelantes de metais (p. ex., mltiplas cadeias laterais de His) po-
dem ser retidas. As tcnicas de DNA recombinante (Seo 3-5) podem ser usa-
das para acrescentar um segmento de seis resduos consecutivos de His, conhecido
como cauda de histidina, extremidade C ou N-terminal do polipeptdeo a ser
isolado. Isso cria um stio de ligao ao metal que permite a purificao da protena
recombinante. Aps a eluio da protena, usualmente por alterao de pH, a cauda
de histidina pode ser removida pela ao de uma protease especfica cuja seqncia
de reconhecimento separa a seqncia (His)
6
do restante da protena.
D. Eletroforese
A eletroforese, ou seja, a migrao de ons em um campo eltrico descrita na
Seo 3-4B. Nesta seo, descreveremos sua aplicao na purificao e na anlise
de protenas.
Eletroforese em Gel de Poliacrilamida. A eletroforese de protenas normalmente
procedida em gis de agarose ou poliacrilamida com um tamanho de poros caracte-
rstico. As separaes moleculares so, portanto, baseadas nos efeitos de peneira-
mento (tamanho e forma) e na mobilidade eletrofortica (carga eltrica). Contudo,
a eletroforese difere-se da filtrao em gel pelo fato de a mobilidade das molculas
pequenas ser maior do que a das grandes com a mesma densidade de carga. O pH
no gel deve ser grande o suficiente (com freqncia em torno de 9) de forma que
praticamente todas as protenas possuam carga lquida negativa e movam-se em
direo ao nodo quando a voltagem aplicada. As molculas de tamanho e carga
similares movem-se como uma banda nica atravs do gel.
Aps a eletroforese, as bandas separadas podem ser visualizadas por uma tcni-
ca apropriada, tal como mergulhar o gel em uma soluo de um corante que se liga
fortemente s protenas (p. ex., azul brilhante de Coomassie). Se as protenas de
uma amostra forem radioativas, o gel poder ser seco e prensado sobre um filme de
raio X. Aps um certo tempo (que pode ser de alguns minutos at vrias semanas,
dependendo da intensidade de radiao), o filme revelado, e o auto-radiograma
resultante mostra a posio dos componentes radioativos pelo escurecimento do
filme. Se um anticorpo para uma certa protena de interesse estiver disposio, ele
poder ser usado para detectar de forma especfica a protena no gel na presena de
Llgac espeofloa
de uma mcloula
ac llgante da matrlz
Maorcmcllulas
ocm stlcs de
llgac dlferentes
Llgante anocradc
na matrlz
Matrlz de
reslna sllda
Figura 5-8 Cromatografia de afinidade. Um ligante
(mostrado em amarelo) imobilizado por ligao covalente
na matriz cromatogrfica. Os recortes quadrados, semicir-
culares e triangulares representam os stios de ligao nas
macromolculas do ligante. Somente algumas molculas
(representadas por crculos cor-de-laranja) ligam-se
especificamente ao ligante. Os demais componentes so
lavados atravs da coluna.
Voet_Pratt_05.indd 125 19.07.07 10:38:23
126 Donald Voet, Judith G. Voet, Charlotte W. Pratt
muitas outras protenas, em processo conhecido como immunoblotting ou Wes-
tern blotting que semelhante ao ELISA (Figura 5-3). Dependendo das dimenses
do gel e da tcnica de visualizao utilizada, as amostras contendo menos do que 1
ng de protena podem ser separadas e detectadas por eletroforese em gel.
SDS-PAGE de Protenas. Em uma das formas de eletroforese em gel de poliacrila-
mida (PAGE, do ingls polyacrylamide gel electrophoresis), o detergente dodecil-
sulfato de sdio (SDS)
[CH
3
(CH
2
)
10
CH
2
OSO
3

]Na
+
usado para desnaturar as protenas. Molculas anfiflicas (Seo 2-1C) como o
SDS interferem nas interaes hidrofbicas que normalmente estabilizam as prote-
nas. As protenas em geral assumem uma forma cilndrica na presena de SDS. Alm
disso, a maioria das protenas liga-se ao SDS na proporo de 1,4 g de SDS por g de
protena (cerca de uma molcula de SDS para cada dois resduos de aminocido). A
carga negativa que o SDS transfere mascara a carga intrnseca da protena. O resul-
tado lquido que as protenas tratadas com SDS possuem formas similares e razes
carga/massa parecidas. Em conseqncia disso, a SDS-PAGE separa as protenas
somente por efeitos de filtrao em gel, isto , de acordo com a massa molecular. A
Figura 5-9 mostra o poder de resoluo e de reprodutibilidade da SDS-PAGE.
A mobilidade relativa das protenas variam, em SDS-PAGE, linearmente com
o logaritmo das suas massas moleculares (Figura 5-10). Em conseqncia, a massa
molecular de uma protena pode ser determinada com exatido de 5 a 10% fazen-
do-se sua eletroforese em presena de protenas marcadoras, de massa molecular
conhecida, e cobrindo uma faixa onde a massa molecular da protena de interesse
esteja situada. Pelo fato de o SDS romper as interaes no-covalentes entre os po-
lipeptdeos, a SDS-PAGE fornece a massa molecular das subunidades das protenas
feitas de mltiplas subunidades. A possibilidade de as subunidades serem ligadas
por ligaes dissulfeto pode ser testada por meio da realizao da SDS-PAGE na
presena e na ausncia de agentes redutores, tais como o 2-mercaptoetanol (HS-
CH
2
CH
2
OH), que quebra essas ligaes (Seo 5-3A).
Eletroforese Capilar. Apesar de as vrias formas de eletroforese serem muito efi-
cientes para separar molculas carregadas, em alguns casos elas requerem at vrias
horas para ficarem prontas, so difceis de serem automatizadas e so de difcil
aplicao em anlises quantitativas. Essas dificuldades so superadas pelo uso da
eletroforese capilar (EC), uma tcnica na qual a eletroforese conduzida em tubos
muito finos (de 20 a100 m de dimetro interno). Esses capilares tm o poder de
dissipar rapidamente o calor, permitindo o uso de campos eltricos muito elevados,
o que reduz o tempo da eletroforese para alguns minutos. A tcnica de EC apresenta
resoluo extremamente elevada e pode ser automatizada da mesma forma que no
HPLC, isto , com introduo automtica da amostra e deteco dos componentes
no capilar. Uma vez que a EC pode separar somente pequenas quantidades de mate-
rial, ela muito limitada para aplicaes como tcnica preparativa.
Focalizao Isoeltrica e Eletroforese Bidimensional. Uma protena possui grupos
carregados de ambas as polaridades e por isso tem um ponto isoeltrico, pI, no qual
no se desloca em um campo eltrico. Se uma mistura de protenas for submetida
eletroforese em soluo ou em gel com um gradiente estvel de pH em que o valor
de pH aumenta gradualmente do nodo para o ctodo, cada protena migrar at a
posio que corresponde ao seu pI. Se a protena difundir para fora dessa posio,
Scbrenadantes
1 2 3 4 5 6 7 8
50 kD
36 kD
33 kD
25 kD
Membranas
MM
M
a
s
s
a

m
c
l
e
o
u
l
a
r

(
k
D
)
90
0,2
Mcbllldade relatlva
0,4 0,6 0,8 1,0
80
70
60
50
40
30
20
10
Figura 5-9 SDS-PAGE. Uma amostra do sobrenadante ( esquerda) e de fraes da membrana
( direita) de um preparado da bactria Salmonella typhimurium foi submetida eletroforese em
faixas paralelas em gel de poliacrilamida com 35 cm de comprimento e com espessura de 0,8 mm.
A faixa marcada com os MM contm padres de massa molecular. (Cortesia de Giovana F. Ames,
University of California, Berkeley, EUA.)
Figura 5-10 Relao logartmica entre a massa mole-
cular de uma protena e sua mobilidade eletrofortica
em SDS-PAGE. As massas de 37 protenas, variando de
11 at 70 kD, esto registradas. (Conforme Weber, K. and
Osborn. M., J. Biol. Chem. 244, 4406 [1969].)
Voet_Pratt_05.indd 126 19.07.07 10:38:23
Fundamentos de Bioqumica 127
a sua carga lquida alterar medida que ela se move para uma regio de
pH diferente e a fora eletrofortica resultante a levar de volta sua po-
sio isoeltrica. Cada tipo de protena , portanto, focalizado em uma
banda estreita ao redor de seu pI. Este tipo de eletroforese chamado de
focalizao isoeltrica (IEF, do ingls isoelectric focusing).
A IEF pode ser combinada com a SDS-PAGE em uma tcnica extrema-
mente poderosa de separao bidimensional chamada de eletroforese bi-
dimensional (2D). A amostra de protenas primeiro submetida IEF em
uma direo e as protenas assim separadas so submetidas a SDS-PAGE
na direo perpendicular. Este procedimento gera um conjunto de pontos,
cada um representando uma protena (Figura 5-11). J foram observadas at
5.000 proteinas em um nico eletroforetograma bidimensional.
A eletroforese bidimensional uma valiosa ferramenta para a prote-
mica, o campo de estudo que envolve a catalogao de todas as prote-
nas expressas em uma clula, com nfase na sua quantificao, localiza-
o, modificaes, interaes e atividades. Os pontos corados no gel 2D podem ser
removidos com um bisturi, descorados e a protena pode ser eluda do fragmento
de gel para ser identificada e/ou caracterizada, freqentemente por espectrometria
de massas (Seo 5-3D). Os eletroforetogramas 2D podem ser analisados por com-
putador aps a digitalizao. Isto facilita a deteco de variaes nas posies e
intensidades dos pontos proticos em amostras obtidas de diferentes tecidos ou sob
diferentes condies de crescimento. Numerosos gis 2D de referncia esto dispo-
nveis com essa finalidade nos bancos de dados na rede, relacionados no endereo
http://us.expasy.org/ch2d/. Esses bancos de dados contm imagens de gis 2D de
uma grande variedade de organismos e tecidos e identificam muitas das suas pro-
tenas componentes.
E. Ultracentrifugao
Se um recipiente com gua e areia for agitado e colocado em repouso, a areia rapi-
damente se sedimentar no fundo do recipiente devido ao da fora da gravidade.
As macromolculas da soluo, que experimentam o mesmo campo gravitacional,
no apresentam uma sedimentao perceptvel, pois o movimento trmico (Bro-
wniano) aleatrio mantm-nas uniformemente distribudas na soluo. Somente
quando submetidas a aceleraes enormes as macromolculas comeam a sedi-
mentar-se, tal como os gros de areia.
A ultracentrfuga, que foi desenvolvida em 1923 pelo bioqumico sueco Sved-
berg, pode atingir velocidades rotacionais de100.000 rpm, de forma a produzir
campos centrfugos superiores a 800.000 g. Usando esse instrumento, Svedberg
foi o primeiro a demonstrar que as protenas so macromolculas de composio
homognea e que muitas protenas so compostas de vrias subunidades.
A velocidade na qual uma partcula sedimenta na ultracentrfuga est relacio-
nada sua massa (a densidade da soluo e a forma da partcula tambm afetam
a velocidade de sedimentao). O coeficiente de sedimentao de uma protena
(sua velocidade de sedimentao por unidade de fora centrfuga) usualmente
expresso em unidades de 10
13
s, conhecido como Svedbergs (S). A relao entre a
massa molecular e o coeficiente de sedimentao no linear; portanto, os valores
de s no so aditivos. O coeficiente de sedimentao das protenas vai de cerca de
1 S at aproximadamente 50 S; os vrus possuem coeficientes de sedimentao na
faixa de 40 S a 1.000 S. Partculas subcelulares, como as mitocndrias, possuem
coeficientes de sedimentao de dezenas de milhares.
Por volta de 1970, as massas moleculares eram freqentemente determinadas
em ultracentrfugas analticas, um equipamento no qual a sedimentao das par-
tculas pode ser observada opticamente. Mais recentemente, a cromatografia de fil-
trao em gel e a SDS-PAGE mostraram ser mtodos mais convenientes. Contudo,
a ultracentrfuga analtica ainda usada, por exemplo, para caracterizar sistemas de
Fcoallzac lsceltrloa
Figura 5-11 Eletroforese bidimensional em gel. Neste
exemplo, as protenas de E. coli, marcadas com amino-
cidos-
14
C, foram submetidas focalizao isoeltrica
(horizontalmente) seguida de SDS-PAGE (verticalmente).
Mais de 100 pontos podem ser resolvidos no auto-radio-
grama mostrado na figura. (Cortesia de Patrick OFarrell,
University of California at San Francisco.)
Voet_Pratt_05.indd 127 19.07.07 10:38:24
128 Donald Voet, Judith G. Voet, Charlotte W. Pratt
molculas associadas de modo no-covalente, incluindo subunidades de protenas e
outras molculas que formam complexos macromoleculares.
Na ultracentrifugao preparativa, a sedimentao conduzida em uma solu-
o de uma substncia inerte na qual a concentrao e, portanto, a densidade cres-
ce do topo para o fundo do tubo da centrfuga. O uso de tais gradientes de densidade
aumenta o poder de resoluo da ultracentrfuga. Na ultracentrifugao de zona,
a soluo macromolecular depositada no topo da coluna de lquido com gradiente
de densidade pr-formado, usualmente de sacarose. Durante a centrifugao, cada
espcie macromolecular move-se atravs do gradiente a uma taxa que depende basi-
camente do seu coeficiente de sedimentao; portanto, ela se desloca como uma zona
que pode ser separada de outras zonas (Figura 5-12). Aps a centrifugao, o tubo
furado para coletar as fraes que contm as macromolculas separadas.
Na centrifugao em gradiente de densidade de equilbrio, a amostra dissol-
vida em uma soluo relativamente concentrada de uma substncia densa e de rpida
difuso, como o CsCl. Sob o campo centrfugo elevado, produzido em altas rotaes,
o CsCl forma um gradiente de densidade. Os componentes da amostra formam ban-
das em posies onde suas densidades so iguais da soluo. As bandas individuais
podem, ento, ser coletadas como na ultracentrifugao de zona.
3
Seqenciamento de Protenas
A primeira seqncia protica, a da insulina bovina, foi divulgada em 1953 por
Frederick Sanger, que estabeleceu definitivamente que as protenas possuem uma
estrutura covalente nica (Quadro 5-2). Desde ento, foram seqenciadas muitas
protenas, e tem sido inferidas as seqncias de muitas outras a partir da seqncia
do DNA. As seqncias de aminocidos de centenas de milhares de polipeptdeos
so conhecidas atualmente. Essa informao muito til pelas seguintes razes:
1. O conhecimento da seqncia de aminocidos de uma protena um pr-
requisito para determinar sua estrutura tridimensional e essencial para en-
tender seus mecanismos moleculares de ao.
2. A comparao das seqncias entre protenas anlogas de espcies diferen-
tes fornece elementos para entender a sua funo e revela as relaes evolu-
cionrias entre as protenas e os organismos que as produzem.
3. Muitas doenas herdadas geneticamente so causadas por mutaes que
levaram troca de um aminocido na protena. A anlise da seqncia de
aminocidos pode ajudar no desenvolvimento de testes diagnsticos e de
terapias eficazes.
Cradlente
de saoarcse
establllzadc
^mcstra
oentrlfugac fraolcnamentc
Ccmpcnente de
sedlmentac rplda
Ccmpcnente de
sedlmentac lenta
Figura 5-12 Centrifugao de zona. A amostra depositada sobre a coluna da
soluo com gradiente de densidade de sacarose pr-formado ( esquerda). Durante
a centrifugao (no meio), cada partcula sedimenta a uma taxa que depende da sua
massa. Aps a centrifugao, o tubo perfurado e as partculas separadas (zonas) so
coletadas ( direita). Na centrifugao em gradiente de densidade de equilbrio, o tubo
da centrfuga preenchido com a soluo da amostra contendo uma substncia, usu-
almente CsCl, que forma um gradiente de densidade medida que o tubo gira.
Ver Explorao Guiada 4
Determinao da seqncia de protenas.
Voet_Pratt_05.indd 128 19.07.07 10:38:24
Fundamentos de Bioqumica 129
Muitos bioqumicos acreditavam que as protenas fossem coli-
des amorfos de tamanho, forma e composio variveis. Esta vi-
so foi abandonada a partir de 1940, quando se tornou possvel a
determinao da composio de aminocidos de uma protena, ou
seja, a quantidade de cada tipo de aminocido constituinte. No
entanto, tal informao no revelava nada a respeito da ordem na
qual os aminocidos estavam combinados. Uma teoria plausvel era
a de que as protenas seriam populaes de molculas relacionadas
e que provavelmente estariam organizadas a partir de peas meno-
res. Alguns estudos avanaram ao ponto de descrever as regras que
comandavam a estequiometria relativa e o espaamento entre os
vrios aminocidos nas protenas.
A preciso da anlise dos aminocidos comeou a melhorar
durante a dcada de 1940, como resultado do desenvolvimento
das tcnicas cromatogrficas para a separao dos aminocidos e
do uso do reagente ninidrina, que forma produtos coloridos com
estes, possibilitando a sua quantificao qumica (os mtodos an-
teriores usavam ensaios biolgicos trabalhosos). Frederick Sanger,
que comeou seu trabalho sobre seqenciamento de protenas em
1943, utilizou estas novas tcnicas assim como a qumica orgnica
clssica. Na verdade, Sanger no comeou por seqenciar uma pro-
tena; seus primeiros experimentos tinham como objetivo o desen-
volvimento de um mtodo melhor para quantificar os grupos amino
livres que correspondiam ao N-terminal de um polipeptdeo.
Sanger usou um reagente chamado 2,4-dinitrofluorbenzeno, o
qual forma um derivado dinitrofenil (DNP) de cor amarela com os
grupos aminoterminais sem romper nenhuma ligao peptdica.
2,4-Dinitrofluor-
benzeno (DNFB)
Polipeptdeo DNP Polipeptdeo
R
1
C
O O C
H
HF
.
.
.
NO
2
F
NO
2
NO
2
NO
2
NH
2
R
1
C
C
H
.
.
.
NH
+
Quando a protena hidrolisada para liberar as ligaes pept-
dicas, o aminocido N-terminal retm sua marca DNP e pode ser
identificado quando os produtos da hidrlise so separados por cro-
matografia. Sanger percebeu que alguns derivados aminocidos-
DNP eram instveis durante a hidrlise, de modo que esta etapa
teve que ser encurtada. Ao comparar os resultados da hidrlise em
tempos longos e curtos, Sanger observou pontos amarelos adicio-
nais que correspondiam a dipeptdeos ou
a outros peptdeos pequenos com liga-
es peptdicas intactas. Ele ento isolou os dipeptdeos e pde
identificar o segundo resduo. A genialidade de Sanger estava em
reconhecer que a seqncia de uma protena intacta poderia ser
obtida pela determinao das seqncias de pequenos peptdeos
sobrepostos gerados por sua hidrlise parcial.
Foi necessrio um grande volume de trabalho para que o princ-
pio bsico do seqenciamento de protenas se tornasse uma tcnica
laboratorial slida. Sanger escolheu a insulina como tema, porque
esta era uma das menores protenas conhecidas. A insulina contm
51 aminocidos em duas cadeias polipeptdicas (chamadas de A
e B). A seqncia dos 30 resduos da cadeia B foi completada em
1951 e a da cadeia A (com 21 resduos), em 1953. Porque as
duas cadeias esto unidas por ligaes dissulfeto, Sanger tambm
se esforou para encontrar o procedimento timo para clivar essas
pontes e identificar suas posies na protena intacta, uma tarefa
que ele completou em 1955.
O trabalho de Sanger ao longo de uma dcada, combinando sua
competncia em qumica orgnica (as reaes de clivagem e deri-
vatizao) com o desenvolvimento de ferramentas analticas para a
separao e identificao de produtos de reao, o levou a ganhar o
premio Nobel em 1958 (ele ganhou um segundo prmio Nobel em
1980, por sua inveno do mtodo de terminao de cadeia para o
seqenciamento dos cidos nuclicos [Seo 3-4C]). Um atestado
do brilhantismo de Sanger que suas abordagens bsicas
para o seqenciamento de polipeptdeos e cidos nucli-
cos so ainda amplamente utilizadas.
A publicao da seqncia da insulina em 1955 con-
venceu os cticos de que uma determinada protena pos-
sui uma seqncia nica de aminocidos. O trabalho de
Sanger tambm ajudou na consolidao do pensamento
sobre a existncia de um cdigo gentico que ligaria a se-
qncia de aminocidos de uma protena com a seqncia
de nucleotdeos do DNA, uma molcula cuja estrutura ha-
via sido elucidada em 1953.
Sanger, F., Sequences, sequences, sequences, Annu. Rev. Biochem. 57, 1-28
(1988). (Uma autobiografia cientfica que proporciona um vislumbre das dificulda-
des iniciais no seqenciamento de protenas.)
Sanger, F., Thompson, E.O.P, and Kitai, R., the amide groups of insulin, Biochem.
J. 59, 509-518 (1955).
Q U A D R O 5 - 2
Frederick Sanger e o Seqenciamento de Protenas
Rotas de Descobrimento
Frederick Sanger (1918)
Voet_Pratt_05.indd 129 19.07.07 10:38:25
130 Donald Voet, Judith G. Voet, Charlotte W. Pratt
A determinao de Sanger da seqncia dos 51 resduos da insulina (Figura 5-1)
levou cerca de 10 anos e requereu o uso de ~100 g de protena. Desde ento, os pro-
cedimentos de determinao da estrutura primria das protenas tm sido refinados e
automatizados e a maioria das protenas pode ser seqenciada de forma automtica
em poucas horas ou dias usando-se somente alguns microgramas de material. No
importa a tcnica utilizada, a abordagem bsica para o seqenciamento de prote-
nas similar ao procedimento desenvolvido por Sanger. Em resumo, a protena
quebrada em fragmentos pequenos o suficiente para serem seqenciados de modo
individual, e a estrutura primria da protena intacta , dessa forma, reconstruda a
partir da sobreposio das seqncias dos fragmentos (Figura 5-13). Esse procedi-
mento, como vimos (Seo 3-4C), tambm utilizado para seqenciar DNA.
A. Passos Preliminares
A seqncia completa dos aminocidos de uma protena inclui a seqncia de cada
uma de suas subunidades, se existirem. Portanto, as subunidades precisam ser iden-
tificadas e separadas antes de se iniciar o seqenciamento.
S S
S
S
Protena (duas cadeias
polipeptdicas diferentes
unidas por ligaes dissulfeto)
+
TDI SGE
FCYK HNYCFR
GVAGR
GVAGRFCYKTDI
HNYCFRSGE
GVAGRFCYKTDI HNYCFRSGE
CY CF
KTDI HNY
RSGE GVAGRF
Reduzir ligaes dissulfeto
Separar as cadeias
Usar mtodos qumicos ou
enzimticos para quebrar
os polipeptdeos em
peptdeos menores
Repetir a fragmentao sem romper
as ligaes dissulfeto para identificar
as seqncias contendo Cys envolvidas
nas ligaes dissulfeto
Usar dois grupos de seqncias
peptdicas sobrepostas para
reconstruir a seqncia do polipeptdeo
Usar diferentes mtodos
para gerar um conjunto
diferente de fragmentos
peptdicos
Determinar a seqncia
de cada fragmento
Determinar a seqncia
de cada fragmento
Figura 5-13 Viso geral do seqenciamento de
protenas.
Voet_Pratt_05.indd 130 19.07.07 10:38:25
Fundamentos de Bioqumica 131
A Anlise dos Grupos N-Terminais Revela o Nmero de Diferentes Tipos de Subunidades. Ca-
da cadeia polipeptdica (se ela no estiver quimicamente bloqueada) possui um
resduo aminoterminal. A identificao desse grupo terminal pode estabelecer o
nmero de cadeias polipeptdicas quimicamente distintas em uma protena. Por
exemplo, a insulina possui quantidades iguais de resduos N-terminais Gly e Phe,
que indica que ela possui nmeros iguais de duas cadeias polipeptdicas distintas.
O resduo aminoterminal de uma cadeia polipeptdica pode ser determinado por
vrios mtodos. O composto fluorescente cloreto de 5-dimetilaminonaftaleno-1-
sulfonil (cloreto de dansila) reage com aminas primrias, fornecendo polipept-
deos dansilinados (Figura 5-14). O tratamento dos polipeptdeos dansilinados com
cido em soluo aquosa e temperatura alta hidrolisa suas ligaes peptdicas e
libera o resduo N-terminal modificado, que ento separado cromatograficamente
e identificado pela sua intensa fluorescncia amarela. O resduo N-terminal pode
ser identificado tambm pelo mtodo da degradao de Edman (Seo 5-3C), um
procedimento que libera um aminocido de cada vez a partir da extremidade amino
da cadeia polipeptdica.
As Ligaes Dissulfeto Inter e Intracadeia Polipeptdica So Clivadas. As ligaes dis-
sulfeto entre resduos Cys devem ser clivadas para separar as cadeias polipeptdicas
se elas estiverem unidas por ligaes dissulfeto para assegurar que as cadeias
estejam completamente lineares (os resduos em polipeptdeos que esto amarra-
dos por ligaes dissulfeto podem no ser acessveis a todas as enzimas e reagen-
NH C CH
O R
2
H
2
N CH
R
1
C
O
COOH CH
R
2
+ NH C CH
O R
3
OH

H
2
O
HCl
NH C CH
O R
2
CH
R
1
C
O
NH C CH
O R
3
NH
...
...
...
H
+
CH
R
1
C
O
NH OH + H
3
N
+
H
3
N
+
+ CH
R
3
+
N(CH
3
)
2
N(CH
3
)
2
N(CH
3
)
2
O S O
Cl
SO
2
SO
2
COOH
Polipeptdeo 5-Dimetilaminonaftaleno-
1-sulfonil clorido (dansil clorido)
Dansil polipeptdeo
cido dansilamino
(fluorescente)
Aminocidos livres
Figura 5-14 A reao cloreto de dansil. A reao do cloreto de dansil com grupos amino prim-
rios usada para a anlise de grupos terminais.
Voet_Pratt_05.indd 131 19.07.07 10:38:25
132 Donald Voet, Judith G. Voet, Charlotte W. Pratt
tes usados para seqenciamento). As ligaes dissulfeto podem ser rompidas por
reduo pelo tratamento com 2-mercaptoetanol ou outro mercaptano (compostos
que contm grupos SH).
CH
2
CH
2
NH C
...
CH
O
NH C
...
CH
O
+ +
Cistina
CH
Cistena 2-Mercaptoetanol
...
...
S
S
CH
2
NH C
...
O
...
SH
2 HSCH
2
CH
2
OH
CH
2
NH C
...
CH
O
...
SH
SCH
2
CH
2
OH
+
SCH
2
CH
2
OH
Os grupos sulfidrila resultantes so ento alquilados, em geral por tratamento com
iodoacetato, para impedir que as ligaes dissulfeto se formem novamente pela
oxidao com O
2
:
+ Cys CH
2
Cys SH S CH
2
Iodoacetato S-carboximetilcistena
(CM-Cys)
ICH
2
COO

CH
2
COO

Cistena
+ HI
A Composio de Aminocidos de um Polipeptdeo Pode Ser Determinada. Em alguns
casos, desejvel conhecer a composio de aminocidos de um polipeptdeo, isto
, o nmero de cada tipo de resduo de aminocido presente. Essa
informao pode fornecer dados sobre a estrutura da protena, mas
no necessria para a determinao da seqncia de aminocidos.
A composio de aminocidos de um polipeptdeo determi-
nada pela sua hidrlise completa, seguida pela anlise dos amino-
cidos liberados. A hidrlise do polipeptdeo pode ser obtida por
tratamento da amostra com cido ou base, porm nenhum desses
mtodos completamente satisfatrio. Por exemplo, a hidrlise ci-
da degrada Ser, Thr, Tyr e Trp e converte Asn e Gln em Asp e Glu. A
hidrlise bsica destri Cys, Ser, Thr e Arg. A hidrlise enzimtica
de polipeptdeos muitas vezes incompleta, e complicada pelo
fato de as peptidases, que so protenas, ficarem sujeitas a degrada-
o proteoltica, contribuindo para o contedo total de aminocidos
da mistura da reao.
A anlise quantitativa do hidrolisado do polipeptdeo efetuada
em um instrumento que separa os aminocidos por cromatografia e
faz uma derivao (antes ou depois da separao cromatogrfica)
com um marcador molecular de fcil deteco. Em seguida, os ami-
nocidos so detectados pelos seus tempos de reteno caractersti-
cos na HPLC e quantificados por sua intensidade de absorbncia ou
de fluorescncia (Figura 5-15). Os modernos analisadores de amino-
cidos podem analisar completamente uma protena que contenha 1
pmol de cada aminocido em menos de uma hora.
p
s
^
u
l
C
s
y
C

M
C
n
s
^
n
l
C
g
r
^
a
l
^
y
l
C
S
e
r
s
l
H
r
h
T
r
y
T
L
y
s
e
h
l
L
e
u
l
a
v t
e
M e
l
l
0 15 4 8 12
F
l
u
c
r
e
s
o

n
o
l
a

r
e
l
a
t
l
v
a
2

N
H
2

b
u
t

r
l
o
c
Tempc de retenc (mln)
Figura 5-15 Anlise de aminocidos. Os aminocidos foram sujeitos a uma
reao de derivao com um marcador molecular fluorescente antes da separa-
o por HPLC. (Hunkapiller, M.W., Strickler, J.E., and Wilson, K.J., Science 226, 309
[1984].)
Voet_Pratt_05.indd 132 19.07.07 10:38:26
Fundamentos de Bioqumica 133
B. Clivagem de Polipeptdeos
Os polipeptdeos maiores que 40 a 100 resduos no podem ser seqenciados direta-
mente e devem, portanto, ser primeiramente clivados, de modo qumico ou enzimti-
co, em fragmentos especficos pequenos o suficiente para serem seqenciados. Vrias
endopeptidases (enzimas que catalisam a hidrlise de ligaes peptdicas internas em
oposio s exopeptidases, que catalisam a hidrlise de resduos N ou C-terminais)
podem ser usadas para fragmentar polipeptdeos. As endopeptidases, assim como as
exopeptidases (coletivamente chamadas de proteases), somente hidrolisam ligaes
peptdicas ladeadas por resduos que possuam cadeias laterais bem especficas (Tabela
5-3). A enzima digestiva tripsina possui a maior especificidade e , portanto, o mais
valioso membro do arsenal de peptidases usado para fragmentar polipeptdeos. Ela
cliva ligaes peptdicas no lado C (em direo terminao carboxila) dos resduos
positivamente carregados Arg e Lys quando o prximo resduo no Pro.
CH
2
CH
2
NH C
...
CH
O
NH
3
NH C CH
O
...
Qualquer aminocido
exceto Pro
R
CH
2
CH
2
H
2
O
CH
2
CH
2
NH C
...
CH
O
NH
3
O
_
CH
2
CH
2
H
3
N C CH
O
...
R
+
+
tripsina
Lys
(ou Arg)
As outras endopeptidases listadas na Tabela 5-3 exibem uma especificidade de
cadeia lateral mais ampla que a tripsina e muitas vezes produzem uma srie de frag-
mentos de peptdeos com seqncias que se sobrepem. Contudo, por meio de uma
Tabela 5-3 Especificidades de Vrias Endopeptidases
NH CH
O
C
O
C
R
n 1
NH
Ligao peptdica
hidrolisvel
CH
R
n
Enzima Fonte Especificidade Comentrios
Tripsina Pncreas bovino R
n-1
= resduos com carga positiva: Arg, Altamente especfica
Lys; R
n
Z Pro
Quimotripsina Pncreas bovino R
n-1
= resduos hidrofbicos volumosos: Cliva mais lentamente
Phe, Trp, Tyr; R
n
Z Pro quando R
n-1
= Asn, His,
Met, Leu
Elastase Pncreas bovino R
n-1
= resduos neutros pequenos: Ala,
Gly, Ser, Val; R
n
Z Pro
Termolisina Bacillus thermoproteolyticus R
n
= Ile, Met, Phe, Trp, Tyr, Val; Ocasionalmente cliva
R
n-1
Z Pro quando R
n
= Ala, Asp,
His, Thr; termoestvel
Pepsina Mucosa gstrica bovina R
n
= Leu, Phe, Trp, Tyr; R
n-1
Z Pro Tambm outros; muito
inespecfica; pH timo
= 2
Endopeptidase V8 Staphylococcus aureus R
n-1
= Glu
Voet_Pratt_05.indd 133 19.07.07 10:38:26
134 Donald Voet, Judith G. Voet, Charlotte W. Pratt
protelise limitada, isto , ajustando-se as condies da reao e limitando os tempos
de reao, essas endopeptidases menos especficas podem produzir um conjunto de
fragmentos discretos e no sobrepostos. Vrios reagentes qumicos promovem a que-
bra de ligaes peptdicas entre resduos especficos. O mais til deles, o brometo de
cianognio (CnBr), quebra a ligao no lado C dos resduos de met. (Figura 5-16).
S
Br
Br
Brometo de
cianognio
Peptidil
homosserina
lactona
N C
CH
3
CH
3
H
2
O
S
H
3
N
O
CH NH
...
NH
...
C NH
...
NH
...
: NH CH
R O
C
...
: NH CH
R O
C
...
N CH
R O
C
...
CH
R O
C
...
S N C
S N C
CH
2
C
O
CH
2
C
H
CH
2
CH
C
O
CH
2
CH
2
CH
3
C
O
CH
2
C
CH
2
C
O
CH
2
C
H
Figura 5-16 Clivagem de um polipeptdeo com brometo de cianognio. CNBr reage especi-
ficamente com resduos de Met, resultando na clivagem da ligao peptdica no lado C-terminal.
Os novos resduos C-terminais gerados formam uma estrutura cclica conhecida como peptidil
homosserina lactona.
Voet_Pratt_05.indd 134 19.07.07 10:38:27
Fundamentos de Bioqumica 135
C. Degradao de Edman
Uma vez que os fragmentos de peptdeo formados por reaes de clivagem espe-
cficas tenham sido isolados, sua seqncia de aminocidos pode ser determinada.
Isso normalmente alcanado por meio de ciclos repetidos de degradao de
Edman. Nesse processo (denominado em homenagem ao inventor, Pehr Edman),
o fenilisotiocianato (PITC; tambm conhecido como reagente de Edman) reage
com o grupo aminoterminal de um polipeptdeo em condies semi-alcalinas para
formar feniltiocarbamil (PTC) (Figura 5-17). Esse produto tratado com cido
trifluoractico anidro, que hidrolisa o resduo N-terminal, resultando no derivado
tiazolinona, mas no hidrolisa outras ligaes peptdicas. A degradao de Ed-
man, portanto, libera o resduo do aminocido N-terminal, mas deixa intactos os
demais resduos da cadeia polipeptdica. A tiazolinona de aminocido extrada
seletivamente por um solvente orgnico, e convertida, por tratamento aquoso
cido, para uma forma mais estvel, que o derivado feniltioidantona (PTH).
Esse aminocido-PTH pode mais tarde ser identificado por cromatografia. Por
conseguinte, possvel determinar a seqncia de aminocidos de uma cadeia
polipeptdica a partir do resduo N-terminal, em direo ao interior, usando-se
repetidos ciclos de degradao de Edman e a subseqente identificao de cada
aminocido PTH liberado.
NH C CH
O R
2
H
2
N CH
R
1
C
O
+
..
NH C CH
O R
3
NH C CH
O R
2
CH
R
1
C
O
..
NH C CH
O R
3
NH
...
HC C
N
N
H
OH

R
1
+ C CH
O R
2
NH C CH
O R
3
H
3
N
+
H
+
HC C
HN
N C S
C
S
NH
C
S
C
N
S
R
1
O
...
...
O
Polipeptdeo Fenilisotiocianato
(PITC)
F
3
CCOOH
anidro
Polipeptdeo PTC
Polipeptdeo original com o resduo
N-terminal a menos
Derivado de tiazolinona
Aminocido-PTH
Figura 5-17 Degradao de Edman. A reao ocorre em trs etapas, e cada uma requer condies dife-
rentes. Os resduos de aminocidos, podem, ento, ser sucessivamente removidos, passo a passo, a partir da
extremidade N do polipeptdeo. Ver Figuras Animadas.
Voet_Pratt_05.indd 135 19.07.07 10:38:27
136 Donald Voet, Judith G. Voet, Charlotte W. Pratt
O mtodo da degradao de Edman tem sido refinado e automatizado, resultan-
do em uma grande economia de tempo e de material. Nos instrumentos modernos,
os peptdeos so secos sobre um disco de papel de fibras de vidro, e quantidades
precisamente medidas de reagentes so liberadas na forma de vapor em um fluxo
de argnio em intervalos programados. At cem resduos podem ser identificados
antes que o efeito cumulativo das reaes incompletas, que as reaes laterais e que
a perda de peptdeos impeam a identificao dos aminocidos e o prosseguimento
do seqenciamento. Uma vez que menos de 1 pmol de PTH-aminocido pode ser
detectado e identificado, a anlise de seqncias pode ser feita em quantidades to
pequenas como 5 a 10 pmis de peptdeo (< 1 g uma quantidade bastante pe-
quena).
D. Seqenciamento por Espectrometria de Massas
A espectrometria de massas surgiu como uma tcnica importante para caracteri-
zar e seqenciar polipeptdeos. Esta tcnica mede de modo preciso a relao mas-
sa/carga (m/z) de ons em fase gasosa (onde m a massa do on e z sua carga).At
1985, as macromolculas, como as protenas e os cidos nuclicos, no podiam ser
analisadas por espectrometria de massas porque eram destrudas pelo mtodo por
meio do qual os espectrmetros produziam os ons em fase gasosa: vaporizao por
aquecimento seguida de ionizao via bombardeamento com eltrons.
Tcnicas novas superaram esse problema. Por exemplo, na tcnica de ioniza-
o por eletroasperso (ESI) uma soluo de uma macromolcula tal como um
peptdeo aspergida a partir de um tubo capilar estreito mantido a alta voltagem
(4.000 V), formando finas gotculas altamente carregadas de onde o solvente eva-
pora rapidamente (Figura 5-18a). Isto gera uma srie de ons macromoleculares
em fase gasosa que possuem cargas inicas no intervalo de +0,5 a +2 por quilo-
dlton. As cargas resultam da protonizao das cadeias laterais bsicas tais como
as de Arg e Lys. Os ons so conduzidos para um espectrmetro, que mede seus
valores de m/z com uma preciso de > 0,01% (Figura 5-18b). Em conseqncia, a
determinao de z de um on permite que sua massa molecular seja determinada
com muito mais preciso do que por qualquer outro mtodo.
Os peptdeos curtos (< 25 resduos) podem ser seqenciados diretamente pelo
uso de dois espectrmetros de massas acoplados em srie (Figura 5-19). O primeiro
funciona na seleo e separao do on peptdico de interesse dos ons de massas
diferentes, assim como de qualquer contaminante que possa estar presente. O on
peptdico selecionado passa ento para uma clula de coliso, onde ele colide com
tomos quimicamente inertes tais como hlio. A energia dada dessa forma ao on
peptdico faz com que ele se fragmente em somente uma de suas vrias ligaes
peptdicas, gerando assim um ou dois fragmentos carregados por on original. As
massas moleculares dos numerosos fragmentos carregados produzidos so ento
determinadas pelo segundo espectrmetro.
Pela comparao das massas moleculares de membros de uma famlia de frag-
mentos sucessivamente mais longos, estas podem ser determinadas e assim as
identidades dos resduos de aminocidos correspondentes. A seqncia de um
polipeptdeo inteiro pode ser elucidada desta forma (embora a espectrometria de
massas no possa distinguir os resduos isomricos Ile e Leu porque eles tm exa-
tamente a mesma massa, assim como no consegue sempre distinguir de modo
confivel os resduos Gln e Lys porque suas massas moleculares diferem apenas
por 0,036 D).
A informatizao do processo de comparao de massas reduziu para somente
poucos minutos o tempo necessrio para seqenciar um polipeptdeo curto (um
ciclo de degradao de Edman pode demorar uma hora). A fidedignidade desse
processo foi aumentada por meio da comparao, por computador, do espectro de
massa medido com os de peptdeos de seqncia conhecida mantidos em bancos de
Um espectro de massas ESI como o da apomio-
globina (Figura 5-18b) contm uma srie de picos
correspondendo, cada um deles, relao m/z de
um on (M + nH)
n+
. Dois picos sucessivos neste
espectro mediram relaes m/z de 1414,0 e 1542,3.
Qual a massa molecular da apomioglobina origi-
nal, como ela comparvel ao valor que lhe dado
na Tabela 5-1 e quais so as cargas dos ons que
causam esses picos?
O primeiro pico (p
1
= 1414,0) se origina de um on
com carga z e massa M + z, onde M a massa mo-
lecular da protena original. Ento o pico adjacente
(p
2
= 1542,3), o qual devido a um on com um
prton a menos, tem carga z 1 e massa M + z 1.
As relaes m/z para os ons p
1
e p
2
so, portanto,
dadas pelas seguintes expresses.
p
1
= (M + z)/z
p
2
= (M + z 1)/ (z 1)
Estas duas equaes lineares podem resolver as in-
cgnitas, M e z. Resolva M na primeira equao.
M = z (p
1
1)
Ento rena esse resultado segunda equao.
p
2

zp
2
p
2
zp
1
1
z (p
2
1)(p
2
p
1
)
M (p
2
1)(p
1
1)(p
2
p
1
)
zp
1
1

z 1
z(p
1
1) z 1

z 1
Substituindo pelos valores de p
1
e de p
2
,
M = (1542,3 1)(1414,0 1)/(1542,3 1414,0) =
16.975 D, o que somente 0,14% maior do que
16.951 D da apomioglobina de cavalo que consta
da Tabela 5-1.
z = (1542,3 1)/(1542,3 1414,0) = 12
de forma que a carga do on 2 12 1 = 11.
E X E M P L O D E C L C U L O 5 - 1
Voet_Pratt_05.indd 136 19.07.07 10:38:27
Fundamentos de Bioqumica 137
5+
+
+
+
+
+
+
+
+
+
+
+
+
+ +
+
6+
4+
Lspeotrc de massas (LSl)
m1:
Deteotcr
^nallsadcr de massas
N
2
4000v
lressc
atmcsfrloa
Balxc
vouc
^ltc vouc
^mcstra
em scluc
Capllar
(a
^
b
u
n
d

n
o
l
a

r
e
l
a
t
l
v
a
100
80
60
40
20
678,6
+25
738,1
+23
808,3
+21
848,7
+20
893,3
+19
998,4
+17
1060,5
+16
1211,8
+14
1414,0
+12
1542,3
+11
1696,3
+10
1884,7
+9
600 800 1.000 1.200 1.400 1.600 1.800 2.000
m1:
(b
Figura 5-18 Espectrometria de massas por ionizao
por eletroasperso (ESI). (a) N
2
seco ou alguns outros
gases promovem a evaporao do solvente de gotculas
carregadas contendo a protena de interesse, deixando os
ons em fase gasosa, cuja carga devida protonizao
dos resduos de Arg e Lys, gerando, desta forma, os ons
chamados (M + nH)
n+
. O espectrmetro de massas deter-
mina, ento, a relao massa-carga desses ons. O espec-
tro resultante consiste em uma srie de picos que corres-
pondem aos ons que diferem por uma nica carga e pela
massa de um prton. (Segundo Fitzgerald, M.C., and Siu-
zdak, G., Chem. Biol. 3, 708 [1996].) (b) Espectro ESI-
MS da apomioglobina de corao de cavalo (mioglobina
sem o on Fe). Esto indicadas as relaes m/z medidas
e as cargas inferidas para a maioria dos picos. Os dados
fornecidos por esse espectro permitem o clculo da massa
da molcula original (ver Exemplo de Clculo 5-1). Todos
os picos tm ombros porque os elementos componentes do
polipeptdeo contm pequenas misturas de istopos mais
pesados (i.e., o carbono naturalmente abundante consiste
em 98,9% de
12
C e 1,1% de
13
C, e o enxofre naturalmente
abundante consiste em 0,8% de
33
S, 4,2% de
34
S e 95,0%
de
35
S). (Segundo Yates, J.R., Methods Enzymol. 271,
353 [1996].)
MS1
l
1
l
2
l
3
l
4
l
5
F
1
F
2
F
3
F
4
F
5
MS2
Clula
de ocllsc
Fcnte
de cns
Deteotcr
He
Figura 5-19 Espectrometria de massas seqencial no seqenciamento de peptdeos. A partir
da protena a ser seqenciada tratada com protease, a ionizao por eletroasperso (ESI), fonte
de ons, gera ons peptdicos em fase gasosa, marcados como P
1
, P
2
, etc. Esses peptdeos so
separados pelo primeiro espectrmetro (MS-1) de acordo com seus valores de m/z, e um deles (P
3
)
dirigido para a clula de coliso, onde colide com os tomos de hlio. Esse tratamento quebra o
peptdeo em fragmentos (F
1
, F
2
, etc.), os quais so conduzidos para o segundo espectrmetro
(MS-2) para a determinao de seus valores m/z. (Segundo Biemann, K. and Scoble, H.A. Scien-
ce, 237, 992 [1987].)
Voet_Pratt_05.indd 137 19.07.07 10:38:28
138 Donald Voet, Judith G. Voet, Charlotte W. Pratt
dados. A espectrometria de massas tambm pode ser usada para seqenciar pept-
deos com seus N-terminais bloqueados quimicamente (o que impede a degradao
de Edman) e para caracterizar outras modificaes ps-traduo como fosforilaes
e glicosilaes.
E. Reconstruo da Seqncia das Protenas
Aps o seqenciamento dos fragmentos de cada polipeptdeo, sua ordem na cadeia
do polipeptdeo original precisa ser elucidada. Isso feito procedendo-se uma se-
gunda clivagem da protena por meio da utilizao de um reagente com especifici-
dade diferente seguida da comparao das seqncias de aminocidos do conjunto
dos fragmentos peptdicos sobrepostos (Figura 5-20).
O passo final da anlise de seqncias de aminocidos determinar as
posies (se existirem) das ligaes dissulfeto. Isso pode ser feito clivan-
do-se uma amostra de protena, com suas ligaes dissulfeto intactas, para
produzir pares de fragmentos de polipeptdeo, cada um contendo um Cys,
que so unidos por ligaes dissulfeto. Aps o isolamento de um fragmento
de polipeptdeo unido por ligaes dissulfeto, ela rompida e alquilada
(Seo 5-3A), e as seqncias dos dois peptdeos so determina-
das (Figura 5-21). Os vrios pares desses fragmentos polipeptdi-
cos so identificados ao compararem-se suas seqncias com a da
protena, permitindo, dessa forma, estabelecer as localizaes das
ligaes dissulfeto.
Bancos de Dados de Seqncias. Assim que a seqncia de aminocidos de uma
protena tenha sido determinada, as informaes so depositadas em bancos de da-
dos pblicos. Os bancos de dados para seqncias de protenas bem como de DNA
esto acessveis na Internet (Tabela 5-4). As conexes eletrnicas entre os bancos
de dados permitem uma rpida atualizao e o cruzamento das informaes de se-
qncias.
CNBr
Trp Met Cly ^la Lys Leu lrc Met ^sp Cly ^rg Cys ^la Cln lhe
CNBr
Fragmentcs
CNBr
Fragmentcs
de trlpslna
trlpslna trlpslna
Figura 5-20 A determinao de fragmentos sobrepostos
para determinar a seqncia de aminocidos de um
polipeptdeo. Neste exemplo, dois conjuntos de peptde-
os sobrepostos so gerados usando-se tripsina para clivar
o polipeptdeo aps cada resduo Arg e Lys e, em uma
reao separada, o CNBr usado para clivar aps cada
resduo Met. Ver Figuras Animadas.
CH
2
CO
2

+

O
2
CCH
2
S S
S S
Reduzir o dissulfeto e
bloquear com iodoacetato
Separar e seqenciar
o polipeptdeo
Fragmento de polipeptdeo
que contm ligaes dissulfeto
Figura 5-21 Determinao da posio das liga-
es dissulfeto. Neste mtodo, fragmentos de
peptdeo unidos por ligaes dissulfeto da protena so
reduzidos e seqenciados separadamente para identificar
as posies das ligaes dissulfeto na protena intacta.
Tabela 5-4 Endereos Eletrnicos dos Principais Bancos de Dados de Seqncias de
Protenas e DNA
Bancos de Dados Com Seqncias de Protenas
ExPASy Molecular Biology Server (Swiss-Prot): http://au.expasy.org
Protein Information Resource (PIR): http://pir.georgetown.edu/
Protein Research Foundation (PRF): http://www4.prf.or.jp/
UniProt: http://www.ebi.uniprot.org/
Bancos de Dados Com Seqncias Gnicas
GenBank: http://www.ncbi.nlm.nih.gov/Genbank/GenbankSearch.html
European Bioinformatics Institute (EBI): http://srs.ebi.ac.uk/
DBGET/Integrated Database Retrieval System: http://www.genome.ad.jp/dbget
Voet_Pratt_05.indd 138 19.07.07 10:38:29
Fundamentos de Bioqumica 139
A maioria dos bancos de dados de seqncias usa convenes semelhantes. Con-
sidere, por exemplo, o banco de dados de anotao de seqncias de protenas deno-
minado Swiss-Prot. Uma seqncia arquivada no Swiss-Prot comea com o cdigo
de identificao na forma X_Y, onde X um mnemnico curto que indica o nome
da protena (p. ex., CYT para citocromo c e HBA para a cadeia da hemoglobina) e
Y um cdigo de identificao com cinco caracteres que indica a fonte biolgica da
protena, o qual consiste nas trs primeiras letras do gnero e as duas primeiras letras
da espcie (p. ex., CANFA para Canis familiaris [co]), embora Y seja auto-explica-
tivo para a maioria dos organismos mais freqentes (p. ex., BOVIN e ECOLI). Este
seguido de um nmero de acesso, o qual determinado pela base de dados como
uma forma de identificar um registro mesmo que seu cdigo de identificao tenha
que ser mudado (p. ex., veja a Figura 5-22). O registro continua com a data na qual
a seqncia foi registrada na base de dados e a ltima vez que foi modificada e ano-
tada, uma lista das referncias pertinentes (que esto conectadas ao Med-Line), uma
descrio da protena e suas conexes com outros bancos de dados. Uma Tabela de
Caractersticas descreve regies ou stios de interesse na protena tais como ligaes
dissulfeto, modificaes ps-traduo, stios de ligao e divergncias entre refern-
cias diferentes. O registro termina com o nmero de resduos do peptdeo, sua massa
molecular e, finalmente, sua seqncia com o cdigo de uma letra.
Munido de programas de computador apropriados (muitas vezes disponveis ao
pblico em bancos de dados), o pesquisador pode procurar em um banco de dados
para encontrar protenas com seqncias similares em vrios organismos. At mes-
mo a seqncia de um fragmento curto pode ser suficiente para pescar a protena
de origem ou sua homloga em outras espcies.
A informao da seqncia de aminocidos no tem a sua importncia dimi-
nuda quando a seqncia de nucleotdeos do gene correspondente tambm co-
nhecida, pois a seqncia da protena muitas vezes fornece informaes sobre sua
estrutura que no so reveladas pelo seqenciamento dos cidos nuclicos (ver Se-
o 3-4). Por exemplo, somente o sequenciamento direto da protena pode revelar
a localizao das ligaes dissulfeto. Alm disso, muitas protenas so modificadas
aps a sua sntese. Alguns resduos, por exemplo, podem ser removidos para gerar a
protena madura (a insulina, mostrada na Figura 5-1, sintetizada como um poli-
peptdeo com 84 resduos que processado proteoliticamente originando sua forma
menor com duas cadeias). As cadeias laterais dos aminocidos tambm podem ser
modificadas pela adio de carboidratos, grupos fosfato ou grupos acetila, entre
outros. Apesar de algumas dessas modificaes ocorrerem em seqncias de ami-
nocidos caractersticas, sendo por isso identificveis nas seqncias nucleotdicas,
somente a seqncia real da protena pode confirmar se e onde elas iro ocorrer.
Figura 5-22 Parte inicial do portal Swiss-Prot. Esta
informao pertence protena resistina, que produzida
pelo tecido adiposo e pode ter um papel no diabete. O por-
tal completo inclui informaes adicionais e referncias,
bem como a seqncia da protena. (De Swiss-Prot: http.//
www.uniprot.org/.)
Voet_Pratt_05.indd 139 19.07.07 10:38:29
140 Donald Voet, Judith G. Voet, Charlotte W. Pratt
4
Evoluo das Protenas
O material gentico de um organismo especifica a seqncia de aminocidos de
todas as suas protenas. Alteraes nos genes devidas a mutaes aleatrias muitas
vezes alteram a estrutura primria das protenas. Uma mutao em uma protena
ir propagar-se somente se tal mutao aumentar, ou pelo menos no diminuir, a
probabilidade de seu portador sobreviver e reproduzir-se. Muitas mutaes so da-
nosas ou produzem efeitos letais, fazendo os seus portadores desaparecerem. Em
raras ocasies, contudo, uma mutao aumenta a aptido do seu hospedeiro. Essa
a essncia da evoluo darwiniana.
A. Evoluo da Seqncia das Protenas
As estruturas primrias de uma dada protena em espcies prximas so muito pa-
recidas entre si. Consideremos o citocromo c, uma protena encontrada em prati-
camente todos os eucariotos. O citocromo c um componente do sistema de trans-
9 5 1 1 5 10 15 20 25 30 35 40
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
^
^
^
^
^

^
l
l
l
l
l
l
l
l
l
l
l
p
l
l
K
L
S
l
l
l
l
l
l
l
l
l
l
v
v
v
v
F
F
F
^
^
^
^
^
^
^
^
^
^
C
C
C
C
L
l
C
L
L
L
L
L
L
L
L
L
L
h
h
h
h
T
^
h
S
S
^
B
B
B
B
B
Z
Z
h
l
F
F
F
F
F
F
F
F
F
F
h
S
T
S
S
S
S
S
S
S
S
^
^
^
^
^
^
^
^
^
^
a
a
a
a
a
a
a
a
a
a
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
N
N
D
D
S
S
D
N
N
D
B
B
B
B
B
B
B
v
v
v
v
v
v
v
v
v
l
l
v
v
v
v
v
v
^
^
v
v
^
^
S
l
l
l
S
S
S
v
v
^
^
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
^
L
L
D
L
L
K
K
K
D
K
T
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
N
N
K
K
K
K
K
^
S
T
S
^
^
S
^
^
^
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
^
^
^
^
L
^
L
L
L
L
L
L
L
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
T
T
N
K
K
K
K
K
K
K
K
K
K
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
T
v
l
l
l
L
L
L
L
l
l
l
l
l
l
l
l
l
l
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
l
l
v
v
v
v
v
v
v
v
v
v
v
T
v
v
v
v
v
v
v
K
K
K
K
K
K
K
K
K
K
K
K
K
M
M

T
T
T
T
T
T
T
T
T
T
T
T
T
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
R
R
R
R
R
R
R
K
K
K
K
K
K
K
K
K
K
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
S
S
^
^
^
^
^
^
^
S
S
S
^
S
^
^
^
^
^
^
^
L
^
^
^
^
^
^
^
^
^
^
^
^

C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
v
v
v
v
v
v
v
v
v
v
v
v
v
v
C
v
v
v
v
v
v
v
l
L
v
v
v
v
v
v
v
v
v
v
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
D
L
L
D
D
D
D
L
D
L
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
N
N
^
^
^
^
K
^
L
^
K
K
K
K
K
K
K
K
K
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
^
^
^
^
^
^
^
^
^
^
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
l
l
C
C
C
C
C
C
C
C
C
C
C
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
N
H
H
H
H
H
H
H
H
H
H
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
T
T
T
T
T
T
T
T
T
T
T
T
T
T
v
v
T
v
v
v
v
v
v
l

l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
^
N
N
N
N
N
N
N
N
N
N
L
L
L
L
L
L
L
L
l
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
H
H
H
H
H
H
H
H
N
H
H
H
N
H
Y
w
S
H
H
H
H
H
H
H
H
N
N
N
N
N
N
N
N
N
L
L
L
L
L
L
L
L
l
L
L
L
L
L
L
L
L
F
F
L
L
l
l
L
L
L
L
L
L
L
L
L
L
L
F
F
F
F
F
F
F
F
F
F
F
F
l
F
l
F
F
Y
F
F
l
F
F
F
F
F
F
F
F
F
F
F
F
F
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
S
C
C
C
C
C
C
C
C
C
C
C
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
H
H
K

T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
S
S
T
S
S
S
S
S
S
S
S
S
S

S
T
T
T
T
T
T
T
T
T
T
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
v
T
T
T
T
T
T
T
T
T
T
1 3 5 5 5 1 3 3 4 1 4 3 2 1 3 1 1 1 1 4 2 4 1 2 3 2 1 4 1 1 2 1 5 1 3 3 2 1 3 2 1 3 3
Ser humanc, ohlmpanz
Maoaoc rhesus
Cavalc
Burrc
vaoa, pcroc, cvelha
Caohcrrc
Ccelhc
Balela olnza da Callfrnla
Canguru olnza glgante
Callnha, peru
lcmbc
latc pequlm
Tartaruga
Casoavel
Sapc
^tum
Cac
8amta cyntbta (uma marlpcsa)
Marlpcsa da lagarta dc tabaoc
Mcsoa varejelra (Ca//ttroga)
Drosopbt/a (mcsoadafruta)
Levedura dc fermentc dc pc
CanJtJa krusct (uma levedura)
Ncurospora crassa (um mcfc)
Cerme de trlgc
Semente de Fagplrc
Semente de glrasscl
Pbasco/us aurcus
Ccuveflcr
^bbcra
Semente de gergellm
Mamcna (Rtctnus communts)
Semente de algcdc
Semente de bcrdc (Abutt/on)
Nmerc de amlncoldcs dlferentes
M
a
m

f
e
r
c
s
0
u
t
r
c
s
v
e
r
t
e
b
r
a
d
c
s
l
n
s
e
t
c
s
F
u
n
g
c
s
l
l
a
n
t
a
s

s
u
p
e
r
l
c
r
e
s
Ver Explorao Guiada 5
Evoluo das Protenas.
Tabela 5-5 Seqncias de Aminocidos do Citocromo c de 38 espcies
a
a
A cadeia lateral dos aminocidos foi sombreada de acordo com sua polaridade, de forma que um resduo invariante ou substitudo conservativamente identificado por
uma banda vertical de uma nica cor. A letra a no incio da cadeia indica que o grupo amino N-terminal est acetilado; h indica que o grupo acetil est ausente.
Fonte: Dickerson, R.E., Sci. Am. 226 (4); 58-72 (1972), com correes de Dickerson, R.E. e Timkovich, R., em Boyer, P.D. (Ed.), The Enzymes (3rd ed.), v. 11, p. 421-422,
Academic Press (1975). Publicada com a permisso de Irving Geis.
Voet_Pratt_05.indd 140 19.07.07 10:38:30
Fundamentos de Bioqumica 141
porte eletrnico mitocondrial (Seo 17-2), que, acredita-se, assumiu sua forma
presente entre 1,5 e 2 bilhes de anos atrs, quando os organismos desenvolveram
sua habilidade de respirar. Emanuel Margoliash, Emil Smith e outros elucidaram a
seqncia de aminocidos do citocromo c de mais de cem espcies de eucariotos
diferentes, variando em complexidade da levedura ao homem. O citocromo c das
diferentes espcies um nico polipeptdeo com 104 a 112 resduos. As seqncias
de 38 dessas protenas esto listadas na Tabela 5-5 para mostrar a similaridade entre
os resduos verticalmente alinhados (os resduos esto codificados em cores, de
acordo com suas propriedades fsicas). Um levantamento das seqncias alinhadas
(linha de baixo da Tabela 5-5) mostra que em 38 posies (23 posies no conjunto
completo de > 100 seqncias) o mesmo aminocido aparece em todas as espcies.
45 50 55 60 65 70 75 80 85 90 95 100 104
L
L
L
L
L
L
L
L
L
L
L
L
L
D
L
N

D
D
D
D
L
L
L
L
L
L
L
L
L
L
L
L
L
C
C
K
K
C
C
C
C
C
C
C
C
C
C
C
N

D
^
D
L
C
L
L
L
L
C
C
C
C
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
w
l
l
T
T
T
T
T
T
l
T
T
T
T
l
T
v
T
T
T
T
T
L
L
T
L
T
l
l
L
l
l

N
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
v
v
l
v
v
v
v
v
v
v
v
v
v
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
N
C
C
^
^
^
^
^
^
^
^
^
^
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
^
K
K
K
M
M
K
R
M
M
M
M
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
S
S
^
^
^
^
K
R

N
N
N
N
N
N
N
N
N
N
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
l
K
K
K
K
K
K
K
K
K
K
K
K
D
D
L
L
L
L
D
L
D
D
D
D
L
D
D
D
L
D
D
D
D
N
l
N
N
D
N
K
K
K
N
N
N
N
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
N
T
T
T
T
T
T
T
T
T
T
T
T
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
M
M
L
L
L
L
L
L
L
L
L
L
L
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
S
S
T
T
T
T
T
S
S
S
S
S
S
S
S
S
S
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
S
S
T
S
S
S
S
S
T
S
S
S
S
S
S
S
S
S
S
^
^
S
S
^
S
S
S
S
S
S
S
S
S
S
Y
Y
F
F
F
F
F
F
F
F
F
F
F
Y
F
Y
F
F
F
F
F
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
l
l
l
l
l
l
v
v
l
L
L
L
L
v
^
L

l
l
^
^

D
^
^
^
^
^
l
l
^
^
l
^
^
D
D
D
D
D
D
D
D
D
D
L
^
D
D
D
N
N
N
N
D
D
D
^
^
^
T
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
R
F
F
F
F
S
S
F
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
l
L
L
L
L
L
D
L
D
L
D
D
D
D
D
^
D
D
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
T
L
L
L
L
L
L
L
L
L
L
L
L
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
X
X
X
X
X
X
X
X
X
X
X
X
X
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
K
K
K
K
K
K
K
K
K
K
K
K
K
S
K
K
K
K
K
K
K
K
K
K
X
X
X
X
X
X
X
X
X
X
l
l
l
l
l
l
l
l
l
l
l
l
l
L
l
l
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
v
v
^
^
^
^
^
^
^
^
^
^
^
T
^
^
^
^
^
^
^
C
C
C
l
l
l
l
l
l
l
l
l
l
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
l
l
l
l
l
l
l
l
l
l
l
l
l
v
l
l
l
v
v
l
l
^
^
^
v
v
v
v
v
v
v
v
v
v
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
M
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
T
K
K
K
K
K
K
K
K
K
K
K
^
^
l
l
L
^
D
l
l
l
l
l
l
l
l
l
l
L
L
T
T
C
C
D
C
C
S
^
S
^
K
C
C
S
N
N
N
N
K
K
K

L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
D
D
D
D
L
L
D
D
D
L
D
D
D
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
^
^
L
L
L
^
^
^
^
v
^
^
^
T

^
^
C
C
N
N
N
^
^
^
^
^
^
^
^
^
^
D
D
D
D
D
D
D
D
D
D
D
D
D
N
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
l
L
L
L
L
L
L
L
L
L
L
l
l
l
l
l
l
l
l
l
l
l
l
l
l
l
v
l
l
l
l
l
l
v
l
l
l
l
l
l
l
l
l
l
l
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
^
T
T
T
^
^
^
^
^
^
^
^
^
^
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
F
Y
Y
Y
Y
Y
Y
Y
Y
Y
Y
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
M
M
L
L
L
L
L
L
L
L
L
L
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
L
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
D

D
D
L
S
S
K
L

S
S
K
L
L
K
D
T
L
L
L
L
L
L
L
^
^
^
^
^
^
^
^
^
^
^
^
^
K
^
^
T
S
^
^
^
^
^
^
^
S
S
S
^
^
^
^
S
S
T
^
T
T
T
T
T
T
T
T
T
T
T
T
C
T
^
T
T
T
T
C
S
T
T
T
T
T
T
T
T
T
T
T
N
N
N
N
N
K
N
N
N
S
^
^
S
^
S
S
^
K
K
K
K
L
K
^
S
L
^
^
^
^
^
^
^
^
L
L
L
L
L
L
L
L
L
K
K
K
K
^
K

5 2 2 5 4 1 1 3 1 1 1 1 1 1 1 1 1 1 4 5 4 4 6 2 2 2 2 2 2 2 7 1 2 9 6 1 2 2 1 5 1 3 1 4 7 1 7 2 3 4 6 2 1 1 5 2 1 3 2 1 6
Asp
His
Ala
Met
Ser
D L
H K R X
B C N
S T w Y
^ C F l
Z
L
M l v
Glu
Lys
Cys
Pro
Thr
Arg
Phe
Gly
Val
Trp
Ile
Asn
Tyr
Leu
Gln
Hldrcflloc, oldc:
Hldrcflloc, bsloc:
Hldrcfbloc:
lclar, ncoarregadc: Asn ou Asp
Trimetil Lis
Gln ou Glu
Voet_Pratt_05.indd 141 19.07.07 10:38:31
142 Donald Voet, Judith G. Voet, Charlotte W. Pratt
A maioria das demais posies ocupada por resduos quimicamente similares em
todas as espcies. Em somente oito posies, a seqncia acomoda seis ou mais
resduos diferentes.
De acordo com a teoria da evoluo, as espcies relacionadas entre si evoluram
a partir de um ancestral comum; assim, conclui-se que os genes que especificam
cada uma das suas protenas devem ter evoludo a partir do gene correspondente
do antepassado. A seqncia do citocromo c ancestral acessvel indiretamente,
examinando-se a seqncia das protenas existentes. O citocromo c uma protena
evolutivamente conservada, isto , sua seqncia esteve sujeita somente a modes-
tas mudanas evolutivas.
A Comparao de Seqncias Fornece Informaes sobre a Estrutura e a Funo das
Protenas. Em geral, a comparao da estrutura primria de protenas homlo-
gas (protenas evolutivamente relacionadas) indica qual dos resduos da protena
essencial para a sua funo, quais so menos importantes e quais possuem pe-
quena funo especfica. Por exemplo, encontrar o mesmo resduo em uma posi-
o particular da seqncia de aminocidos em uma srie de protenas relaciona-
das uma forte sugesto de que as propriedades qumicas ou estruturais daquele
resduo invariante correspondem a alguma funo essencial daquelas protenas.
Suas cadeias laterais podem ser necessrias, por exemplo, para a ligao de outra
molcula ou participarem de reaes catalticas. As posies de outros aminoci-
dos podem ter requerimentos no to restritos para a cadeia lateral, podendo, dessa
maneira, acomodar resduos com caractersticas similares (p. ex., Asp ou Glu, Ser
ou Thr, etc.); tais posies so consideradas conservativamente substitudas. Por
outro lado, uma posio especfica de um aminocido pode tolerar vrios resduos
de aminocidos diferentes, indicando que o requisito funcional daquela posio
um tanto inespecfico. Posies como essas so chamadas de hipervariveis.
Por que razo o citocromo c uma protena antiga e vital no idntico em
todas as espcies? Mesmo uma protena bem adaptada sua funo, isto , que no
est sujeita a aprimoramentos fisiolgicos, continua evoluindo. A natureza aleat-
ria dos processos evolutivos ir, ao longo do tempo, mudar tal protena de forma a
no mudar significativamente a sua funo, em um processo chamado de alterao
neutra (mutaes deletrias so, obviamente, rejeitadas por meio da seleo natu-
ral). Os resduos hipervariveis esto aparentemente sujeitos a alteraes neutras.
A Construo de rvores Filogenticas. Muitas concluses de grande alcance sobre a
relao evolucionria podem ser tiradas por meio da comparao das seqncias de
aminocidos de protenas homlogas. A forma mais simples de observarmos as di-
ferenas evolucionrias simplesmente contar o nmero de aminocidos diferentes
entre as protenas. Por exemplo, os dados da Tabela 5-5 mostram que o citocromo c
dos primatas se parece mais com o dos outros mamferos do que com o dos insetos
(8 a 12 diferenas entre os mamferos contra 26 a 31 diferenas entre mamferos e
insetos). De forma similar, o citocromo c dos fungos difere-se muito do dos mam-
feros (45 a 51 diferenas), dos insetos (41 a 47) e das plantas superiores (47 a 54).
A ordem dessas diferenas est dentro do esperado pela taxonomia clssica, a qual
se baseia em caractersticas morfolgicas e no moleculares.
As seqncias de protenas homlogas podem ser analisadas por computador
para construir uma rvore filogentica, que um diagrama que indica a relao
ancestral entre os organismos que produzem aquela protena. A rvore filogentica
para o citocromo c est mostrada na Figura 5-23. rvores similares foram derivadas
para outras protenas. Cada ponto de ramificao representa um ancestral comum
putativo a todos organismos mencionados. As distncias entre os pontos de ramifi-
cao esto expressas como nmero de aminocidos diferentes por cem resduos da
protena. rvores como essas do uma medida mais quantitativa do grau de paren-
tesco entre as vrias espcies do que a taxonomia macroscpica.
Voet_Pratt_05.indd 142 19.07.07 10:38:32
Fundamentos de Bioqumica 143
Observe que as distncias evolutivas de todo o citocromo c moderno at o ponto
mais baixo, o primeiro ancestral comum que produziu tal protena, aproximada-
mente igual para todos. Portanto, organismos inferiores no representam formas
de vida que surgiram primeiro e pararam de evoluir. O citocromo c de todas as es-
pcies includas na Figura 5-23 no importa se chamadas primitivas ou avan-
adas evoluiu aproximadamente na mesma medida.
As Protenas Evoluem a Taxas Caractersticas. As diferenas nas seqncias de pro-
tenas entre vrias espcies podem ser traadas em funo do tempo, quando, de
acordo com o registro fssil, as espcies divergiram. O grfico de uma dada protena
aproximadamente linear, indicando que suas mutaes se acumulam em uma taxa
constante sobre uma escala de tempo geolgica. Contudo, as taxas de evoluo va-
riam entre as protenas (Figura 5-24). Isso no significa que as taxas de mutao
;jc\dh
D. k/ockcrt
Drosopbt/a
C. krusct
N. crassa
Levedura dc fermentc
dc pc
14,5
EaVciVh
>chZidh
6c[W^dh
BVb[Zgdh
E{hhVgdh
GeiZ^h
EZ^mZh
Pbasco/us
aurcus
Semente
de gergellm
Mamcna
Cerme
de trlgc
^tum
lcmbc
latc pequlm
lengulm Callnha, peru
Carpa
Bcnltc
Cac
Lamprla
Caohcrrc
Canguru
Ccelhc
Cavalc
Ser humanc,
ohlmpanz
Maoaoc
rhesus
Tartaruga
vaoa,
pcroc,
cvelha
Marlpcsa
da lagarta
dc tabaoc
Blohcdaseda
Traa
Mcsoa
varejelra
Sapc
Semente
de glrasscl
12,5
13
12
15
11
11
6,5
2
2
3
2
2
2,5
2,5
2,5
3
3
3
4
4
4
5
6
6
6
6
12
25
12
25
7,5
7,5
5
4
6
2
7,5
2
2
Figura 5-23 rvore filogentica do citocromo c. Cada ponto de ramifi-
cao representa um organismo ancestral comum s espcies conectadas na
parte superior. O nmero ao lado de cada ramo indica o nmero de diferenas
inferidas por cem resduos do citocromo c entre os pontos de ramificao ou
espcies. (Conforme Dayhoff, M.O., Park, C.M., McLaughlin, P.J., in: Dayhoff,
M.O. (Ed.), Atlas of Protein Sequence and Structure, p. 8, National Biomedical
Research Foundation [1972].)
Voet_Pratt_05.indd 143 19.07.07 10:38:32
144 Donald Voet, Judith G. Voet, Charlotte W. Pratt
dos DNAs que especificam certas protenas sejam diferentes, mas que
a taxa na qual as mutaes so aceitas em uma protena depende
da extenso em que uma mudana de aminocido afeta a funo da
protena. Por exemplo, a histona H4, uma protena que liga DNA em
eucariotos (Seo 23-5A), uma das protenas mais conservadas (as
histonas H4 da ervilha e da vaca, espcies que divergiram h mais de
1,2 bilho de anos, diferem-se por somente duas alteraes conserva-
tivas em seus 102 resduos). Fica evidente, j que a histona H4 to
importante para o empacotamento do DNA nas clulas, que ela mui-
to intolerante a qualquer mutao. O citocromo c somente um pouco
mais tolerante. Ela uma protena pequena que se liga a vrias outras
protenas. Portanto, qualquer mudana em seus aminocidos deve ser
compatvel com as suas parceiras. J a hemoglobina, que funciona
em suspenso, est sujeita menor presso seletiva que a histona H4
ou o citocromo c; assim, seus resduos superficiais so mais facil-
mente substitudos por outros aminocidos. Os fibrinopeptdeos so
fragmentos de ~20 resduos hidrolisados da protena fibrinognio do
sangue de vertebrados para induzir a coagulao sangnea. Uma vez
removidos, os fibrinopeptdeos so descartados, por isso existe pouca presso seleti-
va para manter suas seqncias de aminocidos.
bvio que as seqncias das protenas isoladamente no conseguem revelar a
histria completa da evoluo. As pequenas diferenas nas seqncias das protenas
no so suficientes para dar conta das diferenas algumas vezes um tanto drsticas
observadas nas caractersticas morfolgicas, mesmo entre espcies prximas. Por
exemplo, as protenas de seres humanos e de chimpanzs so, em mdia, > 99%
idnticas (p. ex., os seus citocromos c so idnticos), mas suas diferenas anatmicas
e comportamentais so to grandes que seres humanos e chimpanzs so classifica-
dos em famlias distintas. Os grandes passos evolutivos que marcam a divergncia
entre as espcies parecem ser acompanhados por mutaes nos genes de protenas
regulatrias que controlam a expresso gnica, isto , quando, onde e quanto de cada
protena sintetizado. Outras mudanas no DNA, como rearranjos e duplicaes de
genes, levam a novas protenas, as quais ficam, ento, sujeitas seleo natural.
B. Duplicao de Genes e Famlias de Protenas
No surpresa que protenas com funes similares possuem seqncias similares;
tais protenas provavelmente evoluram de um ancestral comum. De forma curio-
sa, a anlise de sua seqncia revelou que algumas delas, envolvidas com funes
fisiolgicas totalmente diferentes, tambm possuem seqncias similares de ami-
nocidos. De fato, muitas protenas possuem extensas seqncias similares a outras
protenas do mesmo organismo (veremos no prximo captulo que as estruturas
tridimensionais das protenas so, da mesma forma, altamente conservadas). Tais
protenas surgem da duplicao de genes, um evento de recombinao gentica em
que um cromossomo adquire ambas as cpias do gene primordial (a recombinao
gentica discutida na Seo 24-6). A duplicao de genes um modo particular-
mente eficiente de evoluo porque uma cpia do gene pode desenvolver uma nova
funo por meio da seleo natural, ao passo que sua cpia continua a promover
a sntese da protena original. Dois genes derivados de um evento de duplicao e
que evoluram independentemente so denominados parlogos.
As protenas da famlia das globinas fornecem um excelente exemplo de evo-
luo pela duplicao de genes. A hemoglobina, que transporta O
2
dos pulmes (ou
guelras, ou pele) para os tecidos, um tetrmero com composio subunitria
2

2

(i.e., dois polipeptdeos e dois polipeptdeos ). As seqncias das subunidades
e so similares entre si e com a seqncia da protena mioglobina, que facilita
a difuso do oxignio atravs do tecido muscular (a hemoglobina e a mioglobina
sero discutidas em mais detalhes no Captulo 7). A globina primordial provavel-
N

m
e
r
c

d
e

a
m
l
n
c

o
l
d
c
s

a
l
t
e
r
a
d
c
s
/
1
0
0

l
u
g
a
r
e
s
200 0
Mllhes de ancs desde a dlvergnola
Flbrlncpeptdecs
Hemcglcblna
Cltcorcmc c
Hlstcna H4
1.400 1.200 1.000 800 600 400
140
120
40
0
20
60
80
100
Figura 5-24 Taxas de evoluo de quatro protenas. O
grfico foi construdo colocando-se o nmero de resduos
de aminocidos diferentes nas protenas dos dois lados de
um ponto de ramificao de uma rvore filogentica ver-
sus o tempo, de acordo com registros fsseis de quando as
espcies correspondentes divergiram de seus ancestrais
comuns. (Ilustrao de Irving Geis/Geis Archives trust.
Copyright Howard Hughes Medical Institute. Reproduzida
com permisso.)
Voet_Pratt_05.indd 144 19.07.07 10:38:32
Fundamentos de Bioqumica 145
mente funcionava como uma protena armazenadora de oxignio. A duplicao g-
nica permitiu que uma globina evolusse para a cadeia monomrica hemoglobina
. A duplicao do gene da cadeia permitiu o surgimento do gene parlogo da
cadeia . Outros membros da famlia das globinas incluem a cadeia (parecida
com a cadeia ), presente na hemoglobina fetal, um tetrmero
2

2
, e as cadeias
(parecida com a cadeia ) e (parecida com a cadeia ) que ocorrem nos estgios
iniciais da embriognese como uma hemoglobina
2

2
. Os primatas possuem uma
duplicao relativamente recente da globina, a cadeia (parecida com a cadeia ),
que ocorre como uma componente menor (~1%) da hemoglobina adulta. Apesar
de a hemoglobina
2

2
no possuir nenhuma funo singular conhecida, talvez ela
venha a desenvolver alguma. A genealogia dos membros da famlia das globinas
mostrada na Figura 5-25. O genoma humano contm, alm disso, relquias de genes
de globina que no so mais expressos. Esses pseudogenes podem ser considera-
dos um fim de linha (ou beco sem sada) da evoluo das protenas.
C. Mdulos Proticos
A duplicao de genes no o nico mecanismo para a criao de novas protenas.
A anlise da seqncia de protenas tem revelado que muitas delas so mosaicos
de padres repetidos, ou mdulos, de cerca de 40 a 100 resduos de aminocidos.
Em algumas protenas grandes, um simples mdulo repetido muitas vezes (Figu-
ra 5-26a); outras protenas contm uma variedade de mdulos. Algumas protenas
envolvidas na coagulao sangnea, por exemplo, so construdas a partir de um
conjunto de mdulos menores (Figura 5-26b). A homologia de seqncias entre os
mdulos imperfeita, visto que a seqncia de uma dada protena evolui de forma
independente das demais seqncias. As funes dos mdulos individuais no so
sempre conhecidas: algumas aparentam ter atividades definidas, tal como catalisar
algum tipo de reao qumica ou ligar uma molcula especfica, mas outras so
meros espaadores ou sustentculos para outros mdulos.
Gerar genes novos por meio do embaralhamento de mdulos um processo
muito mais rpido do que duplicar um gene inteiro e esperar que ele sofra mutaes
ao longo do tempo. Contudo, ambos os mecanismos exerceram um importante pa-
pel na evoluo das espcies. O surgimento de uma protena com uma seqncia
nova um evento raro em biologia; a maioria das protenas uma variao de ou-
tras protenas ou de partes delas.
Mlcglcblna
Clcblna prlmcrdlal
B D E G Z A
(a Flbrcneotlna
(b lrctenas da ocagulac sangnea
Fatcres vll, lX, X e prctena C
Fatcr Xll
^tlvadcr tlssular dc plasmlncgnlc
lrctena S
Legenda
Dcmnlc 1 da flbrlncneotlna
Dcmnlc 2 da flbrlncneotlna
Dcmnlc 3 da flbrlncneotlna
Dcmnlc dc Goarbcxlglutamatc
Dcmnlc dc fatcr de oresolmentc epldrmloc
Dcmnlc da prctease da serlna
Dcmnlc de Krlngle
Dcmnlc nloc
Figura 5-25 Genealogia da famlia das globinas. Cada
ponto de ramificao representa um evento de duplicao
de gene. A mioglobina uma protena de cadeia nica. As
globinas identificadas por letras gregas so subunidades
das hemoglobinas.
Figura 5-26 Construo modular de algumas protenas. Cada forma representa um segmento de
~40 a 100 resduos que aparece, com alguma variao de seqncias, vrias vezes em uma protena
ou em um nmero de protenas relacionadas. (a) A fibronectina, uma protena da matriz extracelular,
composta predominantemente pela repetio de mdulos de trs tipos. (b) Algumas protenas que
participam da coagulao sangnea so construdas a partir de um pequeno conjunto de mdulos (o
domnio do fator de crescimento epidrmico assim chamado porque foi primeiro observado como com-
ponente do fator de crecimento epidrmico). (Segundo Baron, M., Norman, D.G, Campbell, I.D., Trends
Biochem. Sci. 16, 14 [1991].)
Voet_Pratt_05.indd 145 19.07.07 10:38:33
146 Donald Voet, Judith G. Voet, Charlotte W. Pratt
RESUMO
1. As propriedades das protenas dependem, em grande parte, do seu
tamanho e da seqncia dos seus polipeptdeos.
2. Os procedimentos de fracionamento so usados para purificar as
protenas baseando-se na solubilidade, na carga, no tamanho e na
especificidade de ligao.
3. Uma protena purificada precisa ser estabilizada.
4. Diferenas de solubilidade permitem a concentrao e a purificao
de protenas pelo mtodo de salting out.
5. A cromatografia, que consiste na separao de substncias solveis
pelas suas diferentes velocidades de deslocamento atravs de uma
matriz insolvel, uma tcnica de purificao de molculas por carga
(cromatografia de troca inica), hidrofobicidade (cromatografia de
interao hidrofbica), tamanho (cromatografia de filtrao em gel)
e propriedades de ligao (cromatografia de afinidade). A ligao e a
eluio muitas vezes dependem da concentrao de sal e do pH.
6. A eletroforese separa as molculas por carga e por tamanho; a SDS-
PAGE separa-as principalmente por tamanho. A eletroforese 2D
pode resolver centenas de protenas.
7. As protenas podem ser separadas por massa na ultracentrifugao.
8. A anlise da seqncia de uma protena comea pela anlise dos
grupos terminais, para determinar o nmero de subunidades, e pela
clivagem das ligaes dissulfeto. A composio de aminocidos
pode tambm ser determinada. Os peptdeos tambm podem ser se-
qenciados por espectroscopia de massas.
9. Os polipeptdeos so clivados em fragmentos de tamanho apropria-
do para o seqenciamento pelo mtodo de degradao de Edman,
no qual os resduos so removidos, um de cada vez, a partir da ex-
tremidade N-terminal.
10. A seqncia de uma protena reconstruda pela sobreposio dos
fragmentos e da informao sobre a posio das ligaes dissulfeto.
As seqncias de um grande nmero de protenas esto arquivadas
em bancos de dados com livre acesso.
11. As protenas evoluem a partir de alteraes de sua estrutura prim-
ria. A comparao das protenas em diferentes espcies pode revelar
quais resduos so os mais essenciais para a estrutura e a funo da
protena.
12. A comparao das seqncias dos polipeptdeos tambm revela a
relao evolucionria entre as diferentes protenas dentro da mesma
espcie.
REFERNCIAS
Purificao de Protenas
Boyer, R.F., Modern Experimental Biochemistry (3
rd
ed.) Benjamin Cum-
mings (2001).
Creighton, T.E. (Ed.), Protein Structure. A Pratical Approach (2
nd
ed.),
IRL Press (1997). (Inclui captulos sobre eletroforese, determinao
de ligaes dissulfeto, espectrometria de massas e tcnicas imunoqu-
micas.)
Hames, B.D. (Ed.), Gel Electrophoresis of Proteins. A practical Approa-
ch (3rd. ed.), IRL Press (1998).
Janson, J.C. and Rydn, L. (Eds.) Protein Purification: Principles, High
Resolution Methods, and Applications, Wiley (1998). (Contm dis-
cusses detalhadas sobre uma grande variedade de tcnicas cromato-
grficas e eletroforticas.)
Laue, T.M. and Stafford, W.F., III, Modern applications of analytical
ultracentrifugation, Annu. Rev. Biophys. Biomol. Struct. 28, 75-100
(1999).
Roe, S. (ED.), Protein Purification Techniques: A Practical Approach
(2
nd
ed.), Oxford University Press (2001).
Tanford, C. and Reynolds, J., Natures Robots: A History of Proteins,
Oxford University Press (2001). [Descries de algumas descobertas
iniciais relacionadas com a natureza das protenas e sua purificao e
anlise.]
Wilson, K. e Walker, J.M. (Eds.), Principles and Techniques of Practi-
cal Biochemistry (5
th
ed.) Cambridge University Press (2001). (Inclui
revises sobre centrifugao, espectroscopia, eletroforese e cromato-
grafia.)
Seqenciamento das Protenas
Aebersold, R. and Mann, M., Mass spectrometry-based proteomics, Na-
ture 422, 198-207 (2003). (Descreve alguns mtodos de anlise de
protenas por espectrometria de massas, bem como as aplicaes cor-
rentes e potenciais.)
Blackman, D.S., The Logic of Biochemical Sequencing, CRC Press
(1994). (Na forma de perguntas e respostas, fornece uma reviso das
estratgias e tcnicas de seqenciamento de protenas e cidos nu-
clicos.)
Findlay, J.B.C., e Geisow, M.J. (Eds.), Protein Sequencing. A Pratical
Approach, IRL Press (1989).
Galperin, M.Y., The molecular biology database collection: 2004 update,
Nucleic Acids Res. 32, D3-D22 (2004). (Este e outros artigos no mes-
mo fascculo descrevem as caractersticas e o uso potencial de vrios
bancos de dados de seqncias de DNA e de protenas.)
Evoluo das Protenas
Baxevanis, A.D. and Ouellette, B.F.F. (Eds.), Bioinformatics, A Practical
Guide to the Analysis of Genes and Proteins (3
rd
ed.), Wiley-Intes-
cience (2005).
Doolittle, R.F., Feng, D.-F., Tsang, S., Cho, G., e Little, E., Determining
divergence times of the major kingdoms of living organisms with a
protein clock, Science 271, 470-477 (1996). (Demonstra como as se-
qncias de protenas podem ser usadas para traar rvores filogen-
ticas.)
Henikoff, S., Greene, E.A., Pietrokovski, S., Bork, P., Attwood, T.K.,
and Hood, L., Gene families: The taxonomy of protein paralogs and
chimeras, Science 278, 609-614 (1997). (Explica como a duplicao
gnica e os rearranjos permitem inovaes funcionais nas protenas
dentro de uma espcie.)
Mount, D.W., Bioinformatics, Sequence and Genome Analysis, Cold
Spring Harbor Laboratory Press (2001).
Voet_Pratt_05.indd 146 19.07.07 10:38:33
Fundamentos de Bioqumica 147
TERMOS-CHAVE
aminopeptidase
anlise de grupo N-terminal
antibitico
antgeno
rvore filogentica
auto-radiografia
carboxipeptidase
centrifugao em gradiente de
densidade em equilbrio
composio em aminocido
cromatografia
cromatografia de afinidade
cromatografia de
imunoafinidade
cromatografia de interao
hidrofbica
cromatografia de troca inica
degradao de Edman
deslocamento neutro
desnaturao
duplicao de gene
eletroforese capilar (EC)
ELISA
Lei de Beer-Lambert
absorbncia (A)
grau de absoro molar ()
cromforo
ensaio de Bradford
fracionamento
cromatografia de afinidade por
metal
IEF
eletroforese bidimensional em gel
proteoma
endopeptidase
espectrometria de massas
genes parlogos
eluio
eluidor
endopeptidase
ensaio
estrutura primria
evoluo darwiniana
exopeptidase
fase estacionria
fase mvel
filtrao em gel
gradiente de densidade
HPLC
immunoblot (Western blot)
imunoensaio
ligante
mercaptana
mdulo
nuclease
peptdeo
polieletrlito
procedimento de fracionamento
protease
protena multissubunidade
protenas homlogas
protelise limitada
pseudogene
reao enzimtica acoplada
resduo hipervarivel
resduo invariante
RIA
salting in
salting out
SDS-PAGE
substituio conservativa
subunidade
Svedberg (S)
trocador de nions
trocador de ctions
ultracentrifugao
ultracentrifugao analtica
ultracentrifugao preparativa
ultracentrifugao zonal
EXERCCIOS
1. Relacione os 20 aminocidos na ordem de sua abundncia nas pro-
tenas.
2. Liste alguns fatores que influenciam a estabilidade das protenas
purificadas.
3. Relacione as tcnicas de separao que exploram as seguintes pro-
priedades moleculares: carga, polaridade, tamanho e especificidade.
4. Em que a cromatografia de troca inica se difere da cromatografia
por afinidade?
5. Quais informaes podem ser obtidas por meio da ultracentrifuga-
o?
6. Como podem ser identificados os resduos N-terminais das prote-
nas?
7. Por que as ligaes dissulfeto devem ser rompidas antes do seqen-
ciamento das protenas?
8. Por que o conhecimento da composio de aminocidos antes do
seqenciamento pode ser muito til?
9. Descreva os passos da degradao de Edman.
10. Relacione algumas vantagens da automao dos procedimentos de
laboratrio.
11. Que informao obtida ao comparar-se as seqncias de protenas
de diferentes organismos?
12. Como se constri uma rvore filogentica?
PROBLEMAS
1. Qual peptdeo que possui maior absorbncia em 280 nm?
A. Gln-Leu-Glu-Phe-Thr-Leu-Asp-Gly-Tyr
B. Ser-Val-Trp-Asp-Phe-Gly-Tyr-Trp-Ala
2. (a) Em que ordem os aminocidos Arg, His e Leu seriam eludos de
uma coluna de carboximetil em pH 6? (b) Em que ordem Glu, Lys e
Val seriam eludos de uma coluna de dietilaminoetil em pH 8?
3. Explique por que uma certa protena possui uma massa molecular
aparente de 90 kD, quando determinada por gel filtrao, e de 60
kD, quando determinada por SDS-PAGE na presena e na ausncia
de 2-mercaptoetanol. Qual a determinao de massa molecular
mais exata?
4. Determine a composio de subunidades de uma protena a partir
das seguintes informaes:
Massa molecular por filtrao em gel: 200 kD
Massa molecular por SDS-PAGE: 100 kD
Massa molecular por SDS-PAGE e 2-mercaptoetanol: 40 kD
e 60 kD.
5. Explique por que uma protena que possui um coeficiente de sedi-
mentao de 2,6 S, quando ultracentrifugada em uma soluo de
NaCl 0,1 M, possui um coeficiente de sedimentao de 4,3 S em
uma soluo contendo NaCl 1M.
Voet_Pratt_05.indd 147 19.07.07 10:38:33
148 Donald Voet, Judith G. Voet, Charlotte W. Pratt
6. Qual procedimento de fracionamento pode ser usado para purificar
a protena 1 a partir de uma mistura de protenas cuja composio
em aminocidos a seguinte:
1. 25% Ala, 20% Gly, 20% Ser, 10% Ile, 10% Val, 5% Asn, 5%
Gln, 5% Pro
2. 30% Gln, 25% Glu, 20% Lys, 15% Ser, 10% Cys
3. 25% Asn, 20% Gly, 20% Asp, 20% Ser, 10% Lys, 5% Tyr
As trs protenas so semelhantes em tamanho e pI, e no existe an-
ticorpo disponvel que reconhea a protena 1. (Problema fornecido
por Bruce Wightman, Muhlenberg College.)
7. Explique por que o tratamento com cloreto de dansila de uma sim-
ples cadeia polipeptdica seguido por sua completa hidrlise cida
produz vrios aminocidos dansilados.
8. Identifique o primeiro resduo obtido pela degradao de Edman do
citocromo c da (a) Drosophila, (b) da levedura do fermento do po e
(c) do germe do trigo (Tabela 5-5).
9. Voc precisa clivar o seguinte peptdeo em pequenos fragmentos
Qual das proteases relacionadas na Tabela 5-3 gerar o maior nme-
ro de fragmentos? Qual gerar o menor nmero de fragmentos?
NMTQGRCKPVNTFVHEPLVDVQNVCFKE
10. Voc deseja determinar a seqncia de um peptdeo curto. A cliva-
gem com tripsina gera trs peptdeos menores com as seqncias:
Leu-Glu, Gly-Tyr-Asn-Arg e Gln-Ala-Phe-Val-Lys. A clivagem
com quimotripsina gera trs peptdeos com as seqncias: Gln-Ala-
Phe, Asn-Arg-Leu-Glu e Val-Lys-Gly-Tyr. Qual a seqncia do
peptdeo intacto?
11. Reaes separadas de clivagem de um polipeptdeo por CNBr e qui-
motripsina produz fragmentos com as seqncias de aminocidos
listadas a seguir. Qual a seqncia do polipeptdeo intacto?
Tratamento com CNBr
1. Arg-Ala-Tyr-Gly-Asn
2. Leu-Phe-Met
3. Asp-Met
Quimotripsina
4. Met-Arg-Ala-Tyr
5. Asp-Met-Leu-Phe
6. Gly-Asn
12. Voc deseja determinar a seqncia de um peptdeo que tem a se-
guinte composio de aminocidos:
1 Ala 4 Arg 2 Asn 3 Asp 4 Cys 3 Gly 1 Gln 4 Glu
1 His 1 Lys 1 Met 1 Phe 2 Pro 4 Ser 2 Tyr 1 Trp
(a) Qual o nmero mximo de peptdeos que voc pode esperar
da clivagem do polipeptdeo com brometo de cianognio?
(b) Qual o nmero mximo de peptdeos que voc pode esperar
da clivagem do polipeptdeo com quimotripsina?
(c) A anlise do peptdeo intacto revela a inexistncia de grupos
sulfidrila livres. Quantas ligaes dissulfeto devem estar pre-
sentes?
(d) Quantas combinaes diferentes de ligaes dissulfeto so pos-
sveis?
13. O tratamento de um polipeptdeo com 2-mercaptoetanol gera dois
polipeptdeos:
1. Ala-Val-Cys-Arg-Thr-Gly-Cys-Lys-Asn-Phe-Leu
2. Tyr-Lys-Cys-Phe-Arg-His-Thr-Lys-Cys-Ser
O tratamento do polipeptdeo intacto com tripsina gera fragmentos
com a seguinte composio de aminocidos:
3. (Ala, Arg, Cys
2
, Ser, Val)
4. (Arg, Cys
2
, Gly, Lys, Thr, Phe)
5. (Asn, Leu, Phe)
6. (His, Lys, Thr)
7. (Lys, Tyr)
Indique as posies das ligaes dissulfeto no polipeptdeo intacto.
14. Voc deseja seqenciar a cadeia menor de um inibidor de protease
da planta Brassica nigra. A hidrlise da cadeia menor pela tripsina
e pela quimotripsina produz os fragmentos citados a seguir. Qual a
seqncia da cadeia leve?
Quimotripsina
1. Leu-His-Lys-Gln-Ala-Asn-Gln-Ser-Gly-Gly-Gly-Pro-Ser
2. Gln-Gln-Ala-Gln-His-Leu-Arg-Ala-Cys-Gln-Gln-Trp
3. Arg-Ile-Pro-Lys-Cys-Arg-Lys-Phe
Tripsina
4. Arg
5. Ala-Cys-Gln-Gln-Trp-Leu-His-Lys
6. Cys-Arg
7. Gln-Ala-Asn-Gln-Ser-Gly-Gly-Gly-Pro-Ser
8. Phe-Gln-Gln-Ala-Gln-Leu-Arg
9. Ila-Pro-Lys
10. Lys
(Problema fornecido por Kathleen Cornely, Providence College,
EUA.)
15. Em experimentos de mutagnese stio-dirigida, Gly substitui com
freqncia Val, mas Val raramente substitui Gly. Explique.
16. Abaixo est uma lista dos primeiros 10 resduos da hlice B da mio-
globina de diferentes organismos:
posio 1 2 3 4 5 6 7 8 9 10
humana D I P G H G Q E V L
galinha D I A G H G H E V L
crocodilo K L P E H G H E V I
tartaruga D L S A H G Q E V I
atum D Y T T M G G L V L
carpa D F E G T G G E V L
Com base nessa informao, quais posies (a) parecem incapazes
de tolerar substituies, (b) podem tolerar substituio conservativa,
e (c) so altamente variveis?
EXERCCIOS DE BIOINFORMTICA
Os exerccios de bioinformtica relativos a este captulo esto dispo-
nveis no apndice no final do livro e no stio www.wiley.com/colle-
ge/voet.
Voet_Pratt_05.indd 148 19.07.07 10:38:33

You might also like