Professional Documents
Culture Documents
Statistical Genetics
BAB 4
Single-QTL analysis
4.1 Marker Regression
Metode paling sederhana dalam
Figure 4.1. Plot pencaran antara fenotipe tekanan darah dengan genotipe pada 2
marker terpilih untuk data hyper
Dalam backcross, kita uji linkage (keterkaitan) marker dalam QTL dengan uji t ;
Dalam intercross , kita gunakan analisis varians (ANOVA) yang akan memberikan F
statistik. Biasanya, bukti adanya liinkage dalam QTL diukur oleh skor LOD: yaitu
log10 perbandingan rasio likelihood
hipotesis bahwa tidak ada QTL pada marker. Dengan kata lain skor LOD adalah
perbandingan di antara log10 rasio likelihood di bawah hipotesis nol dan log10 rasio
likelihood di bawah hipotesis alternatif
26
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
0
10
2
1
0 1
1
0
1
1
2
= 10 1
10
+1
2
1
Estimasi proporsi dari varians fenotipe yang dapat dijelaskan oleh QTL
(yaitu,estimasi heritabilitas sesuai QTL) adalah (RSS0 - RSS1) / RSS0. Dengan
2
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
keberadaan QTL tunggal. Dengan demikian kita memiliki kemampuan yang terbatas
untuk memisahkan pautan
kemungkinan interaksi antara QTL. Kerugian ini akan dijelaskan pada setiap metode
yang dijelaskan dalam bab ini.
# Load R/qtl and the hyper data
library(qtl)
data(hyper)
# Phenotype by genotype for two markers in the hyper data
par(mfrow=c(1,2))
plot.pxg(hyper, "D4Mit214")
plot.pxg(hyper, "D12Mit20")
# single-QTL scan by marker regression with the hyper data
out.mr <- scanone(hyper, method="mr")
28
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
Gambar 4.2. Skor LOD untuk setiap penanda pada kromosom 4 dan 12 untuk hiper
data, dihitung dengan marker regression .
Interval
meningkat
pada
metode
regresi
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
marker
dengan
mempertimbangkan data genotipe yang hilang pada QTL yang diduga. Berbagai
metode pemetaan Interval berbeda dalam perlakuan mereka terhadap data genotipe
hilang.
Interval mapping standar menggunakan estimasi maksimum likelihood berdasarkan
model campuran, sedangkan metode regresi Haley-Knott menggunakan pendekatan
model campuran. Metode multiple imputasi menggunakan model campuran yang
sama tetapi dengan beberapa imputasi dalam maksimum likelihood.
keberadaan QTL
tunggal,
tapi sekarang kita mempertimbangkan grid posisi di sepanjang genom sebagai
mungkin
lokasi untuk QTL tersebut. Pertimbangkan posisi yang tetap tertentu untuk QTL, dan
biarkan gi menunjukkan genotipe QTL untuk individu i. Seperti dengan regresi
penanda
metode, kita mengasumsikan bahwa yi | gi ~ N (gi, 2), tapi sekarang genotipe QTL
adalah
umumnya tidak diketahui.
Untuk setiap individu, kita dapat menghitung PIJ = Pr (gi = j | M i), di mana M i
menunjukkan data penanda genotipe multipoint untuk individu i.
skor LOD dapat dihitung sebagai berikut.
= 10
ij(yi; j , 2 )
(yi; 0 , 20 )
Dimana 0 dan 0 adalah rata-rata dan SD dari yi, sehingga penyebut skor LOD adalah
likelihood di bawah hipotesis nol dimana tidak ada QTL di genom manapun.
Dalam pemetaan selang standar, algoritma EM dilakukan pada setiap posisi grid
dugaan lokasi QTL sepanjang genom, sedangkan estimasi dan likelihood di bawah
hipotesis nol dihitung sekali saja.
30
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
menghilangkan individu dengan genotype yang hilang di penanda , dan kita dapat
memeriksa posisi antara penanda. Dengan demikian kita mendapatkan pemahaman
yang lebih jelas tentang lokasi. QTL (Memiliki kurva LOD yang bagus untuk dilihat.
Hasil pemetaan mengandung tabel p-value)Kemudian dapat meningkatkan estimasi
kita tentang efek QTL, seperti perkiraan lokas QTL.
Kekurangan pemetaan selang meliputi membutuhkan waktu komputasi yang lebih
lama,membutuhkan software khusus,dan kesulitan dalam model yang kompleks, atau
dalam hal memasukkan kovariat lainnya. Kelemahan ini tidak lagi begitu penting,
karena selang pemetaan hanya membutuhkan beberapa detik dengan komputer,
berbagai program komputer yang relevan juga sudah yang tersedia, dan berbagai
ekstensi juga sudah dimasukkan..
Kerugian yang paling penting dari pemetaan selang
bergantung hanya pada satu model-QTL, dan kita memiliki keterbatasan untuk
memisahkan QTL terpaut dan tidak memiliki kemampuan untuk menilai
kemungkinan interaksi antara QTL.Dengan data penanda genotype yang lengkap,
pemetaan interval dan regresi penanda memberikan hasil yang sama pada penanda
Example:
# Menghitung peluang genotype untuk data hyper
> hyper <- calc.genoprob(hyper, step=1, error.prob=0.001)
# membuat ilustrasi dengan jittermap
> hyper <- jittermap(hyper)
# Melakukan interval mapping pada data dengan metode EM algorithm
> out.em <- scanone(hyper, method="em")
Warning message:
In scanone(hyper, method = "em") : First running calc.genoprob.
# Melakukan interval mapping dengan menghilangkan fungsi em (ekuivalen dengan
perintah sebelumnya)
> out.em <- scanone(hyper)
Warning message:
31
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
Figure 4.4. Skor LOD dengan standard interval mapping untuk data hyper.
# Membuat Plot hasil interval mapping dan marker regression bersamaan
> plot(out.em, out.mr, chr=c(4, 12), col=c("blue", "red"),
+
ylab="LOD score")
32
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
Gambar 4.5.Skor LOD untuk kromosom tertentu untuk data hyper dengan
standardinterval mapping (biru) dan marker regression (merah).
4.2.2 HaleyKnott regression
Regresi Haley-Knott memberikan
singkat dibanding
adalah linier dengan j. Hal ini menunjukkan bahwa j dapat diestimasi dengan
regresi linier yi terhadap pij.
Pada regresi Haley-Knott setiap posisi grid melewati genom , kita menghitung pij
dan kemudian meregresikan fenotip pada matriks.Untuk itu,, kita misalkan bahwa yi
| M i ~ N (
distribusi normal tunggal melalui fungsi rata-rata yang tepat.. Dengan demikian kita
dapat menghitung nilai LOD sebagai berikut.
=
0
10
2
1
Dimana RSS0 adalah jumlah kuadrat residual noldan RSS1 adalah jumlah kuadrat
residual dari regresi ntara yi terhadap pij . Regresi Haley-Knott bisa jauh lebih cepat
dari pemetaan selang standar jika
melakukan regresi tunggal . Namun, penanganan data genotipe yang hilang masih
kurang dari ideal, dan pendekatan pemetaan selang standar lemah dalam hal
informasi genotipe yang buruk. Pendekatan ini terutama lemah dalam kasus
selektifitas genotip (individu dengan fenotipe dan genotipe yang ekstrim ).
Contoh:
# Menjalankan fungsi Regresi Haley--Knott dengan menggunakan data hyper
> out.hk <- scanone(hyper, method="hk")
Warning message:
33
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
ylab="LOD score")
ylab=expression(LOD[HK] - LOD[EM]))
terhadap distribusi nomal tunggal dengan rata-rata tertentu dan dengan varians
yang konstan dan independen terhadap genotipe.
Dalam metode perluasan regresi Haley-Knott, kita dapat bahwa
( | ) = [( | )| ] + [( | )| ]
= ( | ) + ( 2 | )
=
Dimana =
dan
(, ) =
+ 2
()]+ 2 =
( ) 2+2
Pada metode perluasan HaleyKnott kita asumsikan bahwa yi | M i ~ N (
j 2
).. Artinya, kita ganti distribusi campuran dengan distribusi normal tunggal tetapi
dengan rata-rata tertentu dan fungsi varians
Kiat estimasi dan 2 dengan maximum likelihood.Hal ini memerlukan metode
iterative , dimana
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
memberikan peningkatan dalam perkiraan dan metode ini masih lebih cepat dan
lebih robust jika dibandingkan dengan metode pemetaan selang standar.
Contoh:
# Menjalankan fungsi metode perluasan Haley--Knott dengan menggunakan data
hyper
> out.ehk <- scanone(hyper, method="ehk")
Warning message:
In scanone(hyper, method = "ehk") : First running calc.genoprob.
# Membuat grafik plot gabungan hasil ketiga metode secara bersamaan
> plot(out.em, out.hk, out.ehk, chr=c(1,4,15), ylab="LOD score",
+
lty=c(1,1,2))
ylab=expression(LOD[HK] - LOD[EM]))
35
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
Figure 4.9.Differences in the LOD scores from HaleyKnott regression (in blue)
and the extended HaleyKnott method (in red) from the LOD scores of standard
36
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
(untuk
multiple
-QTL
model).
kali,
dimana hasilnya merupakan kombinasi dari imputasi berganda. Selain itu, kombinasi
dari hasil imputasi tunggal dapat menjadi rumit. Imputasinya sederhana dan model
fit dengan masing-masing imputasisederhana , namun kombinasi dari imputasi
cukup
sulit.
Genotipe dihitung secara acak, tetapi tergantung pada penanda genotype yang
diamati : kita simulasikan distribusi bersama genotype
diamati.
> # Perform multiple imputations with hyper data
> hyper <- sim.geno(hyper, step=1, n.draws=64, error.prob=0.001)
>
> # Interval mapping by multiple imputation with hyper data
> out.imp <- scanone(hyper, method="imp")
>
> # Plot imputation and em results for hyper data
> plot(out.em, out.imp, chr=c(1,4,15), col=c("blue", "red"),
+
ylab="LOD score")
>
> # Difference between H-K and EM results for hyper data
> plot(out.imp - out.em, chr=c(1,4,15), ylim=c(-0.5, 0.5),
37
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
ylab=expression(LOD[IMP] - LOD[EM]))
ylab=expression(LOD[IMP] - LOD[EM]))
38
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
tunggal
of
genotype
Selective
information
Robustness genotyping
Speed
++
HaleyKnott
Extended HaleyKnott
Multiple imputation
++
Example:
# Hilangkan data 2 marker pada kromosom 1 data listeria
> data(listeria)
> mar2drop <- markernames(listeria, chr=1)[2:12]
39
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
lty=c(1,1,2))
(gambar 4.14)
# Identifikasi dan hapus marker dengan data hilang yang paling banyak pada data
hyper
> data(hyper)
> nt.mar <- ntyped(hyper, "mar")
> mar2drop <- names(nt.mar[nt.mar < 92])
> hyper.rev <- drop.markers(hyper, mar2drop)
# Hilangkan data genotype pada individu dengan fenotipe intermediate
> nm.ind <- nmissing(hyper.rev)
> ind2drop <- nm.ind > 0
> for(i in 1:nchr(hyper))
+ hyper.rev$geno[[i]]$data[ind2drop,] <- NA
# kita kenali genom semua individu dengan metode standard interval mapping,
HaleyKnott regression and the extended Haley Knott method
> hyper.rev <- calc.genoprob(hyper.rev, step=1,
+
error.prob=0.001)
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
lty=c(1,1,2))
error.prob=0.001))
user system elapsed
4.01 0.21 5.40
>
> # Time to run scanone
> system.time(test.hk <- scanone(hyper, method="hk"))
user system elapsed
0.39 0.07 0.50
> system.time(test.ehk <- scanone(hyper, method="ehk"))
user system elapsed
1.45 0.03 1.52
> system.time(test.em <- scanone(hyper, method="em"))
41
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
error.prob=0.001, n.draws=32))
user system elapsed
42
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
Untuk memperoleh estimasi genome-wide LOD thresholds taraf signifikan 20% dan 5
% sebagai berikut
> summary(operm, alpha=c(0.20, 0.05))
LOD thresholds (1000 permutations)
lod
20%
2.16
5%
2.76
Diatas adalah cara biasa tes permutasi. Bagaimanapun, untuk data hyper genotipe
selektif digunakan,jadi baiknya digunakan stratified permutation test. Pertama kita
temukan vektor yg mengindikasikan strata, sebagai berikut. Kita tempatkan
individual yang genotipe lebih dari 100 marker di dalam satu grup dan yang lainnya
di grup berikutnya.
> strat <- (ntyped(hyper) > 100)
Kemudian
kita
rerun
tes
permutasi
menggunakan
mengindikasikan strata.
> operms <- scanone(hyper, n.perm=1000, perm.strata=strat,
43
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
perm.strata
untuk
+ verbose=FALSE)
Di hasil ini kita temukan sedikit perbedaan di significance threshold ketika
menggunakan the stratified permutation test.
The 5% threshold is 2.71 (versus 2.76 from the traditional permutation test).
> summary(operms, alpha=c(0.20, 0.05))
chr pos
c1.loc45
lod
1 48.3 3.53
D4Mit164
4 29.5 8.09
Lebih lanjutnya kita peroleh genome-scan-adjusted p-value untuk setiap puncak LOD
> summary(out.em, perms=operms, alpha=0.1, pvalues=TRUE)
chr pos
c1.loc45
D4Mit164
lod pval
44
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
yang sebenarnya
Dapat
Kita lakukan bootstrap dengan kromosom 4 dari data hyper sebagai berikut.
> out.boot <- scanoneboot(hyper, chr=4, n.boot=1000)
Sebuah histogram dari hasil bootstrap ditunjukkan pada Gambar. 4.29.
> summary(out.boot)
45
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
4 14.2 6.076
46
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga
Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga