You are on page 1of 24

FINAL EXAM

Statistical Genetics

Herry Rinaldi Sinaga (140610120091)


Statistics Department University of Padjadjaran
2015

BAB 4
Single-QTL analysis
4.1 Marker Regression
Metode paling sederhana dalam

analisis pemetaan QTL adalah dengan

mempertimbangkan setiap marker individual, membagi individu ke dalam kelompok


menurut genotipe mereka di marker, dan membandingkan rata-rata fenotipe
kelompok.

Figure 4.1. Plot pencaran antara fenotipe tekanan darah dengan genotipe pada 2
marker terpilih untuk data hyper
Dalam backcross, kita uji linkage (keterkaitan) marker dalam QTL dengan uji t ;
Dalam intercross , kita gunakan analisis varians (ANOVA) yang akan memberikan F
statistik. Biasanya, bukti adanya liinkage dalam QTL diukur oleh skor LOD: yaitu
log10 perbandingan rasio likelihood

antara hipotesis ada QTL pada marker dan

hipotesis bahwa tidak ada QTL pada marker. Dengan kata lain skor LOD adalah
perbandingan di antara log10 rasio likelihood di bawah hipotesis nol dan log10 rasio
likelihood di bawah hipotesis alternatif

26

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

0
10
2
1

Individu dengan data genotipe yang hilang pada marker

harus dihilangkan dari

estimasi alternatif, sehingga dalam perhitungan skor LOD, individu tersebut


dihilangkan dari keduanya baik likelihood nol dan alternatif
LOD skor ekuivalen dengan Fstatistic ANOVA. (Dan sebagi catatan bahwa t statistic
di backcross adalah akar kuadrat dari Fstatistic yang diperoleh dari ANOVA.) Dimana
df menunjukkan derajat kebebasan (df = 1 untuk backcross dan df = 2 untuk
intercross); hubungan antara Fstatistic dan skor LOD dirumuskan sebagai berikut.
=
=

0 1
1
0
1
1
2

= 10 1

Fungsi invers dari formula ini adalah:


=

10
+1
2
1

Estimasi proporsi dari varians fenotipe yang dapat dijelaskan oleh QTL
(yaitu,estimasi heritabilitas sesuai QTL) adalah (RSS0 - RSS1) / RSS0. Dengan
2

demikian, estimasi persentase varians yang dijelaskan oleh QTL adalah 1 - 10 .


Skor LOD yang besar menunjukkan bukti adanya QTL, tapi untuk melihat statistik
signifikansi skor LOD, kita harus memperhitungkan dari beberapa tes yang dilakukan.
Pembahasan masalah ini ditangguhkan untuk Sec. 4.3.
Keuntungan utama dari marker regression adalah kesederhanaannya: kita hanya
perlu melakukan uji t atau ANOVA pada setiap marker. Dengan demikian, tidak ada
perangkat lunak khusus yang diperlukan, dan juga mungkin dengan mudah untuk
menggabungkan kovariat (seperti seks) atau mempeeluas analisis untu model yang
lebih kompleks (seperti untuk perlakuan waktu survival tersensor).
27

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

Kelemahan utamanya adalah harus menghilangkan individu dengan marker genotipe


hilang. Selanjutnya, seseorang tidak dapat memeriksa posisi antara marker , dan
memperoleh informasi yang kurang tentang lokasi QTL.Dan juga ,keberartian efek
QTL akan dilemahkan oleh linkage yang tidak lengkap pada marker. Sebagai contoh,
misalnya backcross dengan QTL tunggal, dimana AA dan AB menunjukkanratarata fenotip untuk dua genotipe QTL, sehingga efek dari QTL adalah = AB - AA.
Jika fraksi rekombinasi antara marker dan QTL adalah r, maka individu dengan
genotipe AA marker akan terdiri dari fraksi (1 - r) dengan genotipe QTL AA dan
sebuah fraksi r dengan genotype QTL AB. Jadi rata-rata fenotipe untuk individu
dengan marker AA akan menjadi AA (1 - r) + AB r. Demikian pula, rata-rata fenotip
untuk individu marker AB akan menjadi AB (1-r) + AA r. Sebagai hasilnya, di selisih
antara rata-rata fenotip untuk dua kelompok marker genotipe akan menjadi [AB (1
- r) + AA r] - [AA (1 - r) + AB r] = (1 - 2r), sehingga kejelasan efek dari QTL akan
berkurang oleh faktor (1 - 2r) karena hubungan yang tidak lengkap pada marker.
Kerugian utama pada marker

regression adalah bahwa kita memperhatikan

keberadaan QTL tunggal. Dengan demikian kita memiliki kemampuan yang terbatas
untuk memisahkan pautan

QTL dan tidak memiliki kemampuan untuk menilai

kemungkinan interaksi antara QTL. Kerugian ini akan dijelaskan pada setiap metode
yang dijelaskan dalam bab ini.
# Load R/qtl and the hyper data
library(qtl)
data(hyper)
# Phenotype by genotype for two markers in the hyper data
par(mfrow=c(1,2))
plot.pxg(hyper, "D4Mit214")
plot.pxg(hyper, "D12Mit20")
# single-QTL scan by marker regression with the hyper data
out.mr <- scanone(hyper, method="mr")
28

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

# results for chromosome 12


out.mr[ out.mr$chr == 12, ]
# summary of out.mr
summary(out.mr, threshold=3)
# The biggest peak
max(out.mr)
# Membuat plot hasil regressi untuk chr 4 and 12
plot(out.mr, chr=c(4, 12), ylab="LOD score")

Gambar 4.2. Skor LOD untuk setiap penanda pada kromosom 4 dan 12 untuk hiper
data, dihitung dengan marker regression .

4.2 Interval mapping


Pada bagian ini, kita mempertimbangkan beberapa varian pada pemetaan interval.
Pemetaan
29

Interval

meningkat

pada

metode

regresi

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

marker

dengan

mempertimbangkan data genotipe yang hilang pada QTL yang diduga. Berbagai
metode pemetaan Interval berbeda dalam perlakuan mereka terhadap data genotipe
hilang.
Interval mapping standar menggunakan estimasi maksimum likelihood berdasarkan
model campuran, sedangkan metode regresi Haley-Knott menggunakan pendekatan
model campuran. Metode multiple imputasi menggunakan model campuran yang
sama tetapi dengan beberapa imputasi dalam maksimum likelihood.

4.2.1 Standard interval mapping


Dalam pemetaan interval

standar, kita menganggap kembali

keberadaan QTL

tunggal,
tapi sekarang kita mempertimbangkan grid posisi di sepanjang genom sebagai
mungkin
lokasi untuk QTL tersebut. Pertimbangkan posisi yang tetap tertentu untuk QTL, dan
biarkan gi menunjukkan genotipe QTL untuk individu i. Seperti dengan regresi
penanda
metode, kita mengasumsikan bahwa yi | gi ~ N (gi, 2), tapi sekarang genotipe QTL
adalah
umumnya tidak diketahui.
Untuk setiap individu, kita dapat menghitung PIJ = Pr (gi = j | M i), di mana M i
menunjukkan data penanda genotipe multipoint untuk individu i.
skor LOD dapat dihitung sebagai berikut.
= 10

ij(yi; j , 2 )

(yi; 0 , 20 )

Dimana 0 dan 0 adalah rata-rata dan SD dari yi, sehingga penyebut skor LOD adalah
likelihood di bawah hipotesis nol dimana tidak ada QTL di genom manapun.
Dalam pemetaan selang standar, algoritma EM dilakukan pada setiap posisi grid
dugaan lokasi QTL sepanjang genom, sedangkan estimasi dan likelihood di bawah
hipotesis nol dihitung sekali saja.

30

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

Keuntungan utama dari pemetaan selang adalah memberikan penyelesaian yang


tepat untuk

data genotipe yang hilang. Dengan demikian, kita tidak perlu

menghilangkan individu dengan genotype yang hilang di penanda , dan kita dapat
memeriksa posisi antara penanda. Dengan demikian kita mendapatkan pemahaman
yang lebih jelas tentang lokasi. QTL (Memiliki kurva LOD yang bagus untuk dilihat.
Hasil pemetaan mengandung tabel p-value)Kemudian dapat meningkatkan estimasi
kita tentang efek QTL, seperti perkiraan lokas QTL.
Kekurangan pemetaan selang meliputi membutuhkan waktu komputasi yang lebih
lama,membutuhkan software khusus,dan kesulitan dalam model yang kompleks, atau
dalam hal memasukkan kovariat lainnya. Kelemahan ini tidak lagi begitu penting,
karena selang pemetaan hanya membutuhkan beberapa detik dengan komputer,
berbagai program komputer yang relevan juga sudah yang tersedia, dan berbagai
ekstensi juga sudah dimasukkan..
Kerugian yang paling penting dari pemetaan selang

adalah bahwa kita masih

bergantung hanya pada satu model-QTL, dan kita memiliki keterbatasan untuk
memisahkan QTL terpaut dan tidak memiliki kemampuan untuk menilai
kemungkinan interaksi antara QTL.Dengan data penanda genotype yang lengkap,
pemetaan interval dan regresi penanda memberikan hasil yang sama pada penanda
Example:
# Menghitung peluang genotype untuk data hyper
> hyper <- calc.genoprob(hyper, step=1, error.prob=0.001)
# membuat ilustrasi dengan jittermap
> hyper <- jittermap(hyper)
# Melakukan interval mapping pada data dengan metode EM algorithm
> out.em <- scanone(hyper, method="em")
Warning message:
In scanone(hyper, method = "em") : First running calc.genoprob.
# Melakukan interval mapping dengan menghilangkan fungsi em (ekuivalen dengan
perintah sebelumnya)
> out.em <- scanone(hyper)
Warning message:
31

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

In scanone(hyper) : First running calc.genoprob.


# Membuat Plot hasil standard interval mapping untuk semua kromosom
> plot(out.em, ylab="LOD score")

Figure 4.4. Skor LOD dengan standard interval mapping untuk data hyper.
# Membuat Plot hasil interval mapping dan marker regression bersamaan
> plot(out.em, out.mr, chr=c(4, 12), col=c("blue", "red"),
+

ylab="LOD score")

# Membuat plot dengan cara lain (ekuivalen dengan perintah sebelumnya)


> plot(out.em, chr=c(4, 12), col="blue", ylab="LOD score")
> plot(out.mr, chr=c(4, 12), col="red", add=TRUE)

32

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

Gambar 4.5.Skor LOD untuk kromosom tertentu untuk data hyper dengan
standardinterval mapping (biru) dan marker regression (merah).
4.2.2 HaleyKnott regression
Regresi Haley-Knott memberikan

pendekatan yang lebih

singkat dibanding

pemetaan selang standar. Dalam pemetaan selang standar, kita mengasumsikan


bahwa yi | gi ~ N (gi, 2), di mana yi adalah fenotip individu i dan gi adalah QTL
genotipe (tidak teramati).Denagn pij = Pr (gi = j | M i), di mana M i adalah data
penanda genotipe untuk individu i. Diketahui yi | M i mengikuti campuran dari
distribusi normal.
Perhatikan bahwa E (yi | M i) =

j , sehingga rata-rata bersyarat dari fenotip

adalah linier dengan j. Hal ini menunjukkan bahwa j dapat diestimasi dengan
regresi linier yi terhadap pij.
Pada regresi Haley-Knott setiap posisi grid melewati genom , kita menghitung pij
dan kemudian meregresikan fenotip pada matriks.Untuk itu,, kita misalkan bahwa yi
| M i ~ N (

j 2 ). Artinya, kita ganti distribusi campuran normal dengan

distribusi normal tunggal melalui fungsi rata-rata yang tepat.. Dengan demikian kita
dapat menghitung nilai LOD sebagai berikut.
=

0
10
2
1

Dimana RSS0 adalah jumlah kuadrat residual noldan RSS1 adalah jumlah kuadrat
residual dari regresi ntara yi terhadap pij . Regresi Haley-Knott bisa jauh lebih cepat
dari pemetaan selang standar jika

algoritma iteratif tidak diperlukan; hanya

melakukan regresi tunggal . Namun, penanganan data genotipe yang hilang masih
kurang dari ideal, dan pendekatan pemetaan selang standar lemah dalam hal
informasi genotipe yang buruk. Pendekatan ini terutama lemah dalam kasus
selektifitas genotip (individu dengan fenotipe dan genotipe yang ekstrim ).
Contoh:
# Menjalankan fungsi Regresi Haley--Knott dengan menggunakan data hyper
> out.hk <- scanone(hyper, method="hk")
Warning message:
33

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

In scanone(hyper, method = "hk") : First running calc.genoprob.


># Membuat grafik Plot Hasil EM (standard interval mapping) dan H-K secara
bersamaan.
> plot(out.em, out.hk, chr=c(1,4,15), col=c("blue","red"),
+

ylab="LOD score")

> # Membuat grafik selisih skor LOD antara H-K and EM


> plot(out.hk - out.em, chr=c(1,4,15), ylim=c(-0.5, 1.0),
+

ylab=expression(LOD[HK] - LOD[EM]))

> abline(h=0, lty=3)

4.2.3 Extended HaleyKnott regression


Perluasan dari regresi Haley-Knott dapat diperoleh dengan memperhatikan varians.
Dalam regresi Haley-Knott diasumsikan E (yi | M i) =
yi | M i ~ N (

j dan dibuat pendekatan

j 2 ). Artinya, kita lakukan pendekatan distribusi campuran

terhadap distribusi nomal tunggal dengan rata-rata tertentu dan dengan varians
yang konstan dan independen terhadap genotipe.
Dalam metode perluasan regresi Haley-Knott, kita dapat bahwa
( | ) = [( | )| ] + [( | )| ]
= ( | ) + ( 2 | )
=
Dimana =

dan

(, ) =

+ 2

()]+ 2 =

( ) 2+2
Pada metode perluasan HaleyKnott kita asumsikan bahwa yi | M i ~ N (

j 2

).. Artinya, kita ganti distribusi campuran dengan distribusi normal tunggal tetapi
dengan rata-rata tertentu dan fungsi varians
Kiat estimasi dan 2 dengan maximum likelihood.Hal ini memerlukan metode
iterative , dimana

umumnya metode ini lebih cepat mendapatkan hasil yang

konvergen daripada algoritma EM pada model campuran.


Metode perluasan Haley-Knott tidak secepat regresi Haley-Knott , tetapi dapat
34

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

memberikan peningkatan dalam perkiraan dan metode ini masih lebih cepat dan
lebih robust jika dibandingkan dengan metode pemetaan selang standar.
Contoh:
# Menjalankan fungsi metode perluasan Haley--Knott dengan menggunakan data
hyper
> out.ehk <- scanone(hyper, method="ehk")
Warning message:
In scanone(hyper, method = "ehk") : First running calc.genoprob.
# Membuat grafik plot gabungan hasil ketiga metode secara bersamaan
> plot(out.em, out.hk, out.ehk, chr=c(1,4,15), ylab="LOD score",
+

lty=c(1,1,2))

# Atau bisa juga dengan fungsi berikut .


> plot(out.em, chr=c(1,4,15), ylab="LOD score")
> plot(out.hk, chr=c(1,4,15), col="blue", add=TRUE)
> plot(out.ehk, chr=c(1,4,15), col="red", lty=2, add=TRUE)
> # Membuat plot selisih Skor LOD antara ketiga metode
> plot(out.hk - out.em, out.ehk - out.em, chr=c(1, 4, 15),
+

col=c("blue", "red"), ylim=c(-0.5, 1),

ylab=expression(LOD[HK] - LOD[EM]))

> abline(h=0, lty=3)

35

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

Figure 4.8.LOD scores for selected chromosomes for thehyperdata by standard


interval mapping (black), HaleyKnott regression (blue), and the extended Haley
Knott method (red, dashed)

Figure 4.9.Differences in the LOD scores from HaleyKnott regression (in blue)
and the extended HaleyKnott method (in red) from the LOD scores of standard
36

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

interval mapping, for selected chromosomes from the hyperdata

4.2.4 Multiple imputation


Masalah pemetaan QTL dapat dibagi menjadi dua bagian: masalah data yang hilang
dan masalah pemilihan model.Pendekatan imputasi berganda mengatasi masalah
data yang hilang dengan mengisi semua data genotip yang hilang, bahkan di daerah
antara penanda (pada grid sekitarkromosom). Dengan data genotipe yang lengkap
,kecocokan model QTL lebih baik dari ANOVA (untuk model single-QTL) atau regresi
berganda

(untuk

multiple

-QTL

model).

Satu-satunya kekurangannya adalah bahwa imputasi tersebut harus dilakukan


beberapa

kali,

dimana hasilnya merupakan kombinasi dari imputasi berganda. Selain itu, kombinasi
dari hasil imputasi tunggal dapat menjadi rumit. Imputasinya sederhana dan model
fit dengan masing-masing imputasisederhana , namun kombinasi dari imputasi
cukup

sulit.

Genotipe dihitung secara acak, tetapi tergantung pada penanda genotype yang
diamati : kita simulasikan distribusi bersama genotype

berdasarkan data yang

diamati.
> # Perform multiple imputations with hyper data
> hyper <- sim.geno(hyper, step=1, n.draws=64, error.prob=0.001)
>
> # Interval mapping by multiple imputation with hyper data
> out.imp <- scanone(hyper, method="imp")
>
> # Plot imputation and em results for hyper data
> plot(out.em, out.imp, chr=c(1,4,15), col=c("blue", "red"),
+

ylab="LOD score")

>
> # Difference between H-K and EM results for hyper data
> plot(out.imp - out.em, chr=c(1,4,15), ylim=c(-0.5, 0.5),
37

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

ylab=expression(LOD[IMP] - LOD[EM]))

Error in `-.scanone`(out.imp, out.em) :


Can't subtract; arguments not compatible
> abline(h=0, lty=3)
> # Difference between H-K and EM results for hyper data
> plot(out.imp - out.em, chr=c(1, 4, 15), ylim=c(-0.5, 0.5),
+

ylab=expression(LOD[IMP] - LOD[EM]))

> abline(h=0, lty=3)

Figure 4.12.LOD scores for selected chromosomes for thehyperdata by standard


interval mapping (blue) and multiple imputation (red).

38

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

4.2.5 Perbandingan Metode


Berikut akan dijelaskan keuntungan dan kekurangan dari berbagai metode pemetaan
QTL

tunggal

Table 4.2.Relative advantages and disadvantages of the four interval mapping


methods.
Use

of

genotype

Selective

information

Robustness genotyping

Speed

Standard interval mapping

++

HaleyKnott

Extended HaleyKnott

Multiple imputation

++

Example:
# Hilangkan data 2 marker pada kromosom 1 data listeria
> data(listeria)
> mar2drop <- markernames(listeria, chr=1)[2:12]
39

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

> listeria <- drop.markers(listeria, mar2drop)


# Jalnkan pemetaan interval standard
> listeria <- calc.genoprob(listeria, step=1, error.prob=0.001)
> outl.em <- scanone(listeria, chr=1)
> outl.hk <- scanone(listeria, chr=1, method="hk")
> outl.ehk <- scanone(listeria, chr=1, method="ehk")
> plot(outl.em, outl.hk, outl.ehk, ylab="LOD score",
+

lty=c(1,1,2))

(gambar 4.14)
# Identifikasi dan hapus marker dengan data hilang yang paling banyak pada data
hyper
> data(hyper)
> nt.mar <- ntyped(hyper, "mar")
> mar2drop <- names(nt.mar[nt.mar < 92])
> hyper.rev <- drop.markers(hyper, mar2drop)
# Hilangkan data genotype pada individu dengan fenotipe intermediate
> nm.ind <- nmissing(hyper.rev)
> ind2drop <- nm.ind > 0
> for(i in 1:nchr(hyper))
+ hyper.rev$geno[[i]]$data[ind2drop,] <- NA
# kita kenali genom semua individu dengan metode standard interval mapping,
HaleyKnott regression and the extended Haley Knott method
> hyper.rev <- calc.genoprob(hyper.rev, step=1,
+

error.prob=0.001)

> out1.em <- scanone(hyper.rev)


> out1.hk <- scanone(hyper.rev, method="hk")
> out1.ehk <- scanone(hyper.rev, method="ehk")
# Buat Grafik kurva LOD untuk metode EM, HK and eHK
> plot(out1.em, out1.hk, out1.ehk, ylab="LOD score",
40

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

lty=c(1,1,2))

># Buat grafik selisih HK-EM dan eHK-EM


> plot(out1.hk-out1.em, out1.ehk-out1.em, col=c("blue", "red"),
+

ylim=c(-0.1, 4), ylab=expression(LOD[HK] - LOD[EM]))

> abline(h=0, lty=3)


# identifikasi genootipe individu
> hyper.ex <- subset(hyper.rev, ind = !ind2drop)
> out2.em <- scanone(hyper.ex)
> out2.hk <- scanone(hyper.ex, method="hk")
> out2.ehk <- scanone(hyper.ex, method="ehk")
# Buat plot selisih skor LOD dengan standard interval mapping ketika semua
individu dimasukkan.
> plot(out2.em-out1.em, out2.hk-out1.em, out2.ehk-out1.em,
+

ylim=c(-0.1, 0.2), col=c("black", "green", "red"),

lty=c(1,3,2), ylab="Difference in LOD scores")

> abline(h=0, lty=3)


> # Time to run calc.genoprob
> data(hyper)
> system.time(hyper <- calc.genoprob(hyper, step=0.25,
+

error.prob=0.001))
user system elapsed
4.01 0.21 5.40

>
> # Time to run scanone
> system.time(test.hk <- scanone(hyper, method="hk"))
user system elapsed
0.39 0.07 0.50
> system.time(test.ehk <- scanone(hyper, method="ehk"))
user system elapsed
1.45 0.03 1.52
> system.time(test.em <- scanone(hyper, method="em"))
41

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

user system elapsed


1.89 0.03 2.03
> # Time to do multiple imputation
> system.time(hyper <- sim.geno(hyper, step=0.25,
+

error.prob=0.001, n.draws=32))
user system elapsed

17.19 0.92 18.71


> system.time(test.imp <- scanone(hyper, method="imp"))
user system elapsed
4.05 0.16 5.45
>

4.3 Significance thresholds


Example:
Kita tes permutasi dengan mengggunakan data hyper. Kita dapat menampilkan tes
permutasi dari metode pemetaan QTL menggunakan n.perm ke fungsi scanone. Jadi
kita akan menggunakan fungsi scanone seperti sebelumnya dengan tambahan
n.perm=1000
> data(hyper)
> hyper <- calc.genoprob(hyper, step=1, error.prob=0.001)
Sekarang kita gunakan verbose=FALSE untuk mencegah output lain.
> operm <- scanone(hyper, n.perm=1000, verbose=FALSE)
Kita lihat 5 hasil pertama sebagai berikut
> operm[1:5]
[1] 1.547 1.434 4.184 2.151 1.060

42

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

Histogra dari hasil permutasi di bentuk sebagai berikut,dalam gabar 4.21


> plot(operm)

Untuk memperoleh estimasi genome-wide LOD thresholds taraf signifikan 20% dan 5
% sebagai berikut
> summary(operm, alpha=c(0.20, 0.05))
LOD thresholds (1000 permutations)
lod
20%

2.16

5%

2.76

Diatas adalah cara biasa tes permutasi. Bagaimanapun, untuk data hyper genotipe
selektif digunakan,jadi baiknya digunakan stratified permutation test. Pertama kita
temukan vektor yg mengindikasikan strata, sebagai berikut. Kita tempatkan
individual yang genotipe lebih dari 100 marker di dalam satu grup dan yang lainnya
di grup berikutnya.
> strat <- (ntyped(hyper) > 100)
Kemudian

kita

rerun

tes

permutasi

menggunakan

mengindikasikan strata.
> operms <- scanone(hyper, n.perm=1000, perm.strata=strat,
43

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

perm.strata

untuk

+ verbose=FALSE)
Di hasil ini kita temukan sedikit perbedaan di significance threshold ketika
menggunakan the stratified permutation test.
The 5% threshold is 2.71 (versus 2.76 from the traditional permutation test).
> summary(operms, alpha=c(0.20, 0.05))
chr pos
c1.loc45

lod

1 48.3 3.53

D4Mit164

4 29.5 8.09

Lebih lanjutnya kita peroleh genome-scan-adjusted p-value untuk setiap puncak LOD
> summary(out.em, perms=operms, alpha=0.1, pvalues=TRUE)
chr pos
c1.loc45

D4Mit164

lod pval

48.3 3.53 0.008


29.5 8.09 0.000

Untuk QT di kromosom 4 estimasi p-valuenya adalah 0 yang artinya tidak ada


permutasi yang terlihat.
Kita dapat mendapatkan upper confidence limit dari p-value
dengan menggunakan binom.test function, sebagai berikut.
> binom.test(0, 1000)$conf.int
[1] 0.000000 0.003682
Sehingga p < 0.004.

44

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

yang sebenarnya

4.4 The X chromosome


Contoh
Kita bisa menghitung LOD support intervals dan Bayes credible intervals dengan
fungsi lodint dan bayesint. Kita menghitung LOD support intervals 1,5 dan Bayes
credible intervals 95% untuk kromosom 4 di data hyper sebagai berikut.

Dapat

menggunakan expandtomarkers untuk memperluas interval ke marker

terdekat, sebagai berikut.

Kita lakukan bootstrap dengan kromosom 4 dari data hyper sebagai berikut.
> out.boot <- scanoneboot(hyper, chr=4, n.boot=1000)
Sebuah histogram dari hasil bootstrap ditunjukkan pada Gambar. 4.29.
> summary(out.boot)

45

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

chr pos lod


D4Mit41

4 14.2 6.076

D4Mit164 4 29.5 9.151


D4Mit276 4 32.8 3.881
Hasil ini sedikit lebih besar dari LOD support intervals dan Bayes credible intervals

4.6 QTL effects


# Menentukan marker terdekat 29.5 cM pada chr 4
find.marker(hyper, 4, 29.5)
# effectplot dalam hyper data, marker D4Mit164
hyper <- sim.geno(hyper, n.draws=16, error.prob=0.001)
effectplot(hyper, mname1="D4Mit164")
# Estimasi dari effectplot
eff <- effectplot(hyper, mname1="D4Mit164", draw=FALSE)
eff
# Plot phenotypes dengan genotype at D4Mit164
plot.pxg(hyper, marker="D4Mit164")

46

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

4.7 Multiple phenotypes


Example:
# Masukkan log(liver) dan log(spleen) ke fenotipe
data(iron)
iron$pheno <- cbind(iron$pheno[,1:2],
log2liver=log2(iron$pheno$liver),
log2spleen=log2(iron$pheno$spleen),
iron$pheno[,3:4])
# Genome scan with log(liver)
iron <- calc.genoprob(iron, step=1, error.prob=0.001)
out.logliver <- scanone(iron, pheno.col=3)
# Genome scan, referring to the phenotype by name.
out.logliver <- scanone(iron, pheno.col="log2liver")
# Genome scan, referring to the phenotype by name.
out.logliver <- scanone(iron,
pheno.col=log2(iron$pheno$liver))
47

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

# Genome scan with all four phenotypes


out.all <- scanone(iron, pheno.col=1:4)
# Look at the beginning of out.all
out.all[1:5,]
# summary of out.all
summary(out.all, threshold=3, lodcolumn=4)
# summary of out.all with format="allpheno"
summary(out.all, threshold=3, format="allpheno")
# summary of out.all with format="allpeaks"
summary(out.all, threshold=3, format="allpeaks")
# Membuat Plot untuk semuka kurva LOD
plot(out.all, lodcolumn=1:2, col=c("blue", "red"),
chr=c(2, 7, 8, 9, 16), ylim=c(0,12.7), ylab="LOD score")
plot(out.all, lodcolumn=3:4, col=c("blue", "red"), lty=2,
chr=c(2, 7, 8, 9, 16), add=TRUE)
# Permutasi untuk 4 iron phenotypes
operm.all <- scanone(iron, pheno.col=1:4, n.perm=1000,
perm.Xsp=TRUE)
# LOD thresholds untuk semua phenotypes
summary(operm.all, alpha=0.05)
# Kesimpulan dengan 5% thresholds yang dihitung dari perms, and pvalues
summary(out.all, format="allpeaks", perms=operm.all,
alpha=0.05, pvalues=TRUE)
References
Broman KW, Sen S (2009) . A Guide to QTL Mapping with R/qtl
48

Resume of A Guide to QTL Mapping with R/qtl ,chapter 3-4 | Herry Sinaga

You might also like