Professional Documents
Culture Documents
e-mail: perisa.zakarija@unidu.hr
1.
Uvod
2.
3.
4.
5.
6.
7.
Pribavi - Izvri
8.
9.
Uvod
Da bi instrukcijski set arhitekture bio uspjean mora biti dizajniran tako da preivi brze izmjene ra unalne
tehnologije (IBM mainframe jezgra 35 godina).
Danas $1000 kupi ra unalo boljih performansi od onog iz 1980 vrijedno $1.000.000.
Sedamdesetih porast 25-30% godinje (mainframe i midi ra unala bazirana na IC).
Do osamdesetih porast performansi 35% (tehnologija, mikroprocesor), dalje 58% (tehnologija, arhitektura i
organizacija RISC (paralelizam izvo enja instrukcija, priru na memorija), eliminacija asemblera, UNIX
Tehnoloki trendovi:
Mikroprocesor preuzeo sva podru ja (radne stanice, mini i maiframe servere)
Tehnologija implementacije logike integriranih krugova (IC Logic):
gusto a tranzistora raste 35% godinje ( etverostruka u etiri godine)
veli ina matrice (die) raste 10% do 20% godinje
kombinacija daje 55% godinji porast broja tranzistora na ipu.
Semiconductor DRAM (Dynamic Random Access Memory)
gusto a tranzistora raste 40% do 60% godinje ( etverostruka u tri do etiri godine)
ciklus pada sporo, tre inu u 10 godina
brzina pristupa raste dvostruko u odnosu na pad latencije.
Magnetski diskovi
gusto a raste 100% godinje ( etverostruka u dvije godine). Do 1990 rasla 30% godinje.
Vrijeme pristupa kra e za tre inu u 10 godina.
kapacitet narastao 4000 puta, a cijena po MB pala 10.000 puta od 1983 do 2001
Mrena tehnologija
ovisna o brzini opreme i transmisijskog sustava
sporo se uvodi (ethernet 10Mbps je 10 godina prelazio na 100Mbps)
radi sve ve e vanosti 1Gbps ethernet ulazi 5 godina nakon 100Mbps
Napredak ovisi o tehnologiji, esto je skokovit (MOS tehnologija - Cache na procesor)
Predvi anja
1989 za 1996
8
0,35
100
150
Stvarno
1996
6
0,35
400
200
Predvi anja
1996 za 2000
40
0,2
2400
900
Stvarno
2000
42
0,18
3000
1400
Predvi anja
1996 za 2006
350
0,1
20000
4000
Stvarno
2006
400 (800)
0,045
27000
3000 (4000)
SPECmark programi
int Benchmark
164.gzip
175.vpr
176.gcc
181.mcf
186.crafty
197.parser
252.eon
253.perlbmk
254.gap
255.vortex
256.bzip2
300.twolf
Jezik
C
C
C
C
C
C
C++
C
C
C
C
C
Opis
Compression
FPGA Circuit Placement and Routing
C Programming Language Compiler
Combinatorial Optimization
Game Playing: Chess
Word Processing
Computer Visualization
PERL Programming Language
Group Theory, Interpreter
Object-oriented Database
Compression
Place and Route Simulator
fp Benchmark
168.wupwise
171.swim
172.mgrid
173.applu
177.mesa
178.galgel
179.art
183.equake
187.facerec
188.ammp
189.lucas
191.fma3d
200.sixtrack
301.apsi
Jezik
Fortran 77
Fortran 77
Fortran 77
Fortran 77
C
Fortran 90
C
C
Fortran 90
C
Fortran 90
Fortran 90
Fortran 77
Fortran 77
Opis
Physics / Quantum Chromodynamics
Shallow Water Modeling
Multi-grid Solver: 3D Potential Field
Parabolic / Elliptic Partial Differential Equations
3-D Graphics Library
Computational Fluid Dynamics
Image Recognition / Neural Networks
Seismic Wave Propagation Simulation
Image Processing: Face Recognition
Computational Chemistry
Number Theory / Primality Testing
Finite-element Crash Simulation
High Energy Nuclear Physics Accelerator Design
Meteorology: Pollutant Distribution
Embedded
$10 - $100.000
$0,2 - $200
(po procesoru)
1.500.000.000
Cijena, potronja,
specifi ne performanse
Stolna Ra unala:
Od $1000 do $10000.
Trite pokretano odnosom cijena/mogu nosti (uglavnom ra unalna i grafi ka)
Dobro okarakterizirano aplikativno solidni benchmark testovi (interaktivni web?)
Serveri
Web Availability!
Skalabilnost (ra unalna mo , memorija, I/O propusnost, pohrana)
Propusnost (Throughput, transakcija/minuta)
Embeded ra unala
Najve i rast (mikrovalna pe , vozila, mobiteli, igra e konzole, switch-evi)
Od 4 bitnih do 64 bitnih procesora
Samo jedan program, klju ni dijelovi u asembleru.
Rad u stvarnom vremenu - est zahtjev (soft real-time npr. DVD)
EEMBC benchmark ?
Minimalizam kod upotrebe memorije
o Na istom ili drugom ipu
o tednja na programu, podaci su uvjetovani primjenom
Minimalna potronja energije
o Rad na baterije
o Grijanje ventilator?
G.J. Myers
Arhitektura ra unala definirana distribucijom funkcija
po zadanim razinama, a svaka razina predstavlja
odre enu apstraktnu predodbu ra unala
o Arhitektura sustava najvia razina: koje funkcije
obrade podataka osigurava ra unalo, a koje
vanjski svijet (operater, krajnji korisnik, DBA)
o Namjenski sustav namjenski programi isporu eni
s ra unalom
o Jezi ni procesori programski, opis i rukovanje
DB, upravlja ki, komandno-terminalski)
Vide nie programske razine kao apstraktne
koje se odnose na upravljanje logi kim i
fizi kim resursima ra unala
o Upravljanje logi kim resursima upravljanje DB,
datotekama, virtualnom memorijom, obradom u
mrei ra unala
o Upravljanje fizi kim resursima rukovanje
primarnom i sekundarnom memorijom, radom
procesora i drugim ure ajima
o Centralna procesorska jedinica apstrakcija fizi kog dijela ra unala. Od toga na nie arhitektura
ra unala s opisima distribucije funkcija pojedinih dijelova. Crtice ozna avaju granicu funkcija
realiziranih sklopovskom opremom i mikroprogramom (firmware)
10
Granica izme u sklopovske i programske opreme sve nejasnija radi razvoja tehnologije.
Dualizam sklopovske i programske opreme: prije sve to moe rijei programski, sada sve to moe rijei
sklopovski
Definicija:
Arhitektura ra unala je vjetina oblikovanja ra unala radi ostvarivanja korisnikova zahtjeva. To se postie
primjenom niza tehnika, postupaka i zahvata u svim hijerarhijskim razinama ra unala.
11
12
13
A=(1,1)'
SISD (Single Instruction Stream
Single Data Stream)
o sekvencijalna ra unala von
Neumannovog modela ra unanja
A=(N,1)'
MISD (Multiple Instruction
Stream Single Data Stream)
o Proto na ra unala (pipeline)
A=(1,M)'
SIMD (Single Instruction
Stream Multiple Data Stream)
o Matri na ra unala
A=(N,M)'
MIMD (Multiple Instruction
Stream Multiple Data Stream)
o Multiprocesorska ra unala
14
15
Aritmeti ka jedinica
Sklopovi za obavljanje osnovnih aritmeti kih operacija
Registri za privremeno pohranjivanje operanda
Binarni brojevni sustav
Osnova sustava prikaz podataka i instrukcija
laka tehnoloka izvedba sklopova
ekonomi no prikazivanje brojeva
''ra unalo nije samo aritmeti ki stroj ve je po svojoj prirodi i logi ki. Logi ki sustav su sustavi da-ne,
odnosno binarni sustavi'' (Burks, 1946)
Aritmeti ke operacije su dobivene koritenjem logi kih elementarni digitalni sklopovi izvravaju logi ke
operacije!
Aritmeti ka jedinica Aritmeti ko-Logi ka jedinica (ALU)
Aritmeti ko-Logi ka jedinica von Neumannovog ra unala sastoji se od:
zbrajala
sklopa za posmak
Ostale operacije:
oduzimanje: pribrajanje dvostrukog komplementa
mnoenje i dijeljenje: programski upravljano ponavljanje operacija zbrajanja (oduzimanja) i posmaka
Upravlja ka jedinica
Daje potrebne signale za vremensko vo enje i upravljanje ostalim jedinicama ra unala
Slijedno izvo enje algoritma
Korak algoritma instrukcija ili niz instrukcija
Instrukcija elementarna operacija koju ra unalo moe izvesti
Odvijanje programa:
UJ pribavlja instrukciju (fetch) u kodiranom obliku
Dekodira instrukciju
U skladu sa zna enjem instrukcije generira signale pomo u kojih ALU, memorija i UI jedinica izvode
operacije
17
Memorijska rije
Duina 40 bita (ra unalo za numeri ke zadatke tadanjim matemati kih problema)
8 bit Operacijski kod: binarno kodirana instrukcija koja e se izvriti (28=256 razli itih kodova operacija)
12 bit Adresa operanda nad kojim se operacija obavlja (212=4096 adresa kapacitet memorije)
40 bita: preciznost od 2-40 iznosi priblino 0,9*10-12 - dvanaest decimala
Instrukcije von Neumannovog ra unala
Aritmeti ke i logi ke instrukcije
Instrukcije za prijenos podataka (ALU-memorija)
Instrukcije uvjetnog i bezuvjetnog grananja
Ulazno-izlazne instrukcije
Instrukcije s djelomi nom zamjenom
o modificirale adresni dio instrukcije za vrijeme izvo enja programa
o ista naredba radi nad razli itim skupovima podataka
o naputeno '60-tih radi problema s ispitivanjem ispravnosti rada programa
19
Jedno-adresne instrukcije
20
22
23
Trend:
24
SELECT
ULAZ
BC
IZLAZ
R
_
R/W
ULAZ
IZLAZ
S
READ/WRITE
STANJE
Q
0
1
00
0
1
ULAZ SR
01
10
0
1
0
1
DRAM elija
25
Operacija:
ITAJ
SELECT
0
ULAZ
0 ili 1
IZLAZ
S
STANJE
Q
0
1
00
0
1
READ/WRITE
ULAZ SR
01
10
0
1
0
1
26
Operacija: PII
SELECT
1 (0) R
ULAZ
0 (1)
0 (1)
0 (1)
S
STANJE
Q
0
1
00
0
1
IZLAZ
READ/WRITE
ULAZ SR
01
10
0
1
0
1
27
Ulazni podatak
Rije 0
A0
A1
DEKODER 2 na 4
Adresa
B
C
B
C
B
C
B
C
B
C
B
C
B
C
B
C
B
C
B
C
B
C
B
C
Rije 1
Rije 2
Rije 3
Omogu i memoriju
READ/WRITE
Izlazni podatak
28
Memorija
Radna memorija:
4096 rije i malo
samo za podravanje rada CPU
163840 bistabila relejima neizvedivo
40 Selectrona kapaciteta po 4096 bita
o katodna cijev za memoriranje
o svijetlo polje 1, tamno 0
PROCESOR
8080
8086
80286
80386-Pentium
Itanium
256
64 k
64 k
64 k
64 M
Sekundarna memorija
upravljana ra unalom (ne zahtijeva intervenciju operatera)
ve i kapacitet
sporija
jeftinija
predlagali svjetlosno osjetljiv film, magnetsku traku, magnetnu icu
Tre a razina memorije
nije integralni dio ra unala
prema potrebi se uklju uje u ra unalo (operater)
istog tipa kao i sekundarna
29
Ulazno-Izlazna jedinica
Omogu uje komunikaciju operatera i ra unala
Teleprinter s pomo nom magnetno i anom memorijom.
Omogu en prijenos s papirnate trake na magnetsku icu i obratno
Izlazna nadzorna jedinica Selectron
Jednokorisni ko ra unalo pa je U/I prijenos podataka pod direktnim upravljanjem CPU.
SISD arhitektura:
u bilo kojem trenutku na spojnom putu memorije i CPU nalazi se samo jedna instrukcija
na spojnom putu CPU i memorije nalazi se u bilo kojem trenutku najvie jedan podatak.
(Faza Pribavi pribavi samo jednu instrukciju iz memorije, a faza Izvri obradi slijedno pribavljene podatke)
Von Neumannovo usko grlo
CENTRALNA
PROCESORSKA
JEDINICA
MEMORIJA
30
Algoritam obrade
Memorijska jedinica
Beskona na traka
Aritmeti ko-logi ka
jedinica
Posebna jedinica
Ulazno-Izlazna jedinica
Beskona na traka
Posebna jednica
SLI NOST:
Obrada se odvija u ritmu signala vremenskog vo enja vremensko diskretni ure aji
31
Skalarni CISC
Skalarni RISC
Superskalarni CISC
Superskalarni RISC
Superproto na ra unala
VLIW Very Long
Instruction Words
ra unala
Vektorska Superra unala
32
33
Superskalarni RISC
Izdaje i izvrava vie od jedne instrukcije tijekom jednog perioda signala takta
Tipi ni predstavnici: i960, PowerPC 620, R10000
Superskalarni CISC
CISC procesori s RISC jezgrom
CISC instrukcije se prilikom dekodiranja pretvaraju u RISC instrukcije i zatim izvravaju u RISC jezgri
Istodobno se mogu izvoditi 1 do 3 CISC instrukcije
Predstavnici:K5, Pentium Pro, MC68060
Vektorski procesori
Rade s vie operanada predo enih vektorima
Visok stupanj paralelizma na razini rije i operanda
Vektorizacija (vektorski registri i sl.)
Proto nost
Visoka razina paralelizma na nivou funkcijskih jedinica
Predstavnici: Cray 1, 2, X-MP, C90, Hitachi S820, NEC SX-8
VLIW Very Long Instruction Words
Horizontalno mikroprogramiranje
Mogu nost paralelizma ne procjenjuje HW, eksplicitno je upisana u instrukciju
Superskalarna obrada
Viestrukost funkcijskih jedinica
Predstavnici: Mpact (media processor, Chromatic Research Inc.), Trace200 (Multiflow), FPS120B,
Transmeta Crusoe
34
35
Primjer
Intel: Itanium 2
VLIW instrukcijska rije 128 bit sadri 3 41bitne instrukcije i 5 template bitova: EPIC Explicit Parallel
Instruction Computing
Superskalarnost: 2 load/store jedinice isporu e 2 instrukcijske rije i (6 instrukcija) u jednom ciklusu
L3 cache: 9MB
36
Intel CPU
4004
8088
80286
80386
80486
Pentium
Pentium II
Pentium III
Pentium 4
Pentium 4
CPU
Pentium
Pentium MMX
Pentium II
Athlon
Pentium III
Pentium III
Athlon XP
Pentium 4
Pentium 4
Athlon XP+
Athlon 64 FX
Pentium 4
Tehnologija
(mikron)
10
3
1,5
1
1.0/0.8
0.8/0.5/0.35
0.28/0.25
0.25/0.18/0.13
0.18/0.13
0.09
Tehnologija
(mikron)
0,8
0,28
0,25
0,25
0,18
0,13
0,18
0,18
0,13
0,13
0,13
0,09
0,108
4,7-8
6-12,5
16-33
25-100
60-200
233-450
450-1200
1400-2200
2200-3600
Povrina
(mm2)
294
140
131
184
106
80
128
217
145
115
193
112
Broj
tranzistora
(milijuna)
3,1
4,5
7,5
22
28
28
38
42
55
54
106
125
37
Tehnologija
(mikom)
Povrina
(mm2)
4
iu
m
FX
nt
Pe
64
XP
+
At
hl
on
hl
on
At
iu
m
4
nt
iu
m
Pe
XP
nt
Pe
III
hl
on
At
iu
m
III
nt
iu
m
Pe
nt
hl
on
Pe
II
iu
m
At
X
nt
Pe
iu
m
Pe
nt
Pe
nt
iu
m
Broj transistora
(milijuna)
38