Cours Architectures Avancées Sur Puces
Cours Architectures Avancées Sur Puces
Cours Architectures Avancées Sur Puces
Assistant
Anne Universitaire 2013/2014
ISIMG,
Miniaturisation processeurs
Convergence de # sciences
sensor
sensor
brake
brake
ABS
hydraulic
pump
brake
brake
sensor
sensor
Basse consommation.
GPS
receiver
search
engine
database
renderer
display
Carte
user
interface
Masques technologiques
Fabrication
Puce
Encapsulation test
Rgle:
Euros / mm
Arrive
Kit de design
Dpart
Conception
Spcifications
Boitier
Fil de montage
Plot
Patte
Puce
2000
1990
1980
1970
1960
1950
1940
1930
1920
1910
1900
Prmices du transistor:
Thermionic triode
Alexander Flaming
Lee de Forest
Premier transistor :
John Bardeen
William Shockley
Walter Brattain
Nombre de transistors *2 / an
Vitesse dhorloge:
*18000
Anne
1971
2001
Transistor
2300
42 000 000
Frquence (kHz)
108
2 000 000
Technologie (m)
10.00
0.13
*18000
/ 6000
Multimdia
Connectivit
Mobilit
Convergence
Enregistrement
Scurit
Concepteur (designer)
Fondeur:
Fabricant semi-conducteurs
Mtiers
Spcifications
Architecture
Schmas
Fabrication
Maquettes
Vrification
Dessin
masques
Spcifications
Architecture
Schmas
Spice
Dessin
vrification
Fabrication
Vrification
Dessin
masques
Simulation
lectrique
Spcifications
Simulation
fonctionnelle
Niveau
comportemental
Niveau
logique
Test
Fabrication
Placement
routage
Vrifications
Simulation
post layout
Librairie
Niveau
physique
Editeur de
Schma
Simulation
logique
Niveau
lectrique
Spcifications
Co-design
Niveau systme
HW-SW
Niveau circuit
comportemental
Test
Fabrication
Synthse
architecturale
Faible consommation
Niveau
physique
Synthse
physique
Niveau RTL
Niveau
logique
Synthse
logique
Technologie
Portes
Pins
Frquence
Puissance
Rutilisation
90 nm
> 100M
> 1500
> 1 Ghz
>100 W
> 60 %
Systme
Circuit
Fabrication
Objectif:
Approche traditionnelle
1. Concevoir le systme.
Spcifications:
Modlisation:
Partitionnement:
Synthse et optimisation:
Validation:
Intgration:
Tests dintgration
Reconfiguration
fonctionnement
statique
ou
dynamique
en
cours
de
technologiques
des
Complexit croissante
Puce obtenue
Rutilisation
Soc
Blocs IP ou composants virtuels
performance
de Consommation
dnergie
reconfiguration
Technologie cot
ASIC
Trs haute
Trs long
Impossible
Faible
ASSP
Trs haute
Trs long
Impossible
Faible
FPGA
Haute
Long
Long
Moyenne
ASIP
Moyenne
Moyen
Moyen
Haute
DSP
Moyenne/ Basse
Moyen/Court
Moyen
Haute
GPU
Moyenne/ Basse
Moyen/Court
Moyen
Haute
GPPs
Basse
Court
Court
Trs haute
Diversit
des
applications
de
la
excutes
sur
les
systmes
Variation
bande
passante
dans
des
environnements variables
Ressources
dnergie
limites
(systmes
autonomes)
Changement des prfrences de lutilisateur
Ncessit de dvelopper des architectures
performantes
Besoin pour des systmes adaptatifs
Flux
vido
Domaine
dapplication:
Implmentation dun flux vido manant dun camscope
Entre: camra
Ajout: donnes
Mdecine
(chirurgie)
Mixer larchitecture
du flux vido avec lobjet 3D
Diffrents jeux vidos
Ralit
augmente
Application de
ralit augmente
Flux vido
Adaptation
software
Adaptation
rseau
Application 3D
Adaptation
3D
Adaptation MJPEG
Adapter le nombre
dimages envoy la bande
passante
Contrainte: bande
passante.
Transfert donnes
Rpondre la
contrainte 25
fr/s
Compression
Dcompression
Acc1
BRAM1
IDCT
d
Acc2
Softcore 1
Softcore 2
YUV2RGB
Microblaze_1
BRAM2
Microblaze_2
Shared
BRAM
Virtex 5
ML507
Debug
module
JTAG
mb_plb
Bus
DVI
mb_plb
Slaves of microblaze_1
Slaves of microblaze_2
MPMC
DDR_
SDRAM
Objectifs:
Augmenter le nombre dinstructions traites par
seconde.
Diminuer les temps dexcution
Limitations:
Techniques des processeurs ( programmations,
instructions )
Limites physiques des performances.
Augmentation
(processeur)
de
la
complexit
de
lunit
4 catgories distinctes:
SISD: Single Instruction Single Data
SIMD: Single Instruction Multiple Data
MISD: Multiple Instruction Single Data
MIMD: Multiple Instruction Multiple Data
Synchrone
Exemple:
Changement de luminosit dune image
Exemple:
MPMD
Modle simplificateur
Une architecture se trouvant dans plusieurs de ces
catgories
Multiprocesseur monoprogramm
Multiprocesseur multiprogramm
Combinaison des deux
Mmoire
goulet dtranglement
Passage inluctable
un modle mmoire centralise
un modle mmoire distribue
Commutateurs
Indirects
Grilles multidimensionnelles
Inconvnients:
Communications
entre
nuds
(communication entre PPC et B)
Latence plus leve
plus
complexe
Gain de performance
Acclration
.
.
.
Temps
Evnement
Cache A
Cache B
Mmoire
CPUA lit X
CPUB lit X
CPUA range
0 dans X
Espionnage