TIN GTR s4 Part1
TIN GTR s4 Part1
TIN GTR s4 Part1
H. BELKEBIR1
1 Département Génie Électrique et Informatique
Ecole Nationale des Sciences Appliquées
Université Sidi Mohamed Ben Abdellah
Introduction
Définition :
Une image est une représentation
2D du monde réel.
� Elle est formée par un capteur
spécifique qui collecte l’intensité
lumineuse émise ou réfléchie par
la scène. � Il existe plusieurs types de cap-
� Les éléments optiques et élec- teurs qui différent entre eux par
le processus physique utilisé pour
troniques du capteur transforme
capter l’information (exemples: bi-
cette intensité en distribution ologiques, chimiques, thermiques
spatiale discrète de valeurs quan- et électroniques) et aussi par la di-
tifiées et spectralement dépen- mension du capteur(1D, 2D, 3D et
dantes. 4D).
Capteurs numériques
Capteurs CCD
Capteurs numériques
Capteurs CMOS
La question qui se pose est comment choisir les pas d’échantillonnage spatial p x
et py ?
px = Lx /Ncellules,x py = Ly /Ncellules,y
Exemple Le Canon EOS-1D possède un capteur CCD ayant 2464 × 1648 de sites
photo-sensibles disposés sur une surface de 28.7 × 19.1mm 2 ce qui implique des
pas d’échantillonnages :
px = 0.000011647727272727 py = 0.000011589805825242
Hicham BELKEBIR (ENSAF) Traitement d’Images Numériques M25 2018 12 / 164
Introduction
Canal rouge
Canal bleu
Ca
na
lv
ert
Représentation des images
Exemple: canal rouge de l’image baboon.pdf
� Structure de l’entête :
Il est formé de quatre lignes:
1. Type de l’image (texte ou binaire)⇒ P3 ou P6;
2. Ligne de commentaire;
3. Taille de l’image ⇒ nl × nc;
4. Taille de la dynamique de chaque canal.
� Structure des données:
Selon la valeur de la première ligne de l’entête, les données seront soit
au format texte soit au format binaire.
� Pour le format binaire, les données des trois canaux RVB sont codés
en hexadécimal dans un ordre consécutif. Par contre lorsqu’ils sont
codés au format texte, ils ont besoin de plus d’espace de stockage
qu’en mode binaire.
Hicham BELKEBIR (ENSAF) Traitement d’Images Numériques M25 2018 17 / 164
Introduction
� Structure de l’entête :
Il est formé de quatre lignes:
1. Type de l’image (texte ou binaire)⇒ P2 ou P5;
2. Ligne de commentaire;
3. Taille de l’image ⇒ nl × nc;
4. Taille de la dynamique des valeurs des pixels.
� Structure des données:
Selon la valeur de la première ligne de l’entête, les données seront soit
au format texte soit au format binaire.
� Pour le format binaire ou texte, les données représentant le niveau de
gris de l’image sont codés en hexadécimal et disposées en série dans
le fichier avec une occupation en mémoire plus grande pour le codage
texte.
Hicham BELKEBIR (ENSAF) Traitement d’Images Numériques M25 2018 18 / 164
Introduction
Ce sont des images qu’on obtient par seuillage, elles sont très utilisées
dans la définition des masques.
� Structure de l’entête :
Il est formé de trois lignes:
1. Type de l’image (texte ou binaire)⇒ P1 ou P4;
2. Ligne de commentaire;
3. Taille de l’image ⇒ nl × nc;
� Structure des données:
Selon la valeur de la première ligne de l’entête, les données seront soit
au format texte soit au format binaire.
� Pour le format binaire ou texte, les données représentant la valeur du
digit sont codés en hexadécimal et disposées en série dans le fichier
avec une occupation en mémoire plus grande pour le codage texte.
Hicham BELKEBIR (ENSAF) Traitement d’Images Numériques M25 2018 19 / 164
Exemples du format NetBPM
Image niveau de
gris au format PGM
Image binaire
au format PBM
Introduction
Perception visuelle
Motivations (1)
Perception visuelle
Motivations (3)
� Composition de la rétine :
1. La couche qui contient les
photorécepteurs rétiniens :
bâtonnets et cônes.
2. La couche qui contient les cel-
lules bipolaires.
3. La couche qui contient les cel-
lules ganglionnaires dont les
prolongements forment les ax-
ones du nerf optique.
Perception visuelle
Sensibilité spectrale des photorécepteurs rétiniens
Il existe quatre types de photorécepteurs dans la rétine, les bâtonnets respon-
sable de la vision scotopique et les cônes responsable de la vision photopique
:
1. Les bâtonnets avec un maxima
à 498nm;
2. Les cônes de type S (Bleu)
avec une sensibilité maximal à
420nm;
3. Les cônes de type M (Vert) avec
un maximum de sensibilité à
534nm;
4. Les cônes de type L (Rouge)
ayant leur maxima à 564nm.
Perception visuelle
Qu’est-ce que la couleur ?
� La couleur est une notion complexe qui fait intervenir à la fois des
facteurs psychophysiques et psychophysiologiques;
� Physiquement, la couleur n’est autre que l’énergie rayonnée par une
source lumineuse à une longueur d’onde du visible;
� Physiologiquement c’est une réponse du cortex visuel à l’influx
nerveux qui lui parvient des photorécepteurs rétiniens suite à la
conversion du flux d’énergie lumineuse qui irradie la rétine;
� Psychiquement, c’est une interprétation et une sensation plus qu’une
mesure produite par le cerveau humain;
Perception visuelle
La couleur vue comme une synthèse :
Photorécepteurs
cône L
cône S
Perception visuelle
Synthèse additive
� les fonctions colorimétriques de l’espace CIE xyY sont obtenus à partir des
fonctions de l’espace CIE RGB par transformation linéaire :
{C } = x {X } + y {Y } + z{Z }
x +y +z = 1
Espace des couleurs
Espace sRGB
sRGB, ou standard RGB, est un espace de couleur informatique proposé par
Hewlett-Packard et Microsoft en 1996, utilisé dans les dispositifs numériques, no-
tamment les écrans d’ordinateurs.
Diagramme de chromaticité (x,y)
� Une couleur primaire s’affiche à l’écran
lorsque son canal est à 100 % et que
les deux autres sont à 0 %. Les
couleurs réelles sont définies par leurs
coordonnées x et y sur une échelle de
référence appelée diagramme de chro-
maticité CIE.
� Dans le sRGB, le rouge est positionné
à [0.64, 0.33], le vert à [0.30, 0.60] et le
bleu à [0.15, 0.06]. Ces trois positions
forment le triangle des couleurs chro-
matiques sRGB. Seules les couleurs à
l’intérieur du triangle sont visibles sur
un écran sRGB.
Ylin = 0.21Rlin + 0.72Vlin + 0.07Blin
Espace des couleurs et Perception visuelle
Canal vert
Canal bleu
Espace des couleurs
Exemples (2): Espace LAB
Canal Luminance
Canal a
Canal b
Espace des couleurs
Exemples (3): Espace YCbCr
Canal Luminance
Ré-échantillonnage
On déjà évoqué le concept d’échantillonnage dans l’introduction et on le
reprend ici pour parler de ses implications spectrales en plus du concept de
la reconstruction et le ré-échantillonnage.
� Espace des fréquences spatiales :
À l’instar des signaux temporels, on définit la transformée de Fourier spatiale
d’une image 2D par :
M �
� N
F{I}[u, v ] = I [i, j] exp (−ı2π(iu + jv ))
i=0 j=0
Spectre spatial de I
FFT2
Image I
Ré-échantillonnage
Filtre de reconstruction idéal
Pour ré-échantillonner une image numérique, il faut construire la version
analogique du signal qui a produit cette image :
� �
Ie (x , y ) = I(x , y ) × δ(x − ipx ) × δ(y − jpy )
i j
Ré-échantillonnage
Filtre de reconstruction idéal (1)
� 1 � i j �
Ie (u, v ) × (px u, py v ) = I(u − , v − ) × (px u, py v )
px py px py
i,j
IFFT
=⇒
Ir (x , y ) = px py F −1 {Ie (u, v )} ∗ sinc(x /px ) × sinc(y /py )
�
= p x py I [ipx , jpy ] δ(x − ipx , y − jpy ) ∗ sinc(x /px ) × sinc(y /py )
i,j
�
= p x py I [ipx , jpy ] sinc(x /px − i) × sinc(y /py − j)
i,j
x u
�
Ir (x , y ) = I [i, j] Π(x − i, y − j)
i,j
� Approximation d’ordre 1 :
Λ(x ) sinc2 (u)
x u
�
Ir (x , y ) = I [i, j] Λ(x − i, y − j)
i,j
Ré-échantillonnage
Approximation du filtre de reconstruction idéal(1)
� Approximation d’ordre supérieur (splines) :
Il s’agit de l’interpolation par des splines, selon la famille
des polynômes de Mitchell. Ces polynômes sont définis par morceaux tels que :
Ordre 0
Ordre 1
Ré-échantillonnage
Exemples d’interpolation
Lanczos sinc
Mitchell spline
Échantillonnage et quantification
Quantification
� La quantification est l’opération réalisé par le convertisseur analogique
numérique installé comme étage de sortie dans chaque capteur
d’image.
� Elle consiste à représenter le niveau de tension produit par chaque site
photosensible par une séquence binaire dont la longueur dépend de la
résolution du CAN.
� Comment le CAN exécute cette tâche essentielle à la formation de
l’image numérique ?
� Pour répondre à cette question, considérons la tension généré par
l’amplificateur du capteur d’image comme un signal Ia dont les
valeurs sont comprises entre deux extremums m = Ia,min et
M = Ia,max . Considérons que notre CAN dispose d’une résolution de n
bits ce qui permet d’obtenir 2n séquences binaires.
Quantification (1)
d0 d1 d2 ... di−1 di di+1 ... dL−1 dL
m M
... ...
I0 I1 I2 Ii−1 Ii Ii+1 IL−1
Quantification (2)
� Si L � 1 on peut supposer que p(Ia ) ≈ p(Ii ) ce qui permet d’avoir:
L−1
� � di+1
�= p(Ii ) (Ia − Ii )2 dIa
i=0 di
L−1
� 1 � �
= p(Ii ) (di+1 − Ii )3 − (di − Ii )3
i=0
3
� La quantification sera optimale si l’erreur total � est minimale ce qui
revient à considérer :
d� di+1 + di
= 0 =⇒ Ii,opt =
dIi 2
L−1
� (di+1 − di )3
�= p(Ii,opt )
i=0
12
Quantification (3)
Δ2 (M − m)2 M −m
�= = avec Δ = di+1 − di =
12 12 × 22n L
� C’est la quantification uniforme.
Résolution tonale
Transformation géométrique
des images
Transformation géométrique des images
Notion de Voisinage
� Considérons le pixel p situé à la position (i, j) dans le tableau 2D
(matrice) représentant l’image I. On peut définir plusieurs types de
voisinages pour p :
� Voisinages V4 , VD et V8 = V4 ∪VD :
p(i, j)
(i, j + 1)
(i − 1, j + 1) (i + 1, j + 1)
(i + 1, j)
(i − 1, j)
(i − 1, j − 1) (i, j − 1)
(i + 1, j − 1)
Hicham BELKEBIR (ENSAF) Traitement d’Images Numériques M25 2018 58 / 164
Transformation géométrique des images
Notion de distance
� Distance entre pixels:
Dans un espace discret, on peut définir plusieurs types de distances :
1. Distance euclidienne:
�
d(p, q) = (iq − ip )2 + (jq − jp )2
2. Distance Manhattan ou D4 :
Transformations géométriques
Transformation euclidienne
Transformations géométriques
Rotation et translation
u
ymin c
�
xs = xmin + λx (x − xmin )
ys = ymin + λy (y − ymin )
Transformation euclidienne
Exemple de changement d’échelle λx = λy = 2.75
Transformation géométrique des images
Transformations géométriques
Similitude, Cisaillement
Transformation Projective
Les transformations projectives mettent en jeu 8 paramètres indépendants
au lieu de 6 selon les équation ci-dessous :
� p11 x +p12 y +p13
x =
�
p31 x +p32 y +p33
p21 x +p22 y +p23
y =
�
p31 x +p32 y +p33
Interpolation
Pourquoi interpoler ?
I15 (2, 3)
I(2, 3)
Interpolation
Interpolation ID
Ordre Forme Expression
0 Π R0 (x ) = 12 ∀|x | ≤ 12
1 Λ = Π∗Π R1 (x ) = 1 − |x | ∀|x | ≤ 1
12 (x + 32 )2 ∀ − 32 ≤ x ≤ − 12
3
2 Λ∗Π R2 (x ) = − x 2 ∀|x | ≤ 12
41 3 2 1 3
� 22 (x 1− 2 3) ∀ 22≤ x ≤ 2
3 Λ∗Λ R3 (x ) = 3 + 2 |x | − x ∀0 ≤ |x | ≤ 1
1 3
6 (2 − |x | ) ∀1 ≤ |x | ≤ 2
Interpolation
Interpolation 2D
Le filtre de reconstruction 2D est séparable en produit de deux filtres de
reconstruction 1D :
R(x , y ) = R(x ) × R(y )
L’expression du signal analogique ayant produit l’image discrète est donnée
par:
M �
� N
I(x , y ) = I[i, j]R(x − i, y − j)
i=0 j=0
P01 εx
3 �
� 3
I(x , y ) = I[i, j]R(x − i, y − j) P02 εy
i=0j=0 P
P03
Analyse radiométrique et
filtrage spatiale
Analyse radiométrique et filtrage spatiale
Outils d’analyse radiométrique
� Histogramme:
L’histogramme représente la fréquence d’occurrence des tons des
couleurs principales dans une image en couleur ou des niveaux de
luminance dans une image en niveau de gris.
Analyse radiométrique et filtrage spatiale
Outils d’analyse radiométrique (1)
� Histogramme normalisé :
Supposons que notre image est formée de M × N pixels,
l’histogramme normalisé se calcule en utilisant la formule ci-après :
H
Hnorm =
M ×N
Lorsque le nombre de pixels de l’image devient très grand,
l’histogramme normalisé peut être vu comme une estimation de la
probabilité que le pixel [i, j] aie la valeur I [i, j]
����������������������������������
������
������
���������������������
������
������
������
������
������
������
������
� �� ��� ��� ��� ���
��������������
;
Analyse radiométrique et filtrage spatiale
Outils d’analyse radiométrique (2)
� Histogramme Cumulé :
L’histogramme cumulé d’une image en niveau de gris se calcule en
utilisant la formule suivante :
k
�
Hcum [k] = Hnorm [i]
i=0
L’histogramme cumulé peut être vu comme une version discrète de la
fonction de partition associé à la loi de probabilité discrète H norm .
;
Analyse radiométrique et filtrage spatiale
Outils d’analyse radiométrique (3)
� Entropie de l’image :
Outre les capacités du capteur, le nombre de bits réellement
nécessaire pour coder les tons d’une image varie d’une image à
l’autre, en fonction de leur contenu informationnel. Ce nombre
dépend de l’entropie, définie à partir de la distribution des niveaux de
gris de l’image :
256
�
S =− Hnorm [i] log2 (Hnorm [i])
i=1
�����������������������������������
����������������������
������
������
���������������������
������
������
������
������
������
������
������
� �� ��� ��� ��� ���
��������������
;
Analyse radiométrique et filtrage spatiale
s = T (r )
����
���������������������
����
����
����
����
���� +50
����
����
� �� ��� ��� ��� ���
��������������
���������������������������
�����
����
���������������������
����
����
����
�
� �� ��� ��� ��� ���
��������������
Analyse radiométrique et filtrage spatiale
Transformation radiométrique linéaire
� Correction de la dynamique par étirement de l’histogramme :
�����������������������������������
����
���������������������
����
����
����
����
����
����
����
� �� ��� ��� ��� ���
��������������
I−Imin
Im = Imax −Imin (MAX − MIN)
�����������������������
�����
���������������������
����
����
����
�
� �� ��� ��� ��� ���
��������������
Analyse radiométrique et filtrage spatiale
Transformation radiométrique linéaire
(a) (b)
Analyse radiométrique et filtrage spatiale
Transformation radiométrique linéaire
� Égalisation d’histogramme : s = Hc (r )
������������������
���
���
���������������������
���
���
���
���
� �� ��� ��� ��� ���
��������������
�������������������
�����
���������������������
����
����
����
�
� �� ��� ��� ��� ���
��������������