Chapitre-1-index-image-et-vidéo1
Chapitre-1-index-image-et-vidéo1
Chapitre-1-index-image-et-vidéo1
Indexation
Keywords
1 Introduction
Contexte
Bases de Données MultiMédia (MMDB)
Domaines d’application
Indexation
Outil OpenCV
Indexation
Introduction Contexte
Contexte
Objectif
Indexation
Introduction Contexte
Contexte
Objectif
Indexation
Introduction Contexte
Contexte
Chanllenge ...
Indexation
Introduction Contexte
Indexer ?
Indexer ?
Indexer ?
Définition
Quelles sont les bases de données multimédia (MMDB)?
Indexation
Introduction Bases de Données MultiMédia (MMDB)
BDMM
Pourquoi les bases de données mutlimédia ?
Quelques chiffres
Croissance très importante, en raison de l’accumulation des contenus
numériques (image, vidéo, ...) auto-produits par le grand public, par
exemple :
Facebook : plus de 100 millions d’images/jour
Youtube : plus 24h de vidéo/minute
Films : http://www.imdb.org recense plus de 400 000 films
Internet : nécessite Plus 5-10 To de capacité de stockage
Sept 2011 : 1 milliards de recherches/jour
Fonds de document télévisuel de la SNRT (société nationale de
radiodiffusion et de télévision)
Pour une seule chaı̂ne TV : plus 8000h de vidéo /an
Pour plus 20 ans d’émission (plusieurs chaı̂nes) : 1 million d’heures
(vidéos, images, ...)
Indexation
Introduction Bases de Données MultiMédia (MMDB)
BDMM
Pourquoi les bases de données mutlimédia ?
Quelques chiffres
Croissance très importante, en raison de l’accumulation des contenus
numériques (image, vidéo, ...) auto-produits par le grand public, par
exemple :
Facebook : plus de 100 millions d’images/jour
Youtube : plus 24h de vidéo/minute
Films : http://www.imdb.org recense plus de 400 000 films
Internet : nécessite Plus 5-10 To de capacité de stockage
Sept 2011 : 1 milliards de recherches/jour
Fonds de document télévisuel de la SNRT (société nationale de
radiodiffusion et de télévision)
Pour une seule chaı̂ne TV : plus 8000h de vidéo /an
Pour plus 20 ans d’émission (plusieurs chaı̂nes) : 1 million d’heures
(vidéos, images, ...)
Indexation
Introduction Bases de Données MultiMédia (MMDB)
Difficultés
Très grands volumes de données multimédia à exploiter : Océan
d’images, vidéos et son
Problèmes de gestion de bases de données
”Fossé sémantique” : comment accéder à/coder une information
visuelle ?, à la différence de données textuelles, le contenu sémantique
n’est jamais explicite
Les requêtes sont difficiles à exprimer, donc en général ambiguës,
incomplètes
Indexation
Introduction Bases de Données MultiMédia (MMDB)
Historique
Indexation
Introduction Bases de Données MultiMédia (MMDB)
Indexation
Introduction Bases de Données MultiMédia (MMDB)
Indexation
Introduction Bases de Données MultiMédia (MMDB)
Indexation
Introduction Bases de Données MultiMédia (MMDB)
Indexation
Introduction Domaines d’application
Domaines d’application
Audiovisuel
Exemples : détection de
copies (droits), retrouver un
plan spécifique d’un
programme, annotation
automatique de vidéos
Sécurité
Exemples : biométrie
(empreintes),
vidéosurveillance
Internet
Exemples : commerce
électronique
..., Bases d’images médicales
Indexation
Introduction Domaines d’application
Domaines d’application
Exemple d’application : Sécurité
Indexation
Introduction Domaines d’application
Domaines d’application
Exemple d’application : Sécurité
Requêtes possibles
Exemple de requête par mots-clés: policier
veut examiner des photos de Personne X
Requête: ”récupérer toutes les images de la
base d’images dans lesquelles Personne X
apparaı̂t”
Requête d’image par exemple: l’agent de
police a une photo et veut trouver l’identité
de la personne sur la photo
Indexation
Introduction Indexation
Indexation
Introduction Indexation
Indexation manuelle
Annotation
l’approche dite classique consiste à indiquer des mots-clés attachés au
document (ou indexés) décrivant, dans un vocabulaire restreint, les
caractéristiques principales et bien identifiables des documents stockés.
Par quoi indexer : mots-clés, métadonnées, ...
Inconvénients
Même image peut avoir plusieurs annotations différentes
Ambiguı̈té de l’annotation
Dépendance du contexte
Le coût d’annotation manuel est très important (10 fois la duré de
document)
Approche la plus ancienne et la plus répandue
Indexation
Introduction Indexation
Indexation manuelle
Annotation
l’approche dite classique consiste à indiquer des mots-clés attachés au
document (ou indexés) décrivant, dans un vocabulaire restreint, les
caractéristiques principales et bien identifiables des documents stockés.
Par quoi indexer : mots-clés, métadonnées, ...
Inconvénients
Même image peut avoir plusieurs annotations différentes
Ambiguı̈té de l’annotation
Dépendance du contexte
Le coût d’annotation manuel est très important (10 fois la duré de
document)
Approche la plus ancienne et la plus répandue
Indexation
Introduction Indexation
Indexation manuelle
Dépendance du contexte
Indexation
Introduction Indexation
Indexation automatique
Indexation
Introduction Indexation
Indexation automatique
Indexation
Introduction Indexation
Indexation automatique
BDMM : Architecture générale
Définitions
Indice, Descripteur, Signature
Mesure de similarité
Distance
d : E × E → R+
Nom Proprièté
Symétrie ∀(a, b) ∈ E 2 , d(a, b) = d(b, a)
Séparation ∀(a, b) ∈ E 2 , d(a, b) = 0 ⇔ a = b
Inégalité triangulaire ∀(a, b, c) ∈ E 3 , d(a, c) ≤ d(a, b) + d(b, c)
Mesure de similarité
Distance
Indexation
Introduction Outil OpenCV
OpenCV
Introduction
Que contient-elle ?
Des fonctionnalités (structures et routines,≥2500 algos) de base et
avancées
pour bâtir rapidement des applications autour de la vision par
ordinateur.
Téléchargeable sur http://sourceforge.net/projects/opencvlibrary/
Indexation
Introduction Outil OpenCV
OpenCV
Introduction
OpenCV
Introduction
Indexation
Introduction Outil OpenCV
OpenCV
Classes de bases
La classe Point
Structure de données générique pour représenter des points dans
espace de dimension 2.
Indexation
Introduction Outil OpenCV
OpenCV
Classes de bases
Dimension Size
Représente la taille d’un objet rectangulaire a 2 dimensions. Comme
pour les points il s’agit d’une structure générique.
Indexation
Introduction Outil OpenCV
OpenCV
Classes de bases
Vecteur Vec
Représente un vecteur générique de faible dimension (≤ 10).
Indexation
Introduction Outil OpenCV
OpenCV
Classes de bases
Vecteur Vec
Et on dispose des alias suivant :
Indexation
Introduction Outil OpenCV
OpenCV
Classes de bases
La classe MAT
La classe Mat (pour matrice) permet de stocker l’image sous forme
matricielle.
Chaque objet Mat possède deux parties :
L’entête
Les données
Allocation par constructeur : La classe Mat propose un nombre
important de constructeur, viola ceux qui vous seront le plus utile :
Indexation
Introduction Outil OpenCV
OpenCV
Classes de bases
La classe MAT
Types : représenté par CV < Datatype > C < Channels >, tels que
CV 8UC1, CV 32UC3
Indexation