Classification of videos on the internet

Étude d’un classifieur hybride supervisé et non-supervisé pour
la classification en genre des vidéos sur l’internet

• Introduction
• État de l’art
• Contribution
• Classification
• Expérimentations
• Résultats
• Conclusion
• Perspectives
2
Plan de la présentation
Classification en genre des video sur l’internet – Hassan El HAJJ

Introduction
3Classification en genre des video sur l’internet – Hassan El HAJJ
• En générale, La classification en genre des vidéos est un
problème compliqué
• La plupart ont choisit un type des vidéos (TV Programs,
films, etc..)
• La classification des vidéos sur l’internet est totalement
différente de la classification des vidéos sur TV.

• Les rechercheurs ont proposé :
1. Méthode supervisée
2. Méthode non supervisée
3. Amélioration de performance des méthodes déja
existantes
Mais tous ont adapté le problème pour avoir des résultats
significatifs
État de l’art

Contribution(1)
Objectif et proposition
• Approche différente de ce qui est dans l’etat de l’art en tant
de:
• Caractéristiques utilisées.
• Nombre de classe
• La construction du corpus
• Proposer une hybridation de 2 méthodes
• Faire une étude entre les 3 méthodes sous des
différentes conditions appliqués sur la collection
d’apprentissage

Contribution(2)
Construction du corpus
• Analyser 3000 vidéos sur YouTube et proposer une liste
d’environ 40 genres.
• Récupérer pour chaque genre une liste de 10 vidéos pour
avoir enfin une collection de test de 400 vidéos.
• Annoter manuellement les vidéos.

7
Divertissements Horreur Jeux Farces Accident Magie
Compétition Publicité Mariage Cours incendies Talents
Technologie Monuments Religion Films Musique Journaux télévisés
Cours d’informatique Célébrités Illusion Armes Dessins animés Dance
Environnement Reportages Discours Sport Tourisme Guerre
Conférences Inventions Science Santé Animaux Finance
Commerciale Éducation Politique Marrant
Contribution(3)
Les genres détérminés

 Utiliser ffmpeg pour extraire les images et le son d’un vidéo
 Extraire des information visuelles:
 Quantité de mouvement des pixels dans les images
 Quantité de gradient horizontale et verticale dans les
images
 Histogramme moyenne de toutes les images
 Surface moyenne des régions du texte dans les images
 Nombre moyen des visages par vidéo
8
Classification
Extraction des descripteurs

 Extraire des information audio:
 Quantité d’énergie globale dans le son, qui nous
indique si le son est fort ou pas(silence ou pas).
 Quantité d’énergie a 4 Hz(parole ou pas)
 Indicateur de musique
Toutes les méthodes utilisées sont un petit peu fine et
frustes car elles ne donnent pas des résultats rigoureux
9
Extraction des descripteurs(2)

10
Fichier Descripteur

Classification - Clustering
Fig. 1. La variation de coefficient de pureté en
fonction le nombre cluster déterminé en
appliquant une normalisation « minimum,
maximum ».
fonction le nombre cluster déterminé en
appliquant une normalisation « moyenne,
écart-type ».
fonction le nombre cluster déterminé sans
normalisation.
•Préférable de normaliser les données lorsqu’on travaille
sur des variables différentes
•Ici, la normalisation a pour effet de réduire la capacité de
discriminance des classifieurs.

12
Classification - K plus proches
voisins
• Diviser la collection des vidéos collectées en 2 parties,
une partie pour les tests et l’autre pour etre la collection
d’apprentissage.
• Utilisation d’une rang des valeurs de k après avoir
analyser légèrement les descripteurs.
• On a introduit la notion « taux de précision » pour
évaluer la performance de la méthode.

13
L’hybridation des 2 méthodes
• Combinaison entre KNN et Clustering
• Diviser la collection des données en 2 parties:
• 200 vidéos comme collection d’apprentissage du clustering
• Les autres comme collection d’apprentissage du KNN
• On regroupe les résultats de toutes les prédictions et on les
utilise pour évaluer la précision de cette méthode en utilisant
le « taux de précision ».

14
Expérimentations
Sur toute la palette
K 38 30 20 17 13 10 6 5 4 3 2 1
Taux
De
précision
(%)
4.51 7.02 6.71 5.99 5.4 5.2 5.25 4 3.62 3.16 3.75 6
Tab 1. Résultats obtenus de l’hybridation des 2 méthodes avec différentes valeur de k dans le cas où la
collection d’apprentissage est toute la palette collectée.
normalisation.
K 40 30 20 17 13 10 6 5 4 3 2 1
Taux
De
précisio
n(%)
9.92 9.84 11.8 11.2 11 10.5 10.1 11.2 10.5 10.3 9.5 11
Tab 2. Résultats obtenus de la méthode supervisée avec différentes valeur de k dans le cas où la collection
d’apprentissage est toute la palette collectée

Sur 4 genres
Fig. 5. La variation du coefficient de pureté
en fonction le nombre cluster déterminé
sans normalisation appliqué sur une
collection d’apprentissage composée des 4
classes mentionnées ci-dessus.
K 12 11 10 9 8 7 6 5 4 3 2 1
Taux
De
précision
(%)
32.5 31.6 28.3 33.3 35 35 30 37.5 37.5 33.3 22.5 25
collection d’apprentissage est composée de 4 classes très discriminants
K 12 11 10 9 8 7 6 5 4 3 2 1
Taux
De
précision
(%)
35 40 37.5 39.1 37.5 36.6 40 42.5 40 36.6 30 40
Tab 4. Résultats obtenus de la méthode supervisée avec différentes valeur de k dans le cas où la collection
d’apprentissage est composée de 4 classes très discriminants
Les genres utilisés sont : Cours d’informatique, Journaux
télévisés, Commerciale, Dessins animés

16
Sur 2 genres peu discriminants
Fig. 6. La variation du coefficient de pureté en
normalisation appliqué sur une collection
d’apprentissage composée des 2 classes mentionnées
ci-dessus
K 10 9 8 7 6 5 4 3 2 1
Taux
De
précision
(%)
50 60 55 60 55 50 55 50 50 50
collection d’apprentissage est composée de 2 classes peu discriminants
K 10 9 8 7 6 5 4 3 2 1
Taux
De
précision
(%)
50 60 55 60 50 60 60 70 55.5 70
Tab 6. Résultats obtenus de la méthode supervisée avec différentes valeur de k dans le cas où la
collection d’apprentissage est composée de 2 classes peu discriminants
Les genres utilisés sont : Journaux télévisés, Reportages

17
Sur 2 genres très discriminants
Fig. 7. La variation du coefficient de pureté en
normalisation appliqué sur une collection
d’apprentissage composée des 2 classes
mentionnées ci-dessus.
K 10 9 8 7 6 5 4 3 2 1
Taux
De
précision
(%)
50 80 70 70 65 60 65 70 65 60
Tab 7. Résultats obtenus de l’hybridation des 2 méthodes avec différentes valeur de k dans le cas où
la collection d’apprentissage est composée de 2 classes très discriminants
K 10 9 8 7 6 5 4 3 2 1
Taux
De
précision
(%)
50 80 80 80 70 70 65.5 80 65 70
Tab 8. Résultats obtenus de la méthode supervisée avec différentes valeur de k dans le cas où la
collection d’apprentissage est composée de 2 classes très discriminants
Les genres utilisés sont : Commerciale, Cours
d’informatique

Résultats
Méthode de
classification
Taille de
la collection
d’apprentissage
Clustering
(en coefficient de
pureté)
K plus proche
voisins
(en taux de
précision)
Hybridation des 2
méthodes
(en taux de
précision)
40 Classes 0.18 11.8% 7.02%
4 Classes 0.5 42.5% 37.5%
2 Classes peu discriminantes 0.6 70% 60%
2 Classes très discriminantes 0.6 80% 80%

 Les résultats produits sont réalistes par rapport à la
difficulté du problème et c’est à quoi il faut s’attendre si
on cherche à déployer des méthodes de classification en
genre sur ce type de donnés et sous ses conditions.
 Ouvre la porte à la question : comment les méthodes
existantes ont pu obtenir des résultats intéressants?
 Simplement, ils n’ont pas attaqué le vrai problème
 Les chercheurs s’intéressent plus sur les méthodes que
les données
19
Conclusion

 Travailler sur la manque de donnés en augmentant le
corpus
 Adapter les caractéristiques utilisées aux genres
déterminés
 Prendre en considération qu’un vidéo peut appartenir à
différentes genres
Cependant, la catégorisation à grande échelle de
vidéos sur l’internet reste un problème non résolu.
20
Perspectives

21
Questions ?
Merci pour votre attention

Classification of videos on the internet

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Andere mochten auch

Andere mochten auch (16)

Kürzlich hochgeladen

Kürzlich hochgeladen (10)

Classification of videos on the internet

Hinweis der Redaktion