Réseaux de capsules (CapsNets)

Les réseaux
de capsules
Aurélien Géron, Mars 2017

Aurélien Géron, 2017
Article NIPS 2017
Dynamic Routing Between Capsules
(Routage dynamique entre capsules)
de Sara Sabour, Nicholas Frosst, Geoffrey E. Hinton
Octobre 2017: https://arxiv.org/abs/1710.09829

Infographie
Rectangle
x=20
y=30
angle=16°
Triangle
x=24
y=25
angle=-65°
Paramètres d’instanciation ImageRendu

Analyse d’image
Image
Rectangle
x=20
y=30
angle=16°
Triangle
x=24
y=25
angle=-65°
Analyse d’imageParamètres d’instanciation

Capsules
Image
=
=
Analyse d’imageParamètres d’instanciation

Vecteur d’activation:
Capsules
Longueur = estimation de la probabilité de présence
Orientation = estimation des paramètres d’instanciation
=
=

Squash(u) =
Capsules
=
=
Couches de convolution
+ Redimensionnement
+ Squash
||u||2
1 + ||u||2
u
||u||

Equivariance
=
=

Une hiérarchie de composants
Bateau
x=22
y=28
angle=16°

Rectangle
x=20
y=30
angle=16°
Triangle
x=24
y=25
angle=-65°
Bateau
x=22
y=28
angle=16°

Rectangle
x=20
y=30
angle=-5°
Triangle
x=26
y=31
angle=137°
Maison
x=22
y=28
angle=-5°

Capsules primaires
=
=
Capsules primaires

=
=
Capsules primaires
Prédire la sortie de
la couche suivante

=
=
Une matrice de transformation Wi,j
par paire partie/objet (i, j).
ûj|i
= Wi,j
ui
Capsules primaires
la couche suivante

=
=
Sorties prédites
Capsules primaires
la couche suivante

Routage par accord
=
=
Bon accord!
Capsules primaires
Sorties prédites

La capsule-rectangle et la
capsule-triangle seront routées
vers la capsule-bateau.
=
=
Capsules primaires
Sorties prédites
Routage par accord
Bon accord!

Rechercher les groupes
de concordance

Moyenne
Rechercher les groupes
de concordance

Poids de routage
=
=
bi,j
=0 pour tout i, j
Capsules primaires
Sorties prédites

Poids de routage
=
=
0.5
0.5
0.5
0.5
bi,j
=0 pour tout i, j
ci
= softmax(bi
)
Capsules primaires
Sorties prédites

Calculer la sortie de
la couche suivante
=
=
sj
= somme pondérée
0.5
0.5
0.5
0.5
Capsules primaires
Sorties prédites

=
=
0.5
0.5
0.5
0.5
sj
= somme pondérée
vj
= squash(sj
)
Capsules primaires
Sorties prédites
la couche suivante

Sorties réelles des
capsules de la couche
suivante (fin du 1er
tour)
=
=
0.5
0.5
0.5
0.5
sj
= somme pondérée
vj
= squash(sj
)
la couche suivante
Capsules primaires
Sorties prédites

tour)
Mettre à jour les
poids de routage
=
=
Accord
Capsules primaires
Sorties prédites

tour)
Mettre à jour les
poids de routage
=
=
Accord bi,j
+= ûj|i
. vj
Capsules primaires
Sorties prédites

tour)
Mettre à jour les
poids de routage
=
=
Accord bi,j
+= ûj|i
. vj
Grand
Capsules primaires
Sorties prédites

tour)
Mettre à jour les
poids de routage
=
=
Désaccord bi,j
+= ûj|i
. vj
Petit
Capsules primaires
Sorties prédites

la couche suivante
=
=
0.2
0.1
0.8
0.9
Capsules primaires
Sorties prédites

la couche suivante
=
=
sj
= somme pondérée
0.2
0.1
0.8
0.9
Capsules primaires
Sorties prédites

la couche suivante
=
=
sj
= somme pondérée
vj
= squash(sj
)0.2
0.1
0.8
0.9
Capsules primaires
Sorties prédites

suivante (fin du 2ème
tour)
la couche suivante
=
=
0.2
0.1
0.8
0.9
Capsules primaires
Sorties prédites

Handling Crowded
Scenes
=
=
=
=

Handling Crowded
Scenes
=
=
=
=
Est-ce une
maison à
l’envers?

Handling Crowded
Scenes
=
=
=
=
Maison
Grâce au routage par accord,
l’ambiguïté est vite levée (par
élimination progressive des
composants expliqués).
Bateau

CapsNet de
classification
|| ℓ2
|| Estimation de la probabilité
d’appartenance à chaque classe

Perte marginale
|| ℓ2
|| Pour prédire plusieurs
classes, minimiser la perte
marginale suivante :
Lk
= Tk
max(0, m+
- ||vk
||)2
+ λ (1 - Tk
) max(0, ||vk
|| - m-
)2
Tk
= 1 si et seulement si la
classe k est présente
Dans l’article :
m-
= 0.1
m+
= 0.9
λ = 0.5
Estimation de la probabilité

En clair:
Si un objet de la classe
k est présent dans
l’image, alors ||vk
||
devrait être supérieur à
0,9. Sinon, il devrait
être inférieur à 0,1.
Perte marginale
|| ℓ2
|| Pour prédire plusieurs
classes, minimiser la perte
marginale suivante :
Lk
= Tk
max(0, m+
- ||vk
||)2
+ λ (1 - Tk
) max(0, ||vk
|| - m-
)2
Tk
= 1 si et seulement si la
classe k est présente
Dans l’article :
m-
= 0.1
m+
= 0.9
λ = 0.5
Estimation de la probabilité

Régularisation par
reconstruction
|| ℓ2
||
Réseau neuronal à
propagation avant
Décodeur
Reconstruction

Régularisation par
reconstruction
|| ℓ2
|| Reconstruction
Perte = perte marginale + α perte de reconstruction
La perte de reconstruction est le carré de différence
entre l’image reconstruite et l’image d’entrée.
Dans l’article, α = 0.0005.
Réseau neuronal à
propagation avant
Décodeur

Un CapsNet pour
MNIST
(Figure 1 de l’article)

Un CapsNet pour
MNIST – Décodeur

Des vecteurs
d’activation
interprétables

Avantages
● Haute précision sur MNIST, et prometteur sur CIFAR10
● Requiert moins de données qu’un réseau neuronal de convolution
● La position et l’aspect des objets sont préservés (équivariance)
● Ceci est prometteur pour de la segmentation d’image et la détection d’objets
● Le routage par accord gère bien les scènes ambiguës
● Les activations des capsules indiquent la hiérarchie des composants
● L’algorithme est robuste face aux transformations linéaires
● Les vecteurs d’activation sont souvent interprétables (rotation, épaisseur…)
● C’est une idée de Hinton! ;-)

● Pas encore au niveau des réseaux de convolution sur CIFAR10
● Pas encore au niveau sur de grandes images
● L’algorithme est lent, du fait de la boucle du routage par accord
● Un CapsNet ne sait pas distinguer deux objets identiques et très proches
○ Ce phénomène s’appelle le surpeuplement (crowding), et il existe également chez l’Homme.
Inconvénients

Implémentations
● TensorFlow simplifié: https://github.com/ageron/handson-ml
○ Dans extra_capsnets.ipynb
● TensorFlow : https://github.com/naturomics/CapsNet-Tensorflow
● Keras sur TensorFlow : https://github.com/XifengGuo/CapsNet-Keras
● PyTorch : https://github.com/gram-ai/capsule-networks

Article ICLR 2018
Matrix capsules with EM routing
(Capsules matricielles avec routage EM)
de Geoffrey E. Hinton, Sara Sabour, Nicholas Frosst
Février 2018: https://openreview.net/pdf?id=HJWLfGWRb

Article ICLR 2018
Matrix capsules with EM routing
(Capsules matricielles avec routage EM)
de Geoffrey E. Hinton, Sara Sabour, Nicholas Frosst
Février 2018: https://openreview.net/pdf?id=HJWLfGWRb
45% d’erreurs en moins sur le jeu de données
smallNORB par rapport à l’état de l’art

Amazon: https://goo.gl/sGsR6C
Twitter: @aureliengeron
github.com/ageron
...

Réseaux de capsules (CapsNets)

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Empfohlen

Empfohlen (20)

Réseaux de capsules (CapsNets)