Refractoring java generics by inferring wildcards

Refractoring Java Generics by Inferring Wildcards, In
Practic
Michel Mathieu, Nadarajah Mag-Stellon
2014/2015

Table des matières
1 Introduction 2
2 Définition de la variance 3
2.1 Prémisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2.1 La covariance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2.2 La contravariance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3 Cas concret d’utilisation 6
4 Le fonctionnement de l’outil 8
4.1 La syntaxe de la variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
4.2 L’analyse de l’influence des types . . . . . . . . . . . . . . . . . . . . . . . 9
4.2.1 Le principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.2.2 L’algorithme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
5 Les Applications de l’outil 14
6 Conclusion 17

Chapitre 1
Introduction
Ce rapport est un résumé de l’article intitulé ”Refactoring Java Generics by Inferring
Wildcards, In Practice” écrit par John Altidor et Yannis Smaragdakis. Cet article traite
d’un outil, un algorithme, permettant de renommer et inférer des types plus génériques
d’instances de génériques Java en utilisant des Wildcards. Des statistiques ont montré que
sur les six principales librairies Java utilisant les génériques, 34% des déclarations valables
de signatures de type variant peuvent être généralisées, c’est à dire avec des types wildcard
plus généraux. Or, pour une généralisation, il faut en moyenne mettre à jour 146 autres
déclarations. Cela montre qu’il est très fastidieux de le faire à la main .
C’est dans cette perspective que nous allons étudier les principes de cet outil et voir
quelques exemples où celui ci pourrait améliorer notre code. Nous étudierons dans un
second temps sa sémantique, ainsi que les principes de généralisations avec ses problèmes
et les solutions apportées. Nous analyserons ensuite son algorithme pour enfin terminer
par ses applications.

Chapitre 2
Définition de la variance
2.1 Prémisse
La maintenance, la sécurité et la fiabilité des programmes Java augmentent quand les
librairies sont rénommées pour définir des classes génériques. En effet, les génériques per-
mettent à l’utilisateur d’indiquer au compilateur le type des éléments dans une collection
et donc d’augmenter la sécurité en éliminant les cast douteux. Seulement, les génériques
restreignent le sous typage comme nous le verrons dans un exemple ci-dessous.
Le mécanisme de variance dans les langages de programmation modernes essaie de résoudre
le problème en autorisant deux instanciations d’un générique qui est sous type d’un autre.
Le système de typage java utilise lui, le concept de ”wildcard”. C’est à dire, lors de l’uti-
lisation d’une classe, nous pouvons choisir de spécifier si elle réfère à une ”covariante”
”contravariante” ou ”invariante” version de la classe.
2.2 Variance
Afin de mieux comprendre les principes de l’outil, il est nécessaire de comprendre la
notion de variance. Prenons un exemple, en regardant la différence entre les tableaux et
les listes Java. Commen¸cons par les tableaux :
Number [ ] nombre = new Number [ 3 ] ;
nombre [ 0 ] = new Integer (10) ;
nombre [ 1 ] = new Double (3.14) ;
nombre [ 2 ] = new Byte (0) ;
On peut voir ici qu’un tableau peut contenir des éléments de type T et de n’importe
quel sous type de celui-ci. Java fait également état qu’un tableau S[] est un sous type de
T[] si S est sous type de T. On peut alors écrire :
Integer [ ] e n t i e r s = {1 ,2 ,3 ,4};
Number [ ] nombre = e n t i e r s ; // correct car Integer est sous type de Number
En revanche, avec les listes, cela soulève des problèmes :

2.2 Variance 4
List<Integer > e n t i e r s = new ArrayList<Integer >() ;
e n t i e r s . add (1) ;
e n t i e r s . add (2) ;
List<Number> nombres = e n t i e r s ; // erreur de compilation
Il y a un problème avec les types génériques. Le compilateur nous interdit formellement
de faire ¸ca. Tout ceci affecte le pouvoir du polymorphisme en java. La solution est d’utiliser
les outils des génériques java : la covariance et la contravariance.
2.2.1 La covariance
Ici, au lieu d’utiliser un type T comme argument de notre type générique, on utilise
une ”wildcard” <?extendsT > :
List <? extends Number> maliste = new ArrayList<Integer >() ;
List <? extends Number> maliste = new ArrayList<Float >() ;
List <? extends Number> maliste = new ArrayList<Double >() ;
Avec la covariance, nous pouvons lire des éléments d’une structure, mais rien n’écrire
dedans. Ainsi, ”Number n = maliste.get(0) ;” est autorisé.
En revanche ”maliste.add(3.14) ;” est refusé. En effet, le compilateur ne peut déterminer le
type exact de l’objet dans la structure générique. Cela peut être n’importe quoi qui étend
Number, mais le compilateur ne peut en être certain. Ainsi, toute tentative de retrouver
une valeur générique est considérée comme une opération non sûre et est donc rejetée
immédiatement par le compilateur.
2.2.2 La contravariance
Ici, on utilise une wildcard différente : <?superT >. La contravariance nous permet de
faire l’opération opposée. Nous pouvons lire dans une structure mais pas écrire.
List<Object> myObjs = new List<Object () ;
myObjs . add ( ” Hello ” ) ;
myObjs . add ( ”World” ) ;
List <? super Number> nombres = myObjs ;
nombres . add (10) ;
Dans ce cas, nous pouvons bien ajouter un Number dans la liste nombres car Number
a pour ancêtre Object. En revanche, ”Number n = nombres.get(0) ;” produit une erreur de
compilation. En effet nous ne sommes pas sûrs à 100% d’avoir un Number. Si le compilateur
laissait passer cela, nous pourrions avoir à l’exécution une ClassCastException. En somme,
nous utilisons la covariance quand nous voulons seulement lire une valeur générique dans
une structure et la contravariance quand on veut écrire dedans. Un dernier exemple pour
illustrer :

2.2 Variance 5
public s t a t i c void copy ( List <? extends Number> source ,
List <? super Number> destiny ) {
f or (Number number : source ) {
destiny . add (number) ;
}
}
List<Integer > myInts = asList (1 ,2 ,3 ,4) ;
List<Object> myObjs = new ArrayList<Object >() ;
copy ( myInts , myObjs) ;
Tous les types génériques sont étiquetés comme inhérents à la covariance, contrava-
riance, bivariant ou invariant au type de leurs paramètres. Cette inhérence peut donc être
employée à tous les types génériques.
Par exemple, nous pouvons changer de manière raisonnable toutes les occurences de Iterator <
T > en Iterator <?extendsT > ou bien Comparator < T > en Comparator <?superT >.
Des chercheurs ont alors développé un outil afin d’améliorer cette généralisation. Il possède
différentes fonctionnalités :
1. Pour aider le programmeur à utiliser la variance en Java, il permet de réécrire
automatiquement le code en un code avec des wildcards plus générales.
2. Cependant, tous les types ne peuvent pas être réécris, (ex : s’ils sont déclarés dans
une tierce autre librairie où le code source n’est pas disponible). Ainsi l’utilisateur
peut choisir de ne pas réécrire le code, si garder un type spécifique est préférable
pour une future mise à jour.
3. L’outil respecte la sémantique Java et préserve le comportement du programme.

Chapitre 3
Cas concret d’utilisation
Après avoir les principes de la covariance et la contravariance, nous allons voir main-
tenant un exemple d’utilisation de l’outil pour renommer des entités d’un programme.
Prenons le programme suivant :
c l a s s WList<E> {
private List<E> elems = new LinkedList<E>() ;
void add (E elem ) {
addAll ( C o l l e c t i o n s . s i n g l e t o n L i s t ( elem ) ) ;
}
void addAll ( List<E> source ) {
addAndLog( source . i t e r a t o r () , t h i s . elems ) ;
}
s t a t i c <T> void addAndLog( Iterator <T> itr , List<T> dest ) {
while ( i t r . hasNext () ) {
T elem = i t r . next () ;
log ( elem ) ;
dest . add ( elem ) ;
}
}
De manière générale, l’interface List est invariante. c’est à dire qu’elle autorise la lecture
et l’écriture d’un élément. Or dans la méthode addAndLog, pour la liste dest rien n’est
lu. On ne fait qu’ajouter un élément avec add. On peut alors se limiter à une version
contravariante de List en faisant un List <?superT > dest. Pour source, la seule méthode
invoquée est iterator() qui retourne un Iterator < E >. Or Iterator est covariant comme
nous l’avons vu précédemment. On peut alors de manière sûre inférer le type de source en
List <?extendsT >. Cependant, si on ne changeait que le type de source, le programme
ne compilerait pas. En effet, la méthode addLog attend un Iterator < T > mais on lui
fournit maintenant un Iterator <?extendsT > avec source. Une analyse du programme
est alors nécessaire pour savoir si la généralisation d’un type entraˆıne le changement de
type d’autres déclarations. Ce flot d’analyse doit prendre en compte les dépendances entre

7
chaque. Ici, nous pouvons alors changer le type de itr en Iterator <?extendsT >. Nous
obtenons alors :
c l a s s WList<E> {
private List<E> elems = new LinkedList<E>() ;
void add (E elem ) {
addAll ( C o l l e c t i o n s . s i n g l e t o n L i s t ( elem ) ) ;
}
void addAll ( List <? entends E> source ) {
addAndLog( source . i t e r a t o r () , t h i s . elems ) ;
}
s t a t i c <T> void addAndLog( Iterator <? extends T> itr , List <? super T> dest )
{
while ( i t r . hasNext () ) {
T elem = i t r . next () ;
log ( elem ) ;
dest . add ( elem ) ;
}
}
Apr`es avoir vu un exemple de son utilisation, nous allons maintenant ´etudier son fonc-
tionnement.

Chapitre 4
Le fonctionnement de l’outil
4.1 La syntaxe de la variance
L’outil de refractoring permet d’inférer la variance des types rencontrés dans un pro-
gramme.
La variance dans le langage Java est implicite. En effet, il n’y pas de syntaxe pour que le
programmeur puisse définir la variance d’un type.
Contrairement, au langage Scala où il est possible de définir la covariance et la contrava-
riance par, respectivement, les annotations + et -. En Scala, par défaut, un élément est
invariant.
L’outil de refractoring va donc se baser sur un ensemble de règles et s’inspirer de la syntaxe
de Scala pour la définition de la variance.
Intuitivement, la variance d’un élément est contraint par l’utilisation qu’on en fait. Par
exemple, le type des paramètres d’une méthode est généralement contravariant et le type
de retour d’une méthode est généralement covariant.
Ainsi, notons vx la variance de la variable X. Et, essayons de déterminer la variance de
quelques éléments sur un exemple plutôt simple :
i n t e r f a c e RList<X> { X get ( int i ) ; }
i n t e r f a c e WList<Y> { void set ( int i , Y y) ; }
i n t e r f a c e IList <Z> { Z setAndGet ( int i , Z z ) ; }
Dans l’interface RList, on remarque que la variable X est covariante car elle est le retour
de la méthode get. On note cela vx = + et se lit X est covariant dans RList.
Dans l’interface WList vY = - (contravariant) car Y est un des paramètres de la méthode
set.
Dans l’interface IList vz = o (invariant) car Z est à la fois covariant et contravariant.

4.2 L’analyse de l’influence des types 9
C’est de cette manière que l’on peut déterminer la variance d’un élément à partir d’une
définition générique.
Après avoir inférer une généralisation pour un type donné T, l’outil de refractoring permet
de remplacer le type T par sa généralisation.
En prenant l’exemple ci-dessous, l’outil de refractoring effectue les substitutions suivantes :
i n t e r f a c e RList<X> { X get ( int i ) ; }
i n t e r f a c e WList<Y> { void set ( int i , <? super Y> y) ; }
i n t e r f a c e IList <Z> { Z setAndGet ( int i , Z z ) ; }
4.2 L’analyse de l’influence des types
4.2.1 Le principe
Le fait de généraliser les types d’un programme implique de nombreux compromis. En
effet, plusieurs problèmes apparaissent lors de la généralisation d’un type :
1. Généraliser une List < String > par une List <? extends String > pose un certain
problème. C’est un exemple qui montre qu’en Java, il est impossible de redéfinir
La classe String. Il faut donc se poser la question des classes, des méthodes ...
immuables en Java.
2. La redéfinition de méthode est possible uniquement si les paramètres de la méthode
du fils sont identiques à celle du père. Ainsi, lorsque l’on généralise les types des pa-
ramètres d’une méthode fils, Java ne considère plus cette méthode comme redéfinition
de méthode de la méthode père. Or, on voudrait que ¸ca soit le cas.
3. La généralisation d’un type peut amener à généraliser d’autres éléments qui sont
plus ou moins dépendant de ce type. L’outil de refractoring ne doit pas ajouter
d’erreur de compilation et ne doit pas modifier la sémantique du programme.
Ces problèmes sont résolus en réalisant un graphe orienté des influences sur les déclarations
dans le programme.
Ainsi, l’outil de refractoring construit un graphe d’influence ; Pour chaque dépendance entre
les entités (variable, signature de méthode ...) A et B, il existe une arête qui lie les nœuds
correspondant aux entités A et B dans ce graphe.
Par la suite, lorsque l’on généralise l’entité A, on parcourt le graphe d’influence en généralisant
les noeuds connexe au noeud de l’entité A.
Pour pallier aux soucis 1, l’outil de refractoring décide quels éléments ne peuvent pas
être généralisés.
Concernant le problème 2, l’outil va considérer que la signature des paramètres de la

méthode m du fils est fortement dépendante de la signature de la méthode m du père.
Dans le graphe d’influence, on va donc ajouter une arête entre la signature de la méthode
père et celle du fils.
Pour donner une exemple clair au problème 3, si on généralise le type de retour d’une
méthode M alors les variables qui sont affectées par la valeur du résultat de la méthode M
doivent être généralisés. Il y aura donc un chemin dans le graphe d’influence qui va lier la
méthode M et les variables affectées par la valeur de M.
Prenons, un autre exemple, si l’on généralise les paramètres p1 et p2 d’une méthode M. Et
si dans le corps de cette méthode M, un objet O fait un appel à la méthode O.m(p1, p2).
Alors il faudra généraliser la signature de la méthode O.m. Il existe donc un chemin dans
le graphe d’influence entre l’objet O et les paramètres p1 et p2.
4.2.2 L’algorithme
Les noeuds du graphe d’influence possède la syntaxe abstraite suivante :
Figure 4.1 – Syntaxe du graphe d’influence
FieldDeclaration est la représentation des variables de classes ou d’objet.
V ariableDeclaration correspond à la déclaration de variables locales.
ParameterDeclarations correspond aux paramètres des méthodes ou des constructeurs.
MethodDecl correspond au type de retour d’une méthode.
On va également définir un langage pour décrire les programmes Java. Ce langage nous
permettra de définir des fonctions qui nous seront utiles pour l’algorithme d’analyse de l’in-
fluence des types et permet d’abstraire la complexité de la représentation d’un programme
Java.

Figure 4.2 – Mini langage
Avec cette syntaxe, on va pouvoir expliciter la variance des types par v ou w. Et, le
et T sont respectivement la dénotation du mot clé extends de Java et d’un tableau de
T1, T2, ...Tn
Définissons les règles des fonctions nodesAffectingType(e) et destinationNode(e) en
utilisant ce langage :
Figure 4.3 – Fonctions utilisés par l’algorithme

Explicitons ces fonctions.
nodesAffectingType(e) permet de retrouver l’ensemble des déclarations accesibles dans e
qui peut modifier le type de e. Et, destinationNode(e) donne l’ensemble des déclarations
dépendant de e. Ces fonctions seront très utilisées dans l’algorithme.
Pour chacune de ces fonctions, on a défini trois règles. Par exemple, la règle N-MonoMethod
déclare que si le retour de la méthode m ne dépend pas de e alors seule la déclaration de
m peut affecter le type < T > m < e >.
Parlons de l’algorithme de création du graphe d’influence. L’algorithme effectue trois pas-
sages sur le programme pour analyser :
1. Les appels de méthode : pour chaque appel de méthode < T > m < e > , on va
retrouver les déclarations de e dans le programme. On va également retrouver les
méthodes qui prennent exactement e en paramètre. Et, on va rajouter une arête
entre e et les paramètres des méthodes trouvées précédement.
2. Les expressions : pour chaque expression e , on cherche les déclarations D qui sont
affectées par e. Et, pour chaque déclaration N qui est accessible par e et qui peut
affecter e, on relie dans le graphe d’influence N et D.
3. Les déclarations de méthode : pour chaque déclaration de méthode M, on va trouver
les méthodes M qui redéfinissent ou sont rédéfinies par M. On va ajouter une arête
dans le graphe entre les paramètres des methodes M et M .
L’ensemble de ces règles permettent de construire le graphe d’influence d’un programme
Java Voici un pseudo code de l’algorithme :

Figure 4.4 – Pseudo code de l’algorithme du graphe d’inﬂuence

Chapitre 5
Les Applications de l’outil
Après avoir vu comment fonctionnait l’outil, nous pouvons voir que plus le nombre de
déclarations augmente dans le graphe, et plus le nombre de déclarations immuables fait
de même. Ainsi, moins de déclarations seront réécrites parce qu’il existera plus d’arêtes
où les réécritures sont interdites dans le graphe. Pour palier ce problème, les chercheurs
ont pensé qu’il fallait que l’analyse du programme ignore les déclarations qui ne peuvent
être afféctées par la généralisation, c’est à dire ne pas les mettre dans le graphe. Voyons
certains exemples de types que le flot d’analyse ignore :
1. Les types primitifs tels que les int, char, boolean ainsi que les types monomorphiques
comme String et Object. Ces types ne peuvent pas être modifiés avec des wildcards.
2. Les types paramétriques qui sont spécifiés bivariant ( ¡ ?¿ ). Ces types ne peuvent
pas être plus généralisés qu’ils ne le sont déjà.
L’outil permet donc de généraliser des classes en séléctionnant quelles déclarations
parmi les variables locales, les arguments ou retour de méthodes lesquels sont à renommer.
Des travaux précédents ont montré que 53% des interfaces et 37% des classes peuvent être
généralisées. Ceci montre alors l’impact que pourrait avoir cet outil si toutes ces déclarations
étaient réécrites. Il aiderait également les utilisateurs qui n’ont pas de grandes notions de
variance à améliorer les performances de leur code. Afin d’évaleur le potentiel de cet outils,
des statistiques ont permis de calculer combien de déclarations de types paramétriques
pouvaient être réécrites. L’outil à été testé sur six librairies java. Nous n’en montrerons
que trois ici :

15
Figure 5.1 – Statistiques des réécritures de toutes les déclarations pour les types
génériques
Prenons ici l’exemple des interfaces java, il existe 170 interfaces avec des types pa-
ramétrés. Parmi celles là, 148 peuvent être réécrites. Après le passage de l’outil, 34 ont été
réécrites, soit 20%. Sur l’ensemble des six librairies testées, nous obtenons un total 12% de
réécritures en prenant compte les classes et les interfaces, sur un potentiel de 73%. Cela
représente tout de même 2220 sur 18259 réécritures.

16
Figure 5.2 – Statistiques des réécritures de toutes les déclarations pour les types variant
Pour les types variant, nous voyons que nous obtenons de bien meilleures performances.
Sur l’ensemble des six librairies, on obtient un total de 34% de renommage.
De plus, la réécriture seule de JDK ne prend que deux minutes pour 198 milles lignes de
code.

Chapitre 6
Conclusion
En conclusion, après avoir vu quelques exemples d’utilisations ainsi que son fonctionne-
ment, nous pouvons voir que cet outil complexe nous permet d’améliorer les perfermances
de notre code en généralisant le plus possible les types paramétriques à l’aide de wildcards.
Cependant, en regardant les statistiques sur le pourcentage de renommage après le pas-
sage de l’outil sur les six principales librairies Java, 34% des génériques ont pu être plus
spécifiques avec des wildcards plus généralisées. Nous pouvons alors penser que cet outil
peut encore être amélioré. Des travaux futurs ont été evoqué dans ce sens.

Refractoring java generics by inferring wildcards

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (7)

Ähnlich wie Refractoring java generics by inferring wildcards

Ähnlich wie Refractoring java generics by inferring wildcards (20)

Refractoring java generics by inferring wildcards