SlideShare ist ein Scribd-Unternehmen logo
1 von 81
Downloaden Sie, um offline zu lesen
École Normale Supérieure
Langages de programmation
et compilation
Jean-Christophe Filliâtre
Cours 2 / 3 octobre 2013
compilation
schématiquement, un compilateur est un programme qui traduit un
≪ programme ≫ d’un langage source vers un langage cible, en signalant
d’éventuelles erreurs
langage source compilateur langage cible
erreurs
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 2
compilation vers le langage machine
quand on parle de compilation, on pense typiquement à la traduction d’un
langage de haut niveau (C, Java, OCaml, ...) vers le langage machine d’un
processeur (Intel Pentium, PowerPC, ...)
% gcc -o sum sum.c
source sum.c compilateur C (gcc) executable sum
int main(int argc, char **argv) {
int i, s = 0;
for (i = 0; i <= 100; i++) s += i*i;
printf("0*0+...+100*100 = %dn", s);
}
−→
00100111101111011111111111100000
10101111101111110000000000010100
10101111101001000000000000100000
10101111101001010000000000100100
10101111101000000000000000011000
10101111101000000000000000011100
10001111101011100000000000011100
...
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 3
langage cible
dans ce cours, nous allons effectivement nous intéresser à la compilation
vers de l’assembleur, mais ce n’est qu’un aspect de la compilation
un certain nombre de techniques mises en œuvre dans la compilation ne
sont pas liées à la production de code assembleur
certains langages sont d’ailleurs
interprétés (Basic, COBOL, Ruby, Python, etc.)
compilés dans un langage intermédiaire qui est ensuite interprété
(Java, OCaml, etc.)
compilés vers un autre langage de haut niveau
compilés à la volée
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 4
différence entre compilateur et interprète
un compilateur traduit un programme P en un programme Q tel que
pour toute entrée x, la sortie de Q(x) soit la même que celle de P(x)
∀P ∃Q ∀x...
un interprète est un programme qui, étant donné un programme P et une
entrée x, calcule la sortie s de P(x)
∀P ∀x ∃s...
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 5
différence entre compilateur et interprète
dit autrement,
le compilateur fait un travail complexe une seule fois, pour produire un
code fonctionnant pour n’importe quelle entrée
l’interprète effectue un travail plus simple, mais le refait sur chaque entrée
autre différence : le code compilé est généralement bien plus efficace que
le code interprété
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 6
exemple de compilation et d’interprétation
source lilypond fichier PostScript gs image
<<
chords { c2 c f2 c }
new Staff relative c’ { time 2/4 c4 c g’4 g a4 a g2 }
new Lyrics lyricmode { twin4 kle twin kle lit tle star2
>>
kle
twin
C
C
twin kle
4
2

lit
F
star

C
tle
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 7
qualité d’un compilateur
à quoi juge-t-on la qualité d’un compilateur ?
à sa correction
à l’efficacité du code qu’il produit
à sa propre efficacité
”Optimizing compilers are so difficult
to get right that we dare say that no
optimizing compiler is completely
error-free ! Thus, the most important
objective in writing a compiler is that it is
correct.” (Dragon Book, 2006)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 8
phases d’un compilateur
typiquement, le travail d’un compilateur se compose
d’une phase d’analyse
reconnaı̂t le programme à traduire et sa signification
signale les erreurs et peut donc échouer
(erreurs de syntaxe, de portée, de typage, etc.)
puis d’une phase de synthèse
production du langage cible
utilise de nombreux langages intermédiaires
n’échoue pas
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 9
phase d’analyse
source
↓
analyse lexicale
↓
suite de lexèmes (tokens)
↓
analyse syntaxique
↓
arbre de syntaxe abstraite (AST)
↓
analyse sémantique
↓
syntaxe abstraite + table des symboles
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 10
phase de synthèse
syntaxe abstraite
↓
production de code (nombreuses phases)
↓
langage assembleur
↓
assembleur (as)
↓
langage machine
↓
éditeur de liens (ld)
↓
code exécutable
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 11
aujourd’hui
assembleur
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 12
un peu d’arithmétique des ordinateurs
un entier est représenté par n bits,
conventionnellement numérotés de droite à gauche
bn−1 bn−2 . . . b1 b0
typiquement, n vaut 8, 16, 32, ou 64
les bits bn−1, bn−2, etc. sont dits de poids fort
les bits b0, b1, etc. sont dits de poids faible
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 13
entier non signé
bits = bn−1bn−2 . . . b1b0
valeur =
n−1
X
i=0
bi 2i
bits valeur
000. . .000 0
000. . .001 1
000. . .010 2
.
.
.
.
.
.
111. . .110 2n − 2
111. . .111 2n − 1
exemple : 001010102 = 42
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 14
entier signé : complément à deux
le bit de poids fort bn−1 est le bit de signe
bits = bn−1bn−2 . . . b1b0
valeur = −bn−12n−1
+
n−2
X
i=0
bi 2i
exemple : 110101102 = −42
bits valeur
100. . .000 −2n−1
100. . .001 −2n−1 + 1
.
.
.
.
.
.
111. . .110 −2
111. . .111 −1
000. . .000 0
000. . .001 1
000. . .010 2
.
.
.
.
.
.
011. . .110 2n−1 − 2
011. . .111 2n−1 − 1
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 15
attention
selon le contexte, on interprète ou non le bit bn−1 comme un bit de signe
exemple :
110101102 = −42 (8 bits signés)
110101102 = 214 (8 bits non signés)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 16
opérations
la machine fournit des opérations
bit à bit (AND, OR, XOR, NOT)
de décalage
logique à gauche (insère des 0 de poids faible)
← bn−3 . . . b1 b0 0 0 ←
logique à droite (insère des 0 de poids fort)
→ 0 0 bn−1 . . . b3 b2 →
arithmétique à droite (réplique le bit de signe)
→ bn−1 bn−1 bn−1 . . . b3 b2 →
arithmétiques (addition, soustraction, multiplication, etc.)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 17
un peu d’architecture
très schématiquement, un ordinateur est composé
d’une unité de calcul (CPU), contenant
un petit nombre de registres entiers ou flottants
des capacités de calcul
d’une mémoire vive (RAM)
composée d’un très grand nombre d’octets (8 bits)
par exemple, 1 Go = 230
octets = 233
bits, soit 2233
états possibles
contient des données et des instructions
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 18
un peu d’architecture
CPU $pc 0000052
$a0 0000012 $a1 0000040
$a2 0000022 $a3 0000000
$v0 0000000 ...
RAM
l’accès à la mémoire coûte cher (à un milliard d’instructions par seconde,
la lumière ne parcourt que 30 centimètres entre 2 instructions !)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 19
un peu d’architecture
la réalité est bien plus complexe
plusieurs (co)processeurs, dont certains dédiés aux flottants
un ou plusieurs caches
une virtualisation de la mémoire (MMU)
etc.
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 20
principe d’exécution
schématiquement, l’exécution d’un programme se déroule ainsi
un registre ($pc) contient l’adresse de l’instruction à exécuter
on lit les 4 (ou 8) octets à cette adresse (fetch)
on interprète ces bits comme une instruction (decode)
on exécute l’instruction (execute)
on modifie le registre $pc pour passer à l’instruction suivante
(typiquement celle se trouvant juste après, sauf en cas de saut)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 21
principe d’exécution
CPU $pc 0000052
$a0 0000012 $a1 0000040
$a2 0000022 $a3 0000000
$v0 0000000 ...
RAM
instruction : 001000 00110 00101 0000000000001010
décodage : addi $a2 $a1 10
i.e. ajouter 10 au registre $a2 et stocker le résultat dans le registre $a1
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 22
principe d’exécution
là encore la réalité est bien plus complexe
pipelines
plusieurs instructions sont exécutées en parallèle
prédiction de branchement
pour optimiser le pipeline, on tente de prédire les sauts conditionnels
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 23
quelle architecture pour ce cours ?
deux grandes familles de microprocesseurs
CISC (Complex Instruction Set)
beaucoup d’instructions
beaucoup de modes d’adressage
beaucoup d’instructions lisent / écrivent en mémoire
peu de registres
exemples : VAX, PDP-11, Motorola 68xxx, Intel x86
RISC (Reduced Instruction Set)
peu d’instructions, régulières
très peu d’instructions lisent / écrivent en mémoire
beaucoup de registres, uniformes
exemples : Alpha, Sparc, MIPS, ARM
on choisit MIPS pour ce cours (les TD et le projet)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 24
l’architecture MIPS
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 25
l’architecture MIPS
32 registres, $0 à $31
$0 contient toujours 0
utilisables sous d’autres noms, correspondant à des conventions
(zero, at, v0–v1, a0–a3, t0–t9, s0–s7, k0–k1, gp, sp, fp, ra)
trois types d’instructions
instructions de transfert, entre registres et mémoire
instructions de calcul
instructions de saut
(documentation sur le site du cours)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 26
assembleur MIPS
on ne programme pas en langage machine mais en assembleur
l’assembleur fourni un certain nombre de facilités :
étiquettes symboliques
allocation de données globales
pseudo-instructions
le langage assembleur est transformé en langage machine par un
programme appelé également assembleur (c’est un compilateur)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 27
assembleur MIPS
la directive
.text
indique que des instructions suivent, et la directive
.data
indique que des données suivent
le code sera chargé à partir de l’adresse 0x400000
et les données à partir de l’adresse 0x10000000
.
.
.
données
code
(réservé)
7FFFFFFC16→
1000000016→
40000016→
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 28
exemple : hello world
.text
main: li $v0, 4 # code de print_string
la $a0, hw # adresse de la cha^
ıne
syscall # appel système
li $v0, 10 # exit
syscall
.data
hw: .asciiz hello worldn
(.asciiz est une facilité pour .byte 104, 101, ... 0)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 29
simulateurs MIPS
en pratique, on utilisera un simulateur MIPS, MARS (ou SPIM)
en ligne de commande
java -jar Mars 4 2.jar file.s
en mode graphique et interactif
java -jar Mars 4 2.jar
charger le fichier et l’assembler
mode pas à pas, visualisation des registres, de la mémoire, etc.
(documentation sur le site du cours)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 30
jeu d’instructions : constantes, adresses et copies
chargement d’une constante dans un registre
li $a0, 42 # a0 - 42
li $a0, -65536 # a0 - -65536
chargement de l’adresse d’une étiquette dans un registre
la $a0, label
copie d’un registre dans un autre
move $a0, $a1 # copie a1 dans a0 !
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 31
jeu d’instructions : arithmétique
addition de deux registres
add $a0, $a1, $a2 # a0 - a1 + a2
add $a2, $a2, $t5 # a2 - a2 + t5
de même, sub, mul, div
addition d’un registre et d’une constante
addi $a0, $a1, 42 # a0 - a1 + 42
(mais pas subi, muli ou divi !)
négation
neg $a0, $a1 # a0 - -a1
valeur absolue
abs $a0, $a1 # a0 - |a1|
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 32
jeu d’instructions : opérations sur les bits
NON logique (not(1001112) = 0110002)
not $a0, $a1 # a0 - not(a1)
ET logique (and(1001112, 1010012) = 1000012)
and $a0, $a1, $a2 # a0 - and(a1, a2)
andi $a0, $a1, 0x3f # a0 - and(a1, 0...0111111)
OU logique (or(1001112, 1010012) = 1011112)
or $a0, $a1, $a2 # a0 - or(a1, a2)
ori $a0, $a1, 42 # a0 - or(a1, 0...0101010)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 33
jeu d’instructions : décalages
décalage à gauche (insertion de zéros)
sll $a0, $a1, 2 # a0 - a1 * 4
sllv $a1, $a2, $a3 # a1 - a2 * 2^a3
décalage à droite arithmétique (copie du bit de signe)
sra $a0, $a1, 2 # a0 - a1 / 4
décalage à droite logique (insertion de zéros)
srl $a0, $a1, 2
rotation
rol $a0, $a1, 2
ror $a0, $a1, 3
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 34
jeu d’instructions : tests
comparaison de deux registres
slt $a0, $a1, $a2 # a0 - 1 si a1  a2
# 0 sinon
ou d’un registre et d’une constante
slti $a0, $a1, 42
variantes : sltu (comparaison non signée), sltiu
de même : sle, sleu / sgt, sgtu / sge, sgeu
égalité : seq, sne
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 35
jeu d’instructions : transfert (lecture)
lire un mot (32 bits) en mémoire
lw $a0, 42($a1) # a0 - mem[a1 + 42]
l’adresse est donnée par un registre et un décalage sur 16 bits signés
variantes pour lire 8 ou 16 bits, signés ou non (lb, lh, lbu, lhu)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 36
jeu d’instructions : transfert (écriture)
écrire un mot (32 bits) en mémoire
sw $a0, 42($a1) # mem[a1 + 42] - a0
# attention au sens !
l’adresse est donnée par un registre et un décalage sur 16 bits signés
variantes pour écrire 8 ou 16 bits (sb, sh)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 37
jeu d’instructions : branchements et sauts
on distingue
branchement : typiquement un saut conditionnel, dont le
déplacement est stocké sur 16 bits signés (-32768 à 32767
instructions)
saut : saut inconditionnel, dont l’adresse de destination est stockée
sur 26 bits
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 38
jeu d’instructions : branchements
branchement conditionnel
beq $a0, $a1, label # si a0 = a1 saute à label
# ne fait rien sinon
variantes : bne, blt, ble, bgt, bge (et comparaisons non signées)
variantes : beqz, bnez, bgez, bgtz, bltz, blez
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 39
jeu d’instructions : sauts
saut inconditionnel
à une adresse (jump)
j label
avec sauvegarde de l’adresse de l’instruction suivante dans $ra
jal label # jump and link
à une adresse contenue dans un registre
jr $a0
avec l’adresse contenue dans $a0 et sauvegarde dans $a1
jalr $a0, $a1
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 40
jeu d’instructions : appel système
quelques appels système fournis par une instruction spéciale
syscall
le code de l’instruction doit être dans $v0, les arguments dans $a0–$a3 ;
le résultat éventuel sera placé dans $v0
exemple : appel système print int pour afficher un entier
li $v0, 1 # code de print_int
li $a0, 42 # valeur à afficher
syscall
de même read int, print string, etc. (voir la documentation)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 41
le défi de la compilation
c’est de traduire un programme d’un langage de haut niveau vers ce jeu
d’instructions
en particulier, il faut
traduire les structures de contrôle (tests, boucles, exceptions, etc.)
traduire les appels de fonctions
traduire les structures de données complexes (tableaux,
enregistrements, objets, clôtures, etc.)
allouer de la mémoire dynamiquement
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 42
appels de fonctions
constat : les appels de fonctions peuvent être arbitrairement imbriqués
⇒ les registres ne peuvent suffire pour les paramètres / variables locales
⇒ il faut allouer de la mémoire pour cela
les fonctions procèdent selon un mode last-in first-out, c’est-à-dire de pile
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 43
la pile
pile
↓
↑
données
dynamiques
(tas)
données
statiques
code
la pile est stockée tout en haut, et croı̂t dans le
sens des adresses décroissantes ; $sp pointe sur le
sommet de la pile
les données dynamiques (survivant aux appels de
fonctions) sont allouées sur le tas (éventuellement
par un GC), en bas de la zone de données, juste au
dessus des données statiques
ainsi, on ne se marche pas sur les pieds
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 44
appel de fonction
lorsqu’une fonction f (l’appelant ou caller) souhaite appeler une fonction
g (l’appelé ou callee), elle exécute
jal g
et lorsque l’appelé en a terminé, il lui rend le contrôle avec
jr $ra
problème :
si g appelle elle-même une fonction, $ra sera écrasé
de même, tout registre utilisé par g sera perdu pour f
il existe de multiples manières de s’en sortir,
mais en général on s’accorde sur des conventions d’appel
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 45
conventions d’appel
utilisation des registres
$at, $k0 et $k1 sont réservés à l’assembleur et l’OS
$a0–$a3 sont utilisés pour passer les quatre premiers arguments (les
autres sont passés sur la pile) et $v0–$v1 pour renvoyer le résultat
$t0–$t9 sont des registres caller-saved i.e. l’appelant doit les
sauvegarder si besoin ; on y met donc typiquement des données qui
n’ont pas besoin de survivre aux appels
$s0–$s7 sont des registres callee-saved i.e. l’appelé doit les
sauvegarder ; on y met donc des données de durée de vie longue,
ayant besoin de survivre aux appels
$sp est le pointeur de pile, $fp le pointeur de frame
$ra contient l’adresse de retour
$gp pointe au milieu de la zone de données statiques (1000800016)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 46
l’appel, en quatre temps
il y a quatre temps dans un appel de fonction
1 pour l’appelant, juste avant l’appel
2 pour l’appelé, au début de l’appel
3 pour l’appelé, à la fin de l’appel
4 pour l’appelant, juste après l’appel
s’organisent autour d’un segment situé au sommet de la pile appelé le
tableau d’activation, en anglais stack frame, situé entre $fp et $sp
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 47
l’appelant, juste avant l’appel
1 passe les arguments dans $a0–$a3, les autres sur la pile s’il y en a
plus de 4
2 sauvegarde les registres $t0–$t9 qu’il compte utiliser après l’appel
(dans son propre tableau d’activation)
3 exécute
jal appelé
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 48
l’appelé, au début de l’appel
1 alloue son tableau d’activation, par exemple
addi $sp, $sp, -28
2 sauvegarde $fp puis le positionne, par exemple
sw $fp, 24($sp)
addi $fp, $sp, 24
3 sauvegarde $s0–$s7 et $ra si besoin
...
argument 5
argument 6
registres
sauvés
variables
locales
↓
$fp→
$sp→
$fp permet d’atteindre facilement les arguments et variables locales, avec
un décalage fixe quel que soit l’état de la pile
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 49
l’appelé, à la fin de l’appel
1 place le résultat dans $v0 (voire $v1)
2 restaure les registres sauvegardés
3 dépile son tableau d’activation, par exemple
addi $sp, $sp, 28
4 exécute
jr $ra
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 50
l’appelant, juste après l’appel
1 dépile les éventuels arguments 5, 6, ...
2 restaure les registres caller-saved
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 51
exercice 1
exercice : programmer la fonction suivante
isqrt(n) ≡
c ← 0
s ← 1
while s ≤ n
c ← c + 1
s ← s + 2c + 1
return c
afficher la valeur de isqrt(17)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 52
exercice 2
exercice : programmer la fonction factorielle
avec une boucle
avec une fonction récursive
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 53
récapitulation
une machine fournit
un jeu limité d’instructions, très primitives
des registres efficaces, un accès coûteux à la mémoire
la mémoire est découpée en
code / données statiques / tas (données dynamiques) / pile
les appels de fonctions s’articulent autour
d’une notion de tableau d’activation
de conventions d’appel
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 54
un exemple de compilation
t(a,b,c){int d=0,e=a~b~c,f=1;if(a)
for(f=0;d=(e-=d)-e;f+=t(a-d,(b+d)*2,
(c+d)/2));return f;}main(q){scanf(%d,
q);printf(%dn,t(~(~0q),0,0));}
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 55
clarification
int t(int a, int b, int c) {
int d=0, e=a~b~c, f=1;
if (a)
for (f=0; d=(e-=d)-e; f+=t(a-d, (b+d)*2, (c+d)/2));
return f;
}
int main() {
int q;
scanf(%d, q);
printf(%dn, t(~(~0q), 0, 0));
}
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 56
clarification (suite)
int t(int a, int b, int c) {
int f=1;
if (a) {
int d, e=a~b~c;
f = 0;
while (d=e-e) {
f += t(a-d, (b+d)*2, (c+d)/2);
e -= d;
}
}
return f;
}
int main() {
int q;
scanf(%d, q);
printf(%dn, t(~(~0q), 0, 0));
}
ce programme calcule
le nombre de solutions
du problème dit
des n reines
q
q
q
q
q
q
q
q
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 57
comment ça marche ?
recherche par force brute (backtracking)
entiers utilisés comme des ensembles :
par ex. 13 = 0 · · · 011012 = {0, 2, 3}
entiers ensembles
0 ∅
ab a ∩ b
a+b a ∪ b, quand a ∩ b = ∅
a-b a b, quand b ⊆ a
~a ∁a
a-a min(a), quand a 6= ∅
~(~0n) {0, 1, . . . , n − 1}
a*2 {i + 1 | i ∈ a}, noté S(a)
a/2 {i − 1 | i ∈ a ∧ i 6= 0}, noté P(a)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 58
justification de a-a
en complément à deux : -a = ~a+1
a = bn−1bn−2 . . . bk10 . . . 0
~a = bn−1bn−2 . . . bk01 . . . 1
-a = bn−1bn−2 . . . bk10 . . . 0
a-a = 0 0 . . . 010 . . . 0
exemple :
a = 00001100 = 12
-a = 11110100 = −128 + 116
a-a = 00000100
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 59
clarification : version ensembliste
int t(a, b, c)
f ← 1
if a 6= ∅
e ← (ab)c
f ← 0
while e 6= ∅
d ← min(e)
f ← f + t(a{d}, S(b ∪ {d}), P(c ∪ {d}))
e ← e{d}
return f
int queens(n)
return t({0, 1, . . . , n − 1}, ∅, ∅)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 60
signification de a, b et c
? ? ? ?
q
?
q
? ?
q
?
q q q
q
q
q
q
q
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 61
intérêt de ce programme pour la compilation
int t(int a, int b, int c) {
int f=1;
if (a) {
int d, e=a~b~c;
f = 0;
while (d=e-e) {
f += t(a-d,(b+d)*2,(c+d)/2);
e -= d;
}
}
return f;
}
int main() {
int q;
scanf(%d, q);
printf(%dn, t(~(~0q), 0, 0));
}
court, mais contient
un test (if)
une boucle (while)
une fonction récursive
quelques calculs
c’est aussi une
excellente solution
au problème des n reines
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 62
compilation
commençons par la fonction récursive t ; il faut
allouer les registres
compiler
le test
la boucle
l’appel récursif
les différents calculs
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 63
allocation de registres
a, b et c sont passés dans $a0, $a1 et $a2
le résultat est renvoyé dans $v0
les paramètres a, b, c, tout comme les variables locales d, e, f, ont
besoin d’être sauvegardés, car ils sont utilisés après l’appel récursif
⇒ on va utiliser des registres callee-save
a $s0
b $s1
c $s2
d $s3
e $s4
f $s5
il faut donc allouer 7 mots sur la pile pour sauvegarder l’adresse de
retour $ra et ces 6 registres
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 64
sauvegarde / restauration des registres
t: addi $sp, $sp, -28 # allocation de 7 mots
sw $ra, 24($sp) # sauvegarde des registres
sw $s0, 20($sp)
sw $s1, 16($sp)
sw $s2, 12($sp)
sw $s3, 8($sp)
sw $s4, 4($sp)
sw $s5, 0($sp)
...
lw $ra, 24($sp) # restauration des registres
lw $s0, 20($sp)
lw $s1, 16($sp)
lw $s2, 12($sp)
lw $s3, 8($sp)
lw $s4, 4($sp)
lw $s5, 0($sp)
addi $sp, $sp, 28 # désallocation
jr $ra
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 65
compilation du test
int t(int a, int b, int c) {
int f=1;
if (a) {
...
}
return f;
}
li $s5, 1
beqz $a0, t return
...
t return:
move $v0, $s5
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 66
cas général (a 6= 0)
if (a) {
int d, e=a~b~c;
f = 0;
while ...
}
move $s0, $a0 # sauvegarde
move $s1, $a1
move $s2, $a2
move $s4, $s0 # e=a~b~c
not $t0, $s1
and $s4, $s4, $t0
not $t0, $s2
and $s4, $s4, $t0
li $s5, 0 # f = 0
noter l’utilisation d’un registre temporaire $t0 non sauvegardé
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 67
compilation de la boucle
while (test) {
body
}
...
L1: ...
calcul de test dans $t0
...
beqz $t0, L2
...
body
...
j L1
L2: ...
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 68
compilation de la boucle
il existe cependant une meilleure solution
while (test) {
body
}
...
j L2
L1: ...
body
...
L2: ...
test
...
bnez $t0, L1
ainsi on fait seulement un seul branchement par tour de boucle
(mis à part la toute première fois)
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 69
compilation de la boucle
while (d=e-e) {
f += t(a-d,
(b+d)*2,
(c+d)/2);
e -= d;
}
j test
body:
sub $a0, $s0, $s3 # a-d
add $a1, $s1, $s3 # (b+d)*2
sll $a1, $a1, 1
add $a2, $s2, $s3 # (c+d)/2
srl $a2, $a2, 1
jal t
add $s5, $s5, $v0
sub $s4, $s4, $s3 # e -= d
test:
neg $t0, $s4 # d=e-e
and $s3, $s4, $t0
bnez $s3, body
t return:
...
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 70
programme principal
int main() {
int q;
scanf(%d, q);
printf(%dn,
t(~(~0q), 0, 0));
}
main:
li $v0, 5 # read_int
syscall
li $a0, 0 # t(...)
not $a0, $a0
sllv $a0, $a0, $v0
not $a0, $a0
li $a1, 0
li $a2, 0
jal t
move $a0, $v0 # printf
li $v0, 1
syscall
li $v0, 4
la $a0, newline
syscall
li $v0, 10 # exit
syscall
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 71
optimisation
ce code n’est pas optimal
par exemple, dans le cas a = 0, on sauve/restaure inutilement les registres
(y compris $ra), alors qu’on pourrait se contenter de
li $v0, 1
jr $ra
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 72
un peu d’assembleur x86-64
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 73
exemple : hello world
.globl start # point d’entrée pour ld
.text
start:
# sys_write(stdout, message, length)
mov $1, %rax # sys_write
mov $1, %rdi # 1 = sortie standard
mov $message, %rsi # adresse de la cha^
ıne
mov $length, %rdx # longueur de la cha^
ıne
syscall
# sys_exit(return_code)
mov $60, %rax # sys_exit
mov $0, %rdi # code de retour 0 = succès
syscall
.data
message:
.ascii Hello, world!n
.set length, . - message # . = adresse courante
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 74
exécution
assemblage
 as hello.s -o hello.o
édition de liens
 ld hello.o -o hello
exécution
 ./hello
Hello, world!
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 75
avec gcc et la libc
.text
.globl main
main:
movq $message, %rdi # premier argument dans %rdi
call puts
movq $0, %rax # return 0
ret
.data
message:
.string Hello, world!
 gcc -o hello hello.s
Hello, world!
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 76
différences avec MIPS
16 registres 64 bits
(%rax, %rbx, %rcx, %rdx, %rsi, %rdi, %rbp, %rsp,
%r8, %r9, %r10, %r11, %r12, %r13, %r14, %r15)
jeu d’instructions beaucoup plus large (CISC)
call empile l’adresse de retour, ret la dépile
syntaxe assembleur GNU à la ATT : instruction source, destination
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 77
gdb
une exécution pas à pas est possible avec gdb (the GNU debugger)
 gcc -g hw.s -o hw
 gdb hw
GNU gdb (GDB) 7.1-ubuntu
...
(gdb) break main
Breakpoint 1 at 0x400524: file hw.s, line 4.
(gdb) run
Starting program: .../hw
Breakpoint 1, main () at hw.s:4
4 movq $message, %rdi
(gdb) step
5 call puts
(gdb) info registers
...
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 78
pour en savoir plus
lire
Computer Systems : A Programmer’s Perspective
(R. E. Bryant, D. R. O’Hallaron)
son supplément PDF x86-64 Machine-Level Programming
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 79
leçon
produire du code assembleur efficace n’est pas chose aisée
(observer le code produit avec gcc -S -fverbose-asm ou encore
ocamlopt -S)
maintenant il va falloir automatiser tout ce processus
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 80
la suite
TD demain
petits exercices d’assembleur MIPS
génération de code pour un mini-langage d’expressions arithmétiques
Cours jeudi prochain
syntaxe abstraite
sémantique
interprètes
Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 81

Weitere ähnliche Inhalte

Ähnlich wie 0419-langages-de-programmation-et-compilation.pdf

Chap1V2019: Cours en C++
Chap1V2019: Cours en C++Chap1V2019: Cours en C++
Chap1V2019: Cours en C++Aziz Darouichi
 
C# et .NET : Enigmes et puzzles
C# et .NET : Enigmes  et puzzlesC# et .NET : Enigmes  et puzzles
C# et .NET : Enigmes et puzzlesMicrosoft
 
Chapitre 3 - Généralités sur le langage C.pdf
Chapitre 3 - Généralités sur le langage C.pdfChapitre 3 - Généralités sur le langage C.pdf
Chapitre 3 - Généralités sur le langage C.pdfShiniGami0o0
 
Technologies du Web - Architectures matérielles et logicielles
Technologies du Web - Architectures matérielles et logiciellesTechnologies du Web - Architectures matérielles et logicielles
Technologies du Web - Architectures matérielles et logiciellesFrédéric Simonet
 
Cours asm (1)
Cours asm (1)Cours asm (1)
Cours asm (1)sunprass
 
Développer en natif avec C++11
Développer en natif avec C++11Développer en natif avec C++11
Développer en natif avec C++11Microsoft
 
Formation python
Formation pythonFormation python
Formation pythonj_lipaz
 
ESGAE_C#_2021-2024 Cours Avancé (('.pptx
ESGAE_C#_2021-2024 Cours Avancé (('.pptxESGAE_C#_2021-2024 Cours Avancé (('.pptx
ESGAE_C#_2021-2024 Cours Avancé (('.pptxLagloireSouamounou
 
C1 - Langage C - ISIMA - Première partie
C1 - Langage C - ISIMA - Première partieC1 - Langage C - ISIMA - Première partie
C1 - Langage C - ISIMA - Première partieLoic Yon
 
Théorie des langages - 03 - Principes et paradigmes
Théorie des langages - 03 - Principes et paradigmesThéorie des langages - 03 - Principes et paradigmes
Théorie des langages - 03 - Principes et paradigmesYann Caron
 
COURS C++ [Enregistrement automatique]Complet (1).pptx
COURS C++ [Enregistrement automatique]Complet (1).pptxCOURS C++ [Enregistrement automatique]Complet (1).pptx
COURS C++ [Enregistrement automatique]Complet (1).pptxLuneSabsPericolo1
 
representation_numerique_de_l_information_annote.ppt
representation_numerique_de_l_information_annote.pptrepresentation_numerique_de_l_information_annote.ppt
representation_numerique_de_l_information_annote.pptphysikcollege
 
Conférence Shinken à SophiaConf2012 (Jean Gabès)
Conférence Shinken à SophiaConf2012 (Jean Gabès)Conférence Shinken à SophiaConf2012 (Jean Gabès)
Conférence Shinken à SophiaConf2012 (Jean Gabès)Jean Gabès
 
Programmation événementielle avec VB (ISIG)
Programmation événementielle avec VB (ISIG)Programmation événementielle avec VB (ISIG)
Programmation événementielle avec VB (ISIG)ISIG
 

Ähnlich wie 0419-langages-de-programmation-et-compilation.pdf (20)

Chap1V2019: Cours en C++
Chap1V2019: Cours en C++Chap1V2019: Cours en C++
Chap1V2019: Cours en C++
 
C# et .NET : Enigmes et puzzles
C# et .NET : Enigmes  et puzzlesC# et .NET : Enigmes  et puzzles
C# et .NET : Enigmes et puzzles
 
Langage C
Langage CLangage C
Langage C
 
Chapitre 3 - Généralités sur le langage C.pdf
Chapitre 3 - Généralités sur le langage C.pdfChapitre 3 - Généralités sur le langage C.pdf
Chapitre 3 - Généralités sur le langage C.pdf
 
Technologies du Web - Architectures matérielles et logicielles
Technologies du Web - Architectures matérielles et logiciellesTechnologies du Web - Architectures matérielles et logicielles
Technologies du Web - Architectures matérielles et logicielles
 
Cours compilation
Cours compilationCours compilation
Cours compilation
 
Cours asm (1)
Cours asm (1)Cours asm (1)
Cours asm (1)
 
Développer en natif avec C++11
Développer en natif avec C++11Développer en natif avec C++11
Développer en natif avec C++11
 
2-Algo.ppt
2-Algo.ppt2-Algo.ppt
2-Algo.ppt
 
Formation python
Formation pythonFormation python
Formation python
 
ESGAE_C#_2021-2024 Cours Avancé (('.pptx
ESGAE_C#_2021-2024 Cours Avancé (('.pptxESGAE_C#_2021-2024 Cours Avancé (('.pptx
ESGAE_C#_2021-2024 Cours Avancé (('.pptx
 
Microsoft07coursbaptiste
Microsoft07coursbaptisteMicrosoft07coursbaptiste
Microsoft07coursbaptiste
 
C1 - Langage C - ISIMA - Première partie
C1 - Langage C - ISIMA - Première partieC1 - Langage C - ISIMA - Première partie
C1 - Langage C - ISIMA - Première partie
 
Chap1: Cours en C++
Chap1: Cours en C++Chap1: Cours en C++
Chap1: Cours en C++
 
Théorie des langages - 03 - Principes et paradigmes
Théorie des langages - 03 - Principes et paradigmesThéorie des langages - 03 - Principes et paradigmes
Théorie des langages - 03 - Principes et paradigmes
 
COURS C++ [Enregistrement automatique]Complet (1).pptx
COURS C++ [Enregistrement automatique]Complet (1).pptxCOURS C++ [Enregistrement automatique]Complet (1).pptx
COURS C++ [Enregistrement automatique]Complet (1).pptx
 
Cours langage-c
Cours langage-cCours langage-c
Cours langage-c
 
representation_numerique_de_l_information_annote.ppt
representation_numerique_de_l_information_annote.pptrepresentation_numerique_de_l_information_annote.ppt
representation_numerique_de_l_information_annote.ppt
 
Conférence Shinken à SophiaConf2012 (Jean Gabès)
Conférence Shinken à SophiaConf2012 (Jean Gabès)Conférence Shinken à SophiaConf2012 (Jean Gabès)
Conférence Shinken à SophiaConf2012 (Jean Gabès)
 
Programmation événementielle avec VB (ISIG)
Programmation événementielle avec VB (ISIG)Programmation événementielle avec VB (ISIG)
Programmation événementielle avec VB (ISIG)
 

Kürzlich hochgeladen

WBS OBS RACI_2020-etunhjjlllllll pdf.pdf
WBS OBS RACI_2020-etunhjjlllllll pdf.pdfWBS OBS RACI_2020-etunhjjlllllll pdf.pdf
WBS OBS RACI_2020-etunhjjlllllll pdf.pdfSophie569778
 
firefly algoriyhm sac a dos step by step .pdf
firefly algoriyhm sac a dos step by step .pdffirefly algoriyhm sac a dos step by step .pdf
firefly algoriyhm sac a dos step by step .pdffirstjob4
 
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfJTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfInstitut de l'Elevage - Idele
 
GAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentesGAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentesInstitut de l'Elevage - Idele
 
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...Institut de l'Elevage - Idele
 
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...Institut de l'Elevage - Idele
 
JTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfJTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfInstitut de l'Elevage - Idele
 
conception d'un batiment r+4 comparative de defferente ariante de plancher
conception d'un  batiment  r+4 comparative de defferente ariante de plancherconception d'un  batiment  r+4 comparative de defferente ariante de plancher
conception d'un batiment r+4 comparative de defferente ariante de planchermansouriahlam
 
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenusGAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenusInstitut de l'Elevage - Idele
 
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...Institut de l'Elevage - Idele
 
JTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfJTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfInstitut de l'Elevage - Idele
 
GAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engageGAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engageInstitut de l'Elevage - Idele
 
comprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestioncomprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestionyakinekaidouchi1
 
GAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversitéGAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversitéInstitut de l'Elevage - Idele
 
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...Institut de l'Elevage - Idele
 
GAL2024 - Consommations et productions d'énergies dans les exploitations lait...
GAL2024 - Consommations et productions d'énergies dans les exploitations lait...GAL2024 - Consommations et productions d'énergies dans les exploitations lait...
GAL2024 - Consommations et productions d'énergies dans les exploitations lait...Institut de l'Elevage - Idele
 
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...Institut de l'Elevage - Idele
 
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024Ville de Châteauguay
 

Kürzlich hochgeladen (20)

WBS OBS RACI_2020-etunhjjlllllll pdf.pdf
WBS OBS RACI_2020-etunhjjlllllll pdf.pdfWBS OBS RACI_2020-etunhjjlllllll pdf.pdf
WBS OBS RACI_2020-etunhjjlllllll pdf.pdf
 
firefly algoriyhm sac a dos step by step .pdf
firefly algoriyhm sac a dos step by step .pdffirefly algoriyhm sac a dos step by step .pdf
firefly algoriyhm sac a dos step by step .pdf
 
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdfJTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
JTC 2024 - SMARTER Retour sur les indicateurs de santé .pdf
 
GAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentesGAL2024 - Changements climatiques et maladies émergentes
GAL2024 - Changements climatiques et maladies émergentes
 
JTC 2024 Bâtiment et Photovoltaïque.pdf
JTC 2024  Bâtiment et Photovoltaïque.pdfJTC 2024  Bâtiment et Photovoltaïque.pdf
JTC 2024 Bâtiment et Photovoltaïque.pdf
 
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
JTC 2024 - Leviers d’adaptation au changement climatique, qualité du lait et ...
 
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
GAL2024 - Traite des vaches laitières : au coeur des stratégies d'évolution d...
 
JTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdfJTC 2024 La relance de la filière de la viande de chevreau.pdf
JTC 2024 La relance de la filière de la viande de chevreau.pdf
 
conception d'un batiment r+4 comparative de defferente ariante de plancher
conception d'un  batiment  r+4 comparative de defferente ariante de plancherconception d'un  batiment  r+4 comparative de defferente ariante de plancher
conception d'un batiment r+4 comparative de defferente ariante de plancher
 
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenusGAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
GAL2024 - Situation laitière 2023-2024 : consommation, marchés, prix et revenus
 
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
GAL2024 - Renouvellement des actifs : un enjeu pour la filière laitière franç...
 
JTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdfJTC 2024 - Réglementation européenne BEA et Transport.pdf
JTC 2024 - Réglementation européenne BEA et Transport.pdf
 
GAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engageGAL2024 - Décarbonation du secteur laitier : la filière s'engage
GAL2024 - Décarbonation du secteur laitier : la filière s'engage
 
comprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestioncomprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestion
 
GAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversitéGAL2024 - L'élevage laitier cultive la biodiversité
GAL2024 - L'élevage laitier cultive la biodiversité
 
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
GAL2024 - Parcellaire des fermes laitières : en enjeu de compétitivité et de ...
 
GAL2024 - Consommations et productions d'énergies dans les exploitations lait...
GAL2024 - Consommations et productions d'énergies dans les exploitations lait...GAL2024 - Consommations et productions d'énergies dans les exploitations lait...
GAL2024 - Consommations et productions d'énergies dans les exploitations lait...
 
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
GAL2024 - Méthane 2030 : une démarche collective française à destination de t...
 
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
 
JTC 2024 - DeCremoux_Anomalies_génétiques.pdf
JTC 2024 - DeCremoux_Anomalies_génétiques.pdfJTC 2024 - DeCremoux_Anomalies_génétiques.pdf
JTC 2024 - DeCremoux_Anomalies_génétiques.pdf
 

0419-langages-de-programmation-et-compilation.pdf

  • 1. École Normale Supérieure Langages de programmation et compilation Jean-Christophe Filliâtre Cours 2 / 3 octobre 2013
  • 2. compilation schématiquement, un compilateur est un programme qui traduit un ≪ programme ≫ d’un langage source vers un langage cible, en signalant d’éventuelles erreurs langage source compilateur langage cible erreurs Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 2
  • 3. compilation vers le langage machine quand on parle de compilation, on pense typiquement à la traduction d’un langage de haut niveau (C, Java, OCaml, ...) vers le langage machine d’un processeur (Intel Pentium, PowerPC, ...) % gcc -o sum sum.c source sum.c compilateur C (gcc) executable sum int main(int argc, char **argv) { int i, s = 0; for (i = 0; i <= 100; i++) s += i*i; printf("0*0+...+100*100 = %dn", s); } −→ 00100111101111011111111111100000 10101111101111110000000000010100 10101111101001000000000000100000 10101111101001010000000000100100 10101111101000000000000000011000 10101111101000000000000000011100 10001111101011100000000000011100 ... Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 3
  • 4. langage cible dans ce cours, nous allons effectivement nous intéresser à la compilation vers de l’assembleur, mais ce n’est qu’un aspect de la compilation un certain nombre de techniques mises en œuvre dans la compilation ne sont pas liées à la production de code assembleur certains langages sont d’ailleurs interprétés (Basic, COBOL, Ruby, Python, etc.) compilés dans un langage intermédiaire qui est ensuite interprété (Java, OCaml, etc.) compilés vers un autre langage de haut niveau compilés à la volée Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 4
  • 5. différence entre compilateur et interprète un compilateur traduit un programme P en un programme Q tel que pour toute entrée x, la sortie de Q(x) soit la même que celle de P(x) ∀P ∃Q ∀x... un interprète est un programme qui, étant donné un programme P et une entrée x, calcule la sortie s de P(x) ∀P ∀x ∃s... Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 5
  • 6. différence entre compilateur et interprète dit autrement, le compilateur fait un travail complexe une seule fois, pour produire un code fonctionnant pour n’importe quelle entrée l’interprète effectue un travail plus simple, mais le refait sur chaque entrée autre différence : le code compilé est généralement bien plus efficace que le code interprété Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 6
  • 7. exemple de compilation et d’interprétation source lilypond fichier PostScript gs image << chords { c2 c f2 c } new Staff relative c’ { time 2/4 c4 c g’4 g a4 a g2 } new Lyrics lyricmode { twin4 kle twin kle lit tle star2 >> kle twin C C twin kle 4 2 lit F star C tle Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 7
  • 8. qualité d’un compilateur à quoi juge-t-on la qualité d’un compilateur ? à sa correction à l’efficacité du code qu’il produit à sa propre efficacité ”Optimizing compilers are so difficult to get right that we dare say that no optimizing compiler is completely error-free ! Thus, the most important objective in writing a compiler is that it is correct.” (Dragon Book, 2006) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 8
  • 9. phases d’un compilateur typiquement, le travail d’un compilateur se compose d’une phase d’analyse reconnaı̂t le programme à traduire et sa signification signale les erreurs et peut donc échouer (erreurs de syntaxe, de portée, de typage, etc.) puis d’une phase de synthèse production du langage cible utilise de nombreux langages intermédiaires n’échoue pas Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 9
  • 10. phase d’analyse source ↓ analyse lexicale ↓ suite de lexèmes (tokens) ↓ analyse syntaxique ↓ arbre de syntaxe abstraite (AST) ↓ analyse sémantique ↓ syntaxe abstraite + table des symboles Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 10
  • 11. phase de synthèse syntaxe abstraite ↓ production de code (nombreuses phases) ↓ langage assembleur ↓ assembleur (as) ↓ langage machine ↓ éditeur de liens (ld) ↓ code exécutable Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 11
  • 12. aujourd’hui assembleur Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 12
  • 13. un peu d’arithmétique des ordinateurs un entier est représenté par n bits, conventionnellement numérotés de droite à gauche bn−1 bn−2 . . . b1 b0 typiquement, n vaut 8, 16, 32, ou 64 les bits bn−1, bn−2, etc. sont dits de poids fort les bits b0, b1, etc. sont dits de poids faible Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 13
  • 14. entier non signé bits = bn−1bn−2 . . . b1b0 valeur = n−1 X i=0 bi 2i bits valeur 000. . .000 0 000. . .001 1 000. . .010 2 . . . . . . 111. . .110 2n − 2 111. . .111 2n − 1 exemple : 001010102 = 42 Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 14
  • 15. entier signé : complément à deux le bit de poids fort bn−1 est le bit de signe bits = bn−1bn−2 . . . b1b0 valeur = −bn−12n−1 + n−2 X i=0 bi 2i exemple : 110101102 = −42 bits valeur 100. . .000 −2n−1 100. . .001 −2n−1 + 1 . . . . . . 111. . .110 −2 111. . .111 −1 000. . .000 0 000. . .001 1 000. . .010 2 . . . . . . 011. . .110 2n−1 − 2 011. . .111 2n−1 − 1 Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 15
  • 16. attention selon le contexte, on interprète ou non le bit bn−1 comme un bit de signe exemple : 110101102 = −42 (8 bits signés) 110101102 = 214 (8 bits non signés) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 16
  • 17. opérations la machine fournit des opérations bit à bit (AND, OR, XOR, NOT) de décalage logique à gauche (insère des 0 de poids faible) ← bn−3 . . . b1 b0 0 0 ← logique à droite (insère des 0 de poids fort) → 0 0 bn−1 . . . b3 b2 → arithmétique à droite (réplique le bit de signe) → bn−1 bn−1 bn−1 . . . b3 b2 → arithmétiques (addition, soustraction, multiplication, etc.) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 17
  • 18. un peu d’architecture très schématiquement, un ordinateur est composé d’une unité de calcul (CPU), contenant un petit nombre de registres entiers ou flottants des capacités de calcul d’une mémoire vive (RAM) composée d’un très grand nombre d’octets (8 bits) par exemple, 1 Go = 230 octets = 233 bits, soit 2233 états possibles contient des données et des instructions Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 18
  • 19. un peu d’architecture CPU $pc 0000052 $a0 0000012 $a1 0000040 $a2 0000022 $a3 0000000 $v0 0000000 ... RAM l’accès à la mémoire coûte cher (à un milliard d’instructions par seconde, la lumière ne parcourt que 30 centimètres entre 2 instructions !) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 19
  • 20. un peu d’architecture la réalité est bien plus complexe plusieurs (co)processeurs, dont certains dédiés aux flottants un ou plusieurs caches une virtualisation de la mémoire (MMU) etc. Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 20
  • 21. principe d’exécution schématiquement, l’exécution d’un programme se déroule ainsi un registre ($pc) contient l’adresse de l’instruction à exécuter on lit les 4 (ou 8) octets à cette adresse (fetch) on interprète ces bits comme une instruction (decode) on exécute l’instruction (execute) on modifie le registre $pc pour passer à l’instruction suivante (typiquement celle se trouvant juste après, sauf en cas de saut) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 21
  • 22. principe d’exécution CPU $pc 0000052 $a0 0000012 $a1 0000040 $a2 0000022 $a3 0000000 $v0 0000000 ... RAM instruction : 001000 00110 00101 0000000000001010 décodage : addi $a2 $a1 10 i.e. ajouter 10 au registre $a2 et stocker le résultat dans le registre $a1 Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 22
  • 23. principe d’exécution là encore la réalité est bien plus complexe pipelines plusieurs instructions sont exécutées en parallèle prédiction de branchement pour optimiser le pipeline, on tente de prédire les sauts conditionnels Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 23
  • 24. quelle architecture pour ce cours ? deux grandes familles de microprocesseurs CISC (Complex Instruction Set) beaucoup d’instructions beaucoup de modes d’adressage beaucoup d’instructions lisent / écrivent en mémoire peu de registres exemples : VAX, PDP-11, Motorola 68xxx, Intel x86 RISC (Reduced Instruction Set) peu d’instructions, régulières très peu d’instructions lisent / écrivent en mémoire beaucoup de registres, uniformes exemples : Alpha, Sparc, MIPS, ARM on choisit MIPS pour ce cours (les TD et le projet) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 24
  • 25. l’architecture MIPS Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 25
  • 26. l’architecture MIPS 32 registres, $0 à $31 $0 contient toujours 0 utilisables sous d’autres noms, correspondant à des conventions (zero, at, v0–v1, a0–a3, t0–t9, s0–s7, k0–k1, gp, sp, fp, ra) trois types d’instructions instructions de transfert, entre registres et mémoire instructions de calcul instructions de saut (documentation sur le site du cours) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 26
  • 27. assembleur MIPS on ne programme pas en langage machine mais en assembleur l’assembleur fourni un certain nombre de facilités : étiquettes symboliques allocation de données globales pseudo-instructions le langage assembleur est transformé en langage machine par un programme appelé également assembleur (c’est un compilateur) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 27
  • 28. assembleur MIPS la directive .text indique que des instructions suivent, et la directive .data indique que des données suivent le code sera chargé à partir de l’adresse 0x400000 et les données à partir de l’adresse 0x10000000 . . . données code (réservé) 7FFFFFFC16→ 1000000016→ 40000016→ Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 28
  • 29. exemple : hello world .text main: li $v0, 4 # code de print_string la $a0, hw # adresse de la cha^ ıne syscall # appel système li $v0, 10 # exit syscall .data hw: .asciiz hello worldn (.asciiz est une facilité pour .byte 104, 101, ... 0) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 29
  • 30. simulateurs MIPS en pratique, on utilisera un simulateur MIPS, MARS (ou SPIM) en ligne de commande java -jar Mars 4 2.jar file.s en mode graphique et interactif java -jar Mars 4 2.jar charger le fichier et l’assembler mode pas à pas, visualisation des registres, de la mémoire, etc. (documentation sur le site du cours) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 30
  • 31. jeu d’instructions : constantes, adresses et copies chargement d’une constante dans un registre li $a0, 42 # a0 - 42 li $a0, -65536 # a0 - -65536 chargement de l’adresse d’une étiquette dans un registre la $a0, label copie d’un registre dans un autre move $a0, $a1 # copie a1 dans a0 ! Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 31
  • 32. jeu d’instructions : arithmétique addition de deux registres add $a0, $a1, $a2 # a0 - a1 + a2 add $a2, $a2, $t5 # a2 - a2 + t5 de même, sub, mul, div addition d’un registre et d’une constante addi $a0, $a1, 42 # a0 - a1 + 42 (mais pas subi, muli ou divi !) négation neg $a0, $a1 # a0 - -a1 valeur absolue abs $a0, $a1 # a0 - |a1| Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 32
  • 33. jeu d’instructions : opérations sur les bits NON logique (not(1001112) = 0110002) not $a0, $a1 # a0 - not(a1) ET logique (and(1001112, 1010012) = 1000012) and $a0, $a1, $a2 # a0 - and(a1, a2) andi $a0, $a1, 0x3f # a0 - and(a1, 0...0111111) OU logique (or(1001112, 1010012) = 1011112) or $a0, $a1, $a2 # a0 - or(a1, a2) ori $a0, $a1, 42 # a0 - or(a1, 0...0101010) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 33
  • 34. jeu d’instructions : décalages décalage à gauche (insertion de zéros) sll $a0, $a1, 2 # a0 - a1 * 4 sllv $a1, $a2, $a3 # a1 - a2 * 2^a3 décalage à droite arithmétique (copie du bit de signe) sra $a0, $a1, 2 # a0 - a1 / 4 décalage à droite logique (insertion de zéros) srl $a0, $a1, 2 rotation rol $a0, $a1, 2 ror $a0, $a1, 3 Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 34
  • 35. jeu d’instructions : tests comparaison de deux registres slt $a0, $a1, $a2 # a0 - 1 si a1 a2 # 0 sinon ou d’un registre et d’une constante slti $a0, $a1, 42 variantes : sltu (comparaison non signée), sltiu de même : sle, sleu / sgt, sgtu / sge, sgeu égalité : seq, sne Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 35
  • 36. jeu d’instructions : transfert (lecture) lire un mot (32 bits) en mémoire lw $a0, 42($a1) # a0 - mem[a1 + 42] l’adresse est donnée par un registre et un décalage sur 16 bits signés variantes pour lire 8 ou 16 bits, signés ou non (lb, lh, lbu, lhu) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 36
  • 37. jeu d’instructions : transfert (écriture) écrire un mot (32 bits) en mémoire sw $a0, 42($a1) # mem[a1 + 42] - a0 # attention au sens ! l’adresse est donnée par un registre et un décalage sur 16 bits signés variantes pour écrire 8 ou 16 bits (sb, sh) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 37
  • 38. jeu d’instructions : branchements et sauts on distingue branchement : typiquement un saut conditionnel, dont le déplacement est stocké sur 16 bits signés (-32768 à 32767 instructions) saut : saut inconditionnel, dont l’adresse de destination est stockée sur 26 bits Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 38
  • 39. jeu d’instructions : branchements branchement conditionnel beq $a0, $a1, label # si a0 = a1 saute à label # ne fait rien sinon variantes : bne, blt, ble, bgt, bge (et comparaisons non signées) variantes : beqz, bnez, bgez, bgtz, bltz, blez Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 39
  • 40. jeu d’instructions : sauts saut inconditionnel à une adresse (jump) j label avec sauvegarde de l’adresse de l’instruction suivante dans $ra jal label # jump and link à une adresse contenue dans un registre jr $a0 avec l’adresse contenue dans $a0 et sauvegarde dans $a1 jalr $a0, $a1 Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 40
  • 41. jeu d’instructions : appel système quelques appels système fournis par une instruction spéciale syscall le code de l’instruction doit être dans $v0, les arguments dans $a0–$a3 ; le résultat éventuel sera placé dans $v0 exemple : appel système print int pour afficher un entier li $v0, 1 # code de print_int li $a0, 42 # valeur à afficher syscall de même read int, print string, etc. (voir la documentation) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 41
  • 42. le défi de la compilation c’est de traduire un programme d’un langage de haut niveau vers ce jeu d’instructions en particulier, il faut traduire les structures de contrôle (tests, boucles, exceptions, etc.) traduire les appels de fonctions traduire les structures de données complexes (tableaux, enregistrements, objets, clôtures, etc.) allouer de la mémoire dynamiquement Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 42
  • 43. appels de fonctions constat : les appels de fonctions peuvent être arbitrairement imbriqués ⇒ les registres ne peuvent suffire pour les paramètres / variables locales ⇒ il faut allouer de la mémoire pour cela les fonctions procèdent selon un mode last-in first-out, c’est-à-dire de pile Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 43
  • 44. la pile pile ↓ ↑ données dynamiques (tas) données statiques code la pile est stockée tout en haut, et croı̂t dans le sens des adresses décroissantes ; $sp pointe sur le sommet de la pile les données dynamiques (survivant aux appels de fonctions) sont allouées sur le tas (éventuellement par un GC), en bas de la zone de données, juste au dessus des données statiques ainsi, on ne se marche pas sur les pieds Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 44
  • 45. appel de fonction lorsqu’une fonction f (l’appelant ou caller) souhaite appeler une fonction g (l’appelé ou callee), elle exécute jal g et lorsque l’appelé en a terminé, il lui rend le contrôle avec jr $ra problème : si g appelle elle-même une fonction, $ra sera écrasé de même, tout registre utilisé par g sera perdu pour f il existe de multiples manières de s’en sortir, mais en général on s’accorde sur des conventions d’appel Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 45
  • 46. conventions d’appel utilisation des registres $at, $k0 et $k1 sont réservés à l’assembleur et l’OS $a0–$a3 sont utilisés pour passer les quatre premiers arguments (les autres sont passés sur la pile) et $v0–$v1 pour renvoyer le résultat $t0–$t9 sont des registres caller-saved i.e. l’appelant doit les sauvegarder si besoin ; on y met donc typiquement des données qui n’ont pas besoin de survivre aux appels $s0–$s7 sont des registres callee-saved i.e. l’appelé doit les sauvegarder ; on y met donc des données de durée de vie longue, ayant besoin de survivre aux appels $sp est le pointeur de pile, $fp le pointeur de frame $ra contient l’adresse de retour $gp pointe au milieu de la zone de données statiques (1000800016) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 46
  • 47. l’appel, en quatre temps il y a quatre temps dans un appel de fonction 1 pour l’appelant, juste avant l’appel 2 pour l’appelé, au début de l’appel 3 pour l’appelé, à la fin de l’appel 4 pour l’appelant, juste après l’appel s’organisent autour d’un segment situé au sommet de la pile appelé le tableau d’activation, en anglais stack frame, situé entre $fp et $sp Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 47
  • 48. l’appelant, juste avant l’appel 1 passe les arguments dans $a0–$a3, les autres sur la pile s’il y en a plus de 4 2 sauvegarde les registres $t0–$t9 qu’il compte utiliser après l’appel (dans son propre tableau d’activation) 3 exécute jal appelé Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 48
  • 49. l’appelé, au début de l’appel 1 alloue son tableau d’activation, par exemple addi $sp, $sp, -28 2 sauvegarde $fp puis le positionne, par exemple sw $fp, 24($sp) addi $fp, $sp, 24 3 sauvegarde $s0–$s7 et $ra si besoin ... argument 5 argument 6 registres sauvés variables locales ↓ $fp→ $sp→ $fp permet d’atteindre facilement les arguments et variables locales, avec un décalage fixe quel que soit l’état de la pile Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 49
  • 50. l’appelé, à la fin de l’appel 1 place le résultat dans $v0 (voire $v1) 2 restaure les registres sauvegardés 3 dépile son tableau d’activation, par exemple addi $sp, $sp, 28 4 exécute jr $ra Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 50
  • 51. l’appelant, juste après l’appel 1 dépile les éventuels arguments 5, 6, ... 2 restaure les registres caller-saved Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 51
  • 52. exercice 1 exercice : programmer la fonction suivante isqrt(n) ≡ c ← 0 s ← 1 while s ≤ n c ← c + 1 s ← s + 2c + 1 return c afficher la valeur de isqrt(17) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 52
  • 53. exercice 2 exercice : programmer la fonction factorielle avec une boucle avec une fonction récursive Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 53
  • 54. récapitulation une machine fournit un jeu limité d’instructions, très primitives des registres efficaces, un accès coûteux à la mémoire la mémoire est découpée en code / données statiques / tas (données dynamiques) / pile les appels de fonctions s’articulent autour d’une notion de tableau d’activation de conventions d’appel Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 54
  • 55. un exemple de compilation t(a,b,c){int d=0,e=a~b~c,f=1;if(a) for(f=0;d=(e-=d)-e;f+=t(a-d,(b+d)*2, (c+d)/2));return f;}main(q){scanf(%d, q);printf(%dn,t(~(~0q),0,0));} Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 55
  • 56. clarification int t(int a, int b, int c) { int d=0, e=a~b~c, f=1; if (a) for (f=0; d=(e-=d)-e; f+=t(a-d, (b+d)*2, (c+d)/2)); return f; } int main() { int q; scanf(%d, q); printf(%dn, t(~(~0q), 0, 0)); } Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 56
  • 57. clarification (suite) int t(int a, int b, int c) { int f=1; if (a) { int d, e=a~b~c; f = 0; while (d=e-e) { f += t(a-d, (b+d)*2, (c+d)/2); e -= d; } } return f; } int main() { int q; scanf(%d, q); printf(%dn, t(~(~0q), 0, 0)); } ce programme calcule le nombre de solutions du problème dit des n reines q q q q q q q q Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 57
  • 58. comment ça marche ? recherche par force brute (backtracking) entiers utilisés comme des ensembles : par ex. 13 = 0 · · · 011012 = {0, 2, 3} entiers ensembles 0 ∅ ab a ∩ b a+b a ∪ b, quand a ∩ b = ∅ a-b a b, quand b ⊆ a ~a ∁a a-a min(a), quand a 6= ∅ ~(~0n) {0, 1, . . . , n − 1} a*2 {i + 1 | i ∈ a}, noté S(a) a/2 {i − 1 | i ∈ a ∧ i 6= 0}, noté P(a) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 58
  • 59. justification de a-a en complément à deux : -a = ~a+1 a = bn−1bn−2 . . . bk10 . . . 0 ~a = bn−1bn−2 . . . bk01 . . . 1 -a = bn−1bn−2 . . . bk10 . . . 0 a-a = 0 0 . . . 010 . . . 0 exemple : a = 00001100 = 12 -a = 11110100 = −128 + 116 a-a = 00000100 Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 59
  • 60. clarification : version ensembliste int t(a, b, c) f ← 1 if a 6= ∅ e ← (ab)c f ← 0 while e 6= ∅ d ← min(e) f ← f + t(a{d}, S(b ∪ {d}), P(c ∪ {d})) e ← e{d} return f int queens(n) return t({0, 1, . . . , n − 1}, ∅, ∅) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 60
  • 61. signification de a, b et c ? ? ? ? q ? q ? ? q ? q q q q q q q q Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 61
  • 62. intérêt de ce programme pour la compilation int t(int a, int b, int c) { int f=1; if (a) { int d, e=a~b~c; f = 0; while (d=e-e) { f += t(a-d,(b+d)*2,(c+d)/2); e -= d; } } return f; } int main() { int q; scanf(%d, q); printf(%dn, t(~(~0q), 0, 0)); } court, mais contient un test (if) une boucle (while) une fonction récursive quelques calculs c’est aussi une excellente solution au problème des n reines Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 62
  • 63. compilation commençons par la fonction récursive t ; il faut allouer les registres compiler le test la boucle l’appel récursif les différents calculs Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 63
  • 64. allocation de registres a, b et c sont passés dans $a0, $a1 et $a2 le résultat est renvoyé dans $v0 les paramètres a, b, c, tout comme les variables locales d, e, f, ont besoin d’être sauvegardés, car ils sont utilisés après l’appel récursif ⇒ on va utiliser des registres callee-save a $s0 b $s1 c $s2 d $s3 e $s4 f $s5 il faut donc allouer 7 mots sur la pile pour sauvegarder l’adresse de retour $ra et ces 6 registres Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 64
  • 65. sauvegarde / restauration des registres t: addi $sp, $sp, -28 # allocation de 7 mots sw $ra, 24($sp) # sauvegarde des registres sw $s0, 20($sp) sw $s1, 16($sp) sw $s2, 12($sp) sw $s3, 8($sp) sw $s4, 4($sp) sw $s5, 0($sp) ... lw $ra, 24($sp) # restauration des registres lw $s0, 20($sp) lw $s1, 16($sp) lw $s2, 12($sp) lw $s3, 8($sp) lw $s4, 4($sp) lw $s5, 0($sp) addi $sp, $sp, 28 # désallocation jr $ra Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 65
  • 66. compilation du test int t(int a, int b, int c) { int f=1; if (a) { ... } return f; } li $s5, 1 beqz $a0, t return ... t return: move $v0, $s5 Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 66
  • 67. cas général (a 6= 0) if (a) { int d, e=a~b~c; f = 0; while ... } move $s0, $a0 # sauvegarde move $s1, $a1 move $s2, $a2 move $s4, $s0 # e=a~b~c not $t0, $s1 and $s4, $s4, $t0 not $t0, $s2 and $s4, $s4, $t0 li $s5, 0 # f = 0 noter l’utilisation d’un registre temporaire $t0 non sauvegardé Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 67
  • 68. compilation de la boucle while (test) { body } ... L1: ... calcul de test dans $t0 ... beqz $t0, L2 ... body ... j L1 L2: ... Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 68
  • 69. compilation de la boucle il existe cependant une meilleure solution while (test) { body } ... j L2 L1: ... body ... L2: ... test ... bnez $t0, L1 ainsi on fait seulement un seul branchement par tour de boucle (mis à part la toute première fois) Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 69
  • 70. compilation de la boucle while (d=e-e) { f += t(a-d, (b+d)*2, (c+d)/2); e -= d; } j test body: sub $a0, $s0, $s3 # a-d add $a1, $s1, $s3 # (b+d)*2 sll $a1, $a1, 1 add $a2, $s2, $s3 # (c+d)/2 srl $a2, $a2, 1 jal t add $s5, $s5, $v0 sub $s4, $s4, $s3 # e -= d test: neg $t0, $s4 # d=e-e and $s3, $s4, $t0 bnez $s3, body t return: ... Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 70
  • 71. programme principal int main() { int q; scanf(%d, q); printf(%dn, t(~(~0q), 0, 0)); } main: li $v0, 5 # read_int syscall li $a0, 0 # t(...) not $a0, $a0 sllv $a0, $a0, $v0 not $a0, $a0 li $a1, 0 li $a2, 0 jal t move $a0, $v0 # printf li $v0, 1 syscall li $v0, 4 la $a0, newline syscall li $v0, 10 # exit syscall Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 71
  • 72. optimisation ce code n’est pas optimal par exemple, dans le cas a = 0, on sauve/restaure inutilement les registres (y compris $ra), alors qu’on pourrait se contenter de li $v0, 1 jr $ra Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 72
  • 73. un peu d’assembleur x86-64 Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 73
  • 74. exemple : hello world .globl start # point d’entrée pour ld .text start: # sys_write(stdout, message, length) mov $1, %rax # sys_write mov $1, %rdi # 1 = sortie standard mov $message, %rsi # adresse de la cha^ ıne mov $length, %rdx # longueur de la cha^ ıne syscall # sys_exit(return_code) mov $60, %rax # sys_exit mov $0, %rdi # code de retour 0 = succès syscall .data message: .ascii Hello, world!n .set length, . - message # . = adresse courante Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 74
  • 75. exécution assemblage as hello.s -o hello.o édition de liens ld hello.o -o hello exécution ./hello Hello, world! Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 75
  • 76. avec gcc et la libc .text .globl main main: movq $message, %rdi # premier argument dans %rdi call puts movq $0, %rax # return 0 ret .data message: .string Hello, world! gcc -o hello hello.s Hello, world! Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 76
  • 77. différences avec MIPS 16 registres 64 bits (%rax, %rbx, %rcx, %rdx, %rsi, %rdi, %rbp, %rsp, %r8, %r9, %r10, %r11, %r12, %r13, %r14, %r15) jeu d’instructions beaucoup plus large (CISC) call empile l’adresse de retour, ret la dépile syntaxe assembleur GNU à la ATT : instruction source, destination Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 77
  • 78. gdb une exécution pas à pas est possible avec gdb (the GNU debugger) gcc -g hw.s -o hw gdb hw GNU gdb (GDB) 7.1-ubuntu ... (gdb) break main Breakpoint 1 at 0x400524: file hw.s, line 4. (gdb) run Starting program: .../hw Breakpoint 1, main () at hw.s:4 4 movq $message, %rdi (gdb) step 5 call puts (gdb) info registers ... Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 78
  • 79. pour en savoir plus lire Computer Systems : A Programmer’s Perspective (R. E. Bryant, D. R. O’Hallaron) son supplément PDF x86-64 Machine-Level Programming Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 79
  • 80. leçon produire du code assembleur efficace n’est pas chose aisée (observer le code produit avec gcc -S -fverbose-asm ou encore ocamlopt -S) maintenant il va falloir automatiser tout ce processus Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 80
  • 81. la suite TD demain petits exercices d’assembleur MIPS génération de code pour un mini-langage d’expressions arithmétiques Cours jeudi prochain syntaxe abstraite sémantique interprètes Jean-Christophe Filliâtre Langages de programmation et compilation 2013–2014 / cours 2 81