Manuscrit de thèse comprenant 3 projets :
- recherche de mutations conductrices de l'adénocarcinome du rein à cellules claires (ccRCC) dans l'ADN non-codant par l'utilisation de données de ChIP-seq, d'ATAC-seq, de RNA-seq et de séquençage pangénomique
- analyse des altérations moléculaires de la voie FGF/FGFR dans le ccRCC par analyse de données RNA-seq, 450K (méthylation) et séquençage pangénomique
- mise au point d'un test de détection du ccRCC basé sur la méthylation de l'ADN circulant.
Thèse : "Génétique et épigénétique de l'adénocarcinome du rein à cellules claires"
1.
UNIVERSITÉ
EVRY
VAL
D’ESSONNE
Des
génomes
aux
organismes
Laboratoire
d’Epigénétique
et
Environnement
–
CNG
–
CEA
THÈSE
présentée
et
soutenue
publiquement
le
09
avril
2015
pour
l’obtention
du
grade
de
Docteur
de
l’Université
d’Evry
Val
d’Essonne
Discipline
ou
Spécialité
:
Génétique
et
épigénétique
par
:
Aurélie
BOUSARD
Étude
génétique
et
épigénétique
de
l’adénocarcinome
du
rein
à
cellules
claires
COMPOSITION DU JURY
Président : Monsieur PAGÈS Gilles
Rapporteur : Madame ARIMONDO Paola
Rapporteur : Monsieur DEFOSSEZ Pierre-Antoine
Examinateur : Monsieur MIOTTO Benoit
Directeur de thèse : Madame BIHOREAU Marie-Thérèse
Co-directeur de thèse : Monsieur TOST Jorg
Co-directeur de thèse : Madame LEPAGNOL-BESTEL Aude-Marie
2.
3.
4.
-‐
1
-‐
Remerciements
A
l’issue
de
la
rédaction
de
ce
manuscrit,
je
suis
convaincue
que
la
thèse
n’est
pas
un
travail
aussi
solitaire
qu’il
n’y
paraît.
En
effet,
de
nombreuses
personnes
ont
contribué
par
leurs
conseils
scientifiques,
leurs
aides
techniques
ou
encore
par
leur
support
moral
à
l’aboutissement
de
ce
travail.
Je
tiens
donc
à
adresser
mes
remerciements…
A
mes
directeurs
de
thèse
:
Jorg,
Aude-‐Marie
et
Marie-‐Thérèse.
A
Jorg
plus
particulièrement
pour
m’avoir
permis
d’effectuer
ma
thèse
au
sein
du
Laboratoire
Épigénétique
et
Environnement
et
pour
m’avoir
accordé
sa
confiance
dans
la
gestion
de
ce
projet,
en
me
laissant
une
grande
liberté
d’action
tout
en
gardant
un
œil
bienveillant
sur
l’avancée
de
mes
travaux.
A
Aude-‐Marie
pour
sa
disponibilité,
son
accueil
lors
de
mon
passage
au
CPN
et
sa
contribution
dans
la
relecture
de
ce
manuscrit.
Aux
membres
du
jury
qui
ont
accepté
de
lire
ce
manuscrit
et
d’y
apporter
leur
jugement
:
à
Paola
Arimondo
et
à
Pierre-‐Antoine
Defossez
en
tant
que
rapporteurs,
à
Gilles
Pagès
et
Benoît
Miotto
en
tant
qu’examinateurs.
A
Jean-‐François,
d’avoir
accepté
de
financer
les
six
derniers
mois
de
cette
thèse,
qui
ont
représenté
un
délai
précieux
pour
finaliser
au
mieux
mes
projets,
et
d’avoir
insufflé
une
nouvelle
dynamique
scientifique
et
relationnelle
au
CNG.
A
l’équipe
du
laboratoire
Épigénétique
et
Environnement,
qui
s’est
agrandie
et
enrichie
depuis
mon
arrivée
de
personnes
aux
compétences,
cultures
et
caractères
diversifiés
et
avec
qui
il
a
été
très
agréable
de
travailler.
A
Christian
pour
avoir
apporté
sa
grande
expérience
technique
au
profit
de
mes
projets
mais
aussi
pour
avoir
partagé
de
nombreux
moments
de
réflexion
mais
aussi
d’avoir
su
garder
secrètes
certaines
de
mes
«
boulettes
»
de
manip
pour
m’éviter
d’être
la
risée
du
CNG.
A
Fabien
pour
son
apport
déterminant
dans
les
analyses
bio-‐informatiques,
sans
lequel
mes
données
seraient
peut-‐être
encore
occupées
en
train
de
charger
sur
Galaxy,
pour
sa
patience
face
à
mes
multiples
requêtes
et
pour
m’avoir
initiée
au
monde
de
la
bioinformatique.
A
Florence
(alias
Bubu),
qui
m’a
chaleureusement
accueillie
au
sein
de
l’équipe,
qui
n’a
cessé
de
m’encourager
à
grand
renfort
de
chocolats
et
sur
qui
j’ai
pu
toujours
compter
depuis
mon
arrivée.
A
Sylvain
avec
qui
j’ai
partagé
de
nombreuses
discussions
scientifiques
(ou
pas…),
qui
a
activement
participé
à
ma
veille
scientifique
et
qui
m’a
apporté
de
nombreux
encouragements
dans
la
dernière
ligne
droite.
A
Shu-‐Fang
de
s’être
constamment
inquiétée
de
l’évolution
de
mon
moral
;
son
sens
de
l’écoute
m’a
été
salutaire.
A
toutes
les
personnes
qui
ont
passé
du
temps
sur
la
correction
de
ce
manuscrit,
notamment
Sylvain,
Florence
M,
Florence
B
et
Christian.
A
toutes
les
autres
personnes
du
laboratoire
:
Céline
pour
son
énergie
communicative,
Olexy,
à
Chao
et
Yimin
pour
leurs
sourires
permanents,
Kevin
pour
son
humour
décalé,
Anne
pour
avoir
partagé
l’écriture
de
la
revue
avec
moi,
Nico,
Gitte
et
Andreas
pour
leur
grande
gentillesse.
5.
-‐
2
-‐
Aux
personnes
extérieures
à
l’équipe
qui
ont
contribué
au
bon
déroulement
de
cette
thèse.
A
Sophie
pour
le
partage
de
réflexions
sur
les
aspects
chromatiniens
et
l’apport
de
son
regard
critique
sur
certaines
parties
de
ce
manuscrit.
A
Anne
et
à
l’équipe
de
la
banque
pour
avoir
si
gentiment
préparé
mes
échantillons
et
accepté
ma
présence
dans
leur
salle
de
culture
cellulaire.
A
Marie-‐Thérèse
et
à
l’équipe
de
séquençage
pour
la
prise
en
charge
de
mes
échantillons.
A
l’équipe
de
bio-‐informatique
d’avoir
été
de
bon
conseil.
A
notre
petit
groupe
de
filles
avec
qui
j’ai
partagé
d’agréables
pauses
de
déjeuner.
A
toutes
les
autres
personnes
du
CNG
qui
contribuent
à
la
bonne
ambiance
générale.
Aux
personnes
extérieures
au
CNG
avec
qui
j’ai
collaboré.
A
Alex
d’avoir
apporté
son
expérience
sur
certains
aspects
de
mes
projets.
A
Victor
et
Louis
de
m’avoir
aidée
à
percer
les
mystères
de
la
bio-‐
informatique.
Au
Consortium
Cagekid
pour
la
mise
à
disposition
de
leurs
nombreuses
données.
Aux
gens
qui
m’entourent
et
qui
participent
grandement
à
mon
épanouissement
personnel.
A
mes
parents
de
m’avoir
laissé
une
grande
liberté
dans
mes
choix
de
vie
et
de
m’avoir
toujours
soutenue
dans
les
défis
que
je
me
lançais.
A
ma
sœur,
mon
frère
et
mes
amis
d’avoir
été
si
compréhensifs
face
à
mon
indisponibilité
croissante
durant
cette
thèse.
A
mon
mari
de
m’avoir
encouragée
à
suivre
mes
envies,
d’avoir
vécu
les
hauts
et
les
bas
avec
moi,
d’avoir
assuré
l’intendance
quotidienne
lors
de
ces
derniers
mois
et
de
m’avoir
soutenue
pendant
ces
trois
ans
et
demi.
6.
-‐
3
-‐
Résumé
Ce
travail
de
thèse
comporte
trois
projets
visant
à
approfondir
la
caractérisation
moléculaire
des
adénocarcinomes
du
rein
à
cellules
claires
(ccRCC)
et
à
en
améliorer
le
diagnostic
en
utilisant
les
données
génétiques
et
épigénétiques
du
consortium
Cagekid.
Le
premier
projet
traite
de
l’identification
de
mutations
oncogéniques
présentes
dans
les
éléments
régulateurs
actifs
du
génome
des
ccRCC.
L’utilisation
de
données
de
séquençage
pangénomique
d’une
centaine
de
patients
atteints
de
ccRCC
et
de
données
épigénétiques
(ChIP-‐seq
et
ATAC-‐seq)
issues
de
lignées
cellulaires
de
cancer
du
rein
a
permis
l’identification
d’îlots
de
mutations
situés
dans
ces
éléments
régulateurs.
Parmi
ces
derniers,
on
compte
de
nombreux
promoteurs
de
gènes
associés
à
des
cancers
urogénitaux.
De
plus,
l’utilisation
de
données
de
RNA-‐seq
a
permis
d’associer
certains
de
ces
îlots
à
des
changements
d’expression
génique.
Un
îlot
de
mutation
a
ainsi
pu
être
identifié
sur
un
élément
régulateur
actif
situé
dans
le
premier
intron
du
gène
WWC1
qui
appartient
à
la
voie
Hippo.
Cette
voie
est
connue
pour
être
impliquée
dans
l’oncogenèse,
ce
qui
renforce
l’intérêt
potentiel
des
mutations
de
cet
élément
régulateur
dans
le
ccRCC.
D’autres
îlots
de
mutations
ont
pu
être
identifiés
en
association
avec
l’expression
de
gènes
comme
IGF1R.
Ce
travail
novateur
dans
sa
démarche
d’intégration
de
données
génomiques
et
épigénétiques
constitue
la
première
étude
à
permettre
l’identification
de
mutations
non-‐codantes
localisées
sur
des
éléments
régulateurs
actifs
définis
dans
le
type
cellulaire
correspondant
à
la
pathologie
d’intérêt.
Le
deuxième
volet
de
ce
travail
consiste
en
une
étude
focalisée
sur
les
altérations
moléculaires
de
la
voie
FGF/FGFR
qui
est
la
cible
de
thérapies
en
cours
d’essais
cliniques
dans
le
ccRCC.
Il
a
permis
de
suggérer
une
implication
de
l’activation
de
la
voie
FGF/FGFR
dans
l’oncogenèse
du
ccRCC
et
dans
le
pronostic
vital
des
patients,
notamment
par
l’action
de
régulateurs
négatifs
de
cette
voie
tel
que
SEF.
Enfin,
la
troisième
partie
concerne
la
mise
au
point
d’un
test
de
diagnostic
non-‐invasif
du
ccRCC
à
partir
de
l’ADN
circulant.
Il
a
abouti
à
l’identification
de
biomarqueurs
hyperméthylés
et
au
développement
de
tests
sensibles
basés
sur
des
qPCR
spécifiques
de
la
méthylation.
Les
différentes
approches
abordées
s’inscrivent
dans
le
cadre
de
l’amélioration
de
la
caractérisation
moléculaire
des
tumeurs
qui
a
été
rendue
possible
par
l’avènement
des
nouvelles
techniques
de
séquençage.
Les
promesses
en
termes
de
diagnostic
et
de
prise
en
charge
des
patients
sont
multiples
et
devraient
permettre
dans
un
avenir
proche
d’aller
vers
des
approches
thérapeutiques
plus
ciblées
et
le
développement
de
la
médecine
personnalisée.
Mots-‐clés
:
adénocarcinome
du
rein
à
cellules
claires,
éléments
régulateurs,
mutations
de
l’ADN
non-‐
codant,
FGF/FGFR,
ADN
circulant,
biomarqueurs.
7.
-‐
4
-‐
Abstract
This
thesis
is
composed
of
three
projects
looking
to
improve
molecular
characterization
and
diagnosis
of
clear
cell
renal
cell
carcinoma
(ccRCC).
To
achieve
this
goal,
genetic
and
epigenetic
data
from
the
CAGEKID
consortium
have
been
used.
The
first
project
concern
the
identification
of
oncogenic
mutations
located
on
active
regulatory
elements
of
ccRCC.
The
use
of
whole-‐genome
sequencing
data
of
an
hundred
patients
affected
by
ccRCC
and
epigenetic
data
(ChIP-‐seq
and
ATAC-‐seq)
from
renal
cancer
cell
lines
enabled
the
identification
of
mutation
islands
located
in
these
active
regulatory
elements.
Among
those,
numerous
mutated
promoters
were
known
to
be
involved
in
urogenital
cancers.
Moreover,
the
use
of
RNA-‐seq
data
highlighted
the
association
between
some
mutation
islands
and
gene
expression
changes.
One
mutation
island
has
been
identified
on
a
regulatory
element
located
in
the
first
intron
of
WWC1.
This
gene
is
a
member
of
the
Hippo
pathway
known
to
be
involved
in
ccRCC
tumorigenesis
making
the
potential
interest
of
those
mutations
reinforced.
Other
mutation
islands
have
been
identified
in
association
with
gene
expression,
such
as
IGF1R.
This
pioneer
work
in
integrating
approach
of
genetic
and
epigenetic
data
consists
in
the
first
study
that
describes
non-‐coding
mutations
located
on
active
regulatory
elements
identified
on
a
cell
type
relevant
to
the
study.
The
second
project
consists
of
a
study
of
the
molecular
alterations
of
the
FGF/FGFR
pathway,
that
is
currently
the
target
of
therapies
tested
on
clinical
assays
in
ccRCC.
It
suggests
an
involvement
of
the
FGF/FGFR
pathway
activation
in
ccRCC
tumorigenesis
and
in
patient
prognosis,
partly
through
the
expression
alterations
of
negative
regulators
of
this
pathway
such
as
SEF.
Finally,
the
set-‐up
of
a
ccRCC
non-‐invasive
diagnostic
test
from
circulating
DNA
has
been
initiated.
Hypermethylated
biomarkers
have
been
identified
and
sensible
tests
based
on
methylation-‐specific
qPCR
have
been
set
up
in
the
third
project.
Those
different
approaches
fall
into
the
improvement
of
tumor
molecular
characterization
that
has
been
allowed
through
the
progress
of
the
next-‐generation
sequencing
technologies.
The
promises
in
term
of
diagnosis
and
patient
management
are
multiple
and
should
allow
the
expansion
of
the
development
of
targeted
therapies
and
personalized
medicine
in
the
next
future.
Keywords:
clear
cell
renal
cell
adenocarcinoma,
regulatory
elements,
non-‐coding
mutations,
FGF/FGFR,
circulating
DNA,
biomarkers.
8.
-‐
5
-‐
Table
des
matières
Remerciements
...........................................................................................................................
1
Résumé
.......................................................................................................................................
3
Abstract
.......................................................................................................................................
4
Table
des
matières
......................................................................................................................
5
Liste
des
figures
...........................................................................................................................
7
Liste
des
tableaux
......................................................................................................................
11
Abréviations
et
acronymes
........................................................................................................
13
Introduction
..............................................................................................................................
17
Chapitre
I
:
Mise
en
contexte
des
projets
...................................................................................
19
1.
Organisation
de
la
chromatine
et
régulation
de
la
transcription
............................................................
20
2.
Les
cancers
:
caractéristiques
biologiques,
génétique,
épigénétique
.....................................................
40
3.
L’adénocarcinome
du
rein
à
cellules
claires
...........................................................................................
60
4.
Sujet
de
thèse
.........................................................................................................................................
71
Chapitre
II
:
Identification
de
mutations
dans
les
éléments
régulateurs
actifs
du
ccRCC
.............
73
1.
Objectif
...................................................................................................................................................
74
2.
Matériels
et
méthodes
............................................................................................................................
74
3.
Résultats
.................................................................................................................................................
95
4.
Discussion
.............................................................................................................................................
130
5.
Conclusions
et
perspectives
..................................................................................................................
149
Chapitre
III
:
Analyse
des
altérations
de
la
voie
FGF/FGFR
dans
le
ccRCC
..................................
151
1.
Objectif
.................................................................................................................................................
152
2.
Matériels
et
méthodes
..........................................................................................................................
152
3.
Résultats
...............................................................................................................................................
159
4.
Discussion
.............................................................................................................................................
171
5.
Conclusions
et
perspectives
..................................................................................................................
177
Chapitre
IV
:
Mise
au
point
d’un
test
de
détection
de
la
méthylation
de
l’ADN
circulant
de
patients
atteints
de
ccRCC
.......................................................................................................
179
1.
Objectif
.................................................................................................................................................
180
2.
Matériels
et
méthodes
..........................................................................................................................
180
3.
Résultats
...............................................................................................................................................
185
4.
Discussion
.............................................................................................................................................
193
5.
Conclusions
et
perspectives
..................................................................................................................
200
Conclusions
générales
.............................................................................................................
201
Bibliographie
...........................................................................................................................
203
Annexes
..................................................................................................................................
218
Communications
......................................................................................................................
234
10.
-‐
7
-‐
Liste
des
figures
Figure
1
:
De
l’ADN
aux
chromosomes.
...........................................................................................................
21
Figure
2
:
Euchromatine
et
hétérochromatine.
...............................................................................................
21
Figure
3
:
Organisation
de
la
chromatine
dans
le
noyau.
................................................................................
22
Figure
4
:
Territoires
chromosomiques
et
agencement
radial
dans
le
noyau.
................................................
23
Figure
5
:
Les
modèles
d’interactions
entre
territoires
chromosomiques.
.....................................................
23
Figure
6:
ADN
non-‐codant.
..............................................................................................................................
25
Figure
7
:
Les
promoteurs
et
les
enhancers,
acteurs
de
la
transcription
d’un
gène.
......................................
26
Figure
8
:
Méthylation
des
cytosines
et
reconnaissance
par
les
MBP
.............................................................
28
Figure
9
:
Oxydation
des
groupements
méthyles
par
les
enzymes
TET
et
déméthylation
de
l’ADN.
.............
29
Figure
10
:
Structure
d’un
nucléosome.
..........................................................................................................
30
Figure
11
:
Modifications
d’histones.
..............................................................................................................
31
Figure
12
:
États
chromatiniens
proposés
à
partir
de
modifications
d'histones
par
Ernst
el
al.
.....................
32
Figure
13
:
Modifications
d’histones
et
liaisons
aux
enzymes
de
remodelage
de
la
chromatine.
..................
33
Figure
14
:
Positionnement
des
nucléosomes.
...............................................................................................
35
Figure
15
:
Les
caractéristiques
d’un
cancer.
..................................................................................................
40
Figure
16
:
L'invasion
et
la
diffusion
métastatique.
........................................................................................
43
Figure
17
:
Les
mutations
conductrices.
..........................................................................................................
45
Figure
18
:
Gènes
les
plus
fréquemment
mutés
dans
différents
types
de
tumeurs.
......................................
46
Figure
19
:
Hétérogénéité
inter-‐
et
intra-‐tumorale.
........................................................................................
49
Figure
20
:
Identification
des
gènes
conducteurs
par
comparaison
du
taux
de
mutation
par
rapport
au
bruit
de
fond
mutationnel.
...............................................................................................................................
49
Figure
21
:
Éléments
de
recherche
de
mutations
non-‐codantes
conductrices
de
tumeurs.
...........................
51
Figure
22
:
Profils
de
méthylation
de
cellules
normales
et
tumorales.
...........................................................
52
Figure
23
:
Mutations
des
enzymes
épigénétiques
identifiées
dans
les
cancers.
...........................................
55
Figure
24
:
Schéma
de
l'ADN
circulant
issu
des
cellules
tumorales.
................................................................
56
Figure
25
:
L’ADN
circulant,
biomarqueur
clinique
de
suivi
des
tumeurs.
......................................................
58
Figure
26
:
Anatomie
du
rein
et
cellules
à
l’origine
des
carcinomes
des
cellules
rénales
(RCC).
....................
61
Figure
27
:
Coupes
histologiques
d'adénocarcinomes
du
rein
à
cellules
claires
et
papillaires.
......................
61
Figure
28
:
L’anatomie
du
rein.
.......................................................................................................................
63
Figure
29
:
Altérations
génétiques
et
épigénétiques
de
la
voie
VHL/HIF
dans
le
ccRCC.
................................
64
Figure
30
:
Modifications
génétiques
et
épigénétiques
des
enzymes
de
remodelage
de
la
chromatine
et
des
modificateurs
d’histones.
........................................................................................................................
65
Figure
31:
Cibles
des
traitements
utilisés
contre
l’adénocarcinome
du
rein
à
cellules
claires.
......................
68
Figure
32
:
Composition
des
récepteurs
à
facteur
de
croissance
des
fibroblastes
(FGFRs)
et
épissage
alternatif
IIIb/IIIc.
.....................................................................................................................................
69
Figure
33
:
Résumé
de
la
voie
signalétique
de
FGF/FGFR
et
des
facteurs
intra
et
extra
cellulaires
qui
la
régulent.
...................................................................................................................................................
70
Figure
34
:
Principe
et
étapes
de
contrôles
du
ChIP.
.......................................................................................
75
Figure
35
:
Les
modifications
post-‐traductionnelles
des
histones
démarquent
les
éléments
fonctionnels
du
génome.
...................................................................................................................................................
76
Figure
36
:
Principe
du
FAIRE
et
étapes
de
contrôle.
......................................................................................
80
Figure
37
:
Protocole
simplifié
et
étapes
de
contrôles
de
l'ATAC-‐seq.
............................................................
82
Figure
38
:
Principe
du
séquençage
Illumina/Solexa.
......................................................................................
85
Figure
39
:
Principe
de
l'identification
de
pics.
...............................................................................................
87
Figure
40:
Échantillons
Cagekid
dont
les
données
de
séquençage
et
d’expression
sont
disponibles.
............
89
Figure
41
:
Méthode
d’identification
des
éléments
régulateurs
actifs
consensus
et
des
îlots
de
mutations.
90
Figure
42
:
Modèles
de
recherche
de
mutations
entraînant
l'expression
différentielle
d'un
gène
associé.
..
91
Figure
43
:
Principe
du
pyroséquençage.
........................................................................................................
93
Figure
44
:
Visualisation
des
étapes
de
contrôle
du
ChIP-‐seq.
........................................................................
95
Figure
45
:
Répartition
des
reads
des
ChIP-‐seq
ciblant
les
modifications
d'histones
de
la
lignée
786-‐O.
......
96
11.
-‐
8
-‐
Figure
46
:
Profils
des
marques
d’histones
au
niveau
d’un
promoteur
actif
dans
la
lignée
786-‐O.
................
96
Figure
47
:
Comparaison
des
données
de
ChIP-‐seq
H3K27ac
des
échantillons
tumoral/non-‐tumoral
de
Cagekid
et
la
lignée
786-‐O.
......................................................................................................................
98
Figure
48
:
Comparaison
des
données
de
ChIP-‐seq
H3K27ac
des
deux
échantillos
du
NIH
et
de
la
lignée
786-‐
O.
..............................................................................................................................................................
98
Figure
49
:
Visualisation
des
profils
obtenus
au
Bioanalyzer
aux
étapes
de
contrôle
du
FAIRE-‐seq.
..............
99
Figure
50
:
Répartition
des
reads
de
FAIRE-‐seq
autour
des
TSS.
...................................................................
100
Figure
51
:
Profils
des
librairies
ATAC-‐seq
en
fonction
de
la
concentration
en
Igepal.
.................................
102
Figure
52
:
Exemple
de
profil
de
librairie
ATAC-‐seq
et
interprétation.
.........................................................
103
Figure
53
:
Nombre
de
reads
disponibles
après
chaque
étape
de
filtrage
des
données
des
différentes
lignées
cellulaires.
..............................................................................................................................................
104
Figure
54
:
Répartition
des
reads
autour
du
TSS
et
en
fonction
de
leurs
tailles.
..........................................
104
Figure
55:
Signal
ATAC-‐seq
au
niveau
du
promoteur
d’un
gène.
..................................................................
105
Figure
56
:
Reproductibilité
des
résultats
d’ATAC-‐seq.
.................................................................................
105
Figure
57
:
Recoupement
des
pics
identifiés
en
ChIP-‐seq
ciblant
H3K4me1,
H3Kme2
et
H3K4me3
dans
la
lignée
786-‐O.
..........................................................................................................................................
106
Figure
58
:
Identification
des
éléments
régulateurs
actifs
de
la
lignée
786-‐O.
.............................................
107
Figure
59
:
Identification
des
éléments
régulateurs
actifs
consensus
des
trois
lignées
cellulaires.
..............
108
Figure
60
:
Comparaison
des
co-‐localisations
de
marques
d’histones
sur
la
lignée
cellulaire
786-‐O
et
les
échantillons
Cagekid.
.............................................................................................................................
109
Figure
61
:
Analyse
critique
du
nombre
de
promoteurs
actifs
identifiés.
....................................................
109
Figure
62
:
Comparaison
entre
gènes
exprimés
et
promoteurs
actifs
identifiés
des
lignées
cellulaires.
......
110
Figure
63
:
Analyse
critique
des
promoteurs
actifs
identifiés.
......................................................................
110
Figure
64
:
Identification
des
éléments
régulateurs
actifs
consensus
à
partir
des
données
ChIP-‐seq
et
ATAC-‐
seq.
.........................................................................................................................................................
112
Figure
65
:
Signaux
ChIP-‐seq
et
îlots
de
mutations
présents
sur
les
promoteurs
de
WNT2B
et
USP28.
.......
116
Figure
66
:
Visualisation
des
signaux
de
ChIP-‐seq
et
de
l’îlot
de
mutation
dans
un
promoteur
alternatif
de
FGF1.
......................................................................................................................................................
116
Figure
67
:
Localisation
de
l’îlot
de
mutations
de
l’élément
régulateur
actif
dans
l’intron
d’IGF1R
et
association
avec
l’expression
d’IGF1R.
..................................................................................................
117
Figure
68
:
Localisation
de
l’îlot
de
mutations
de
l’élément
régulateur
actif
en
aval
de
TNFSF14
et
association
des
mutations
avec
l’expression
de
TNFSF14.
....................................................................
118
Figure
69
:
Répartition
des
mutations
localisées
dans
les
éléments
régulateurs
consensus
identifiés
par
ChIP-‐seq
et
ATAC-‐seq.
............................................................................................................................
119
Figure
70
:
Visualisation
de
la
localisation
de
l’îlot
de
mutations
de
l’élément
régulateur
actif
dans
l’intron
1
de
WWC1
et
association
des
mutations
avec
l’expression
de
WWC1.
..................................................
119
Figure
71
:
Validation
des
mutations
de
WWC1
par
pyroséquençage.
.........................................................
120
Figure
72
:
Résultats
de
la
validation
au
pyroséquençage
de
la
mutation
sur
l'élément
régulateur
actif
associé
à
TNFSF14.
.................................................................................................................................
121
Figure
73
:
Expression
RNA-‐seq
de
WWC1
en
fonction
des
variations
du
nombre
de
copies.
.....................
122
Figure
74
:
Expression
de
WWC1
dans
les
cohortes
Cagekid
et
TCGA.
.........................................................
123
Figure
75
:
Association
entre
expression
et
paramètres
cliniques
de
WWC1
dans
la
cohorte
TCGA.
..........
123
Figure
76
:
Expression
de
IGF1R
et
association
avec
les
paramètres
cliniques
dans
la
cohorte
TCGA.
........
124
Figure
77
:
Expression
de
TNFSF14
dans
les
cohortes
Cagekid
et
TCGA.
......................................................
125
Figure
78
:
Association
entre
expression
et
paramètres
cliniques
de
TNFSF14
dans
les
cohortes
TCGA
et
Cagekid.
..................................................................................................................................................
126
Figure
79
:
Signal
des
ChIP-‐seq
ciblant
H3K27ac
au
niveau
du
promoteur
de
TERT.
....................................
126
Figure
80
:
Expression
de
TERT
dans
les
cohortes
Cagekid
et
TCGA.
............................................................
128
Figure
81
:
Association
de
l'expression
de
TERT
et
des
paramètres
cliniques
dans
la
cohorte
TCGA.
..........
129
Figure
82
:
Clusterisation
des
données
de
méthylation
des
puces
450K
sur
les
échantillons
Cagekid
et
les
lignées
cellulaires
de
RCC.
......................................................................................................................
136
Figure
83
:
Comparaison
des
gènes
exprimés
par
les
lignées
cellulaires
de
RCC
et
les
échantillons
tumoraux
et
non-‐tumoraux.
...................................................................................................................................
137
12.
-‐
9
-‐
Figure
84
:
Clusterisation
des
données
d’expression
de
lignées
cellulaires
issues
de
divers
types
de
tumeurs.
...............................................................................................................................................................
137
Figure
85
:
Comparaison
du
bruit
de
fond
mutationnel
global
et
des
critères
de
recherche
d'îlots
de
mutations.
..............................................................................................................................................
141
Figure
86
:
Altérations
moléculaires
de
la
voie
Hippo
dans
le
ccRCC.
...........................................................
146
Figure
87
:
Expression
des
FGFRs
dans
les
échantillons
normaux
et
tumoraux.
...........................................
159
Figure
88
:
Changement
d’expression
relatif
dans
les
échantillons
pairés
des
cohortes
Cagekid
et
TCGA.
.
160
Figure
89
:
Isoformes
IIIb
et
IIIc
de
FGFR2
dans
les
échantillons
tumoraux
et
non-‐tumoraux
de
la
cohorte
Cagekid.
..................................................................................................................................................
161
Figure
90
:
Hyperméthylation
du
promoteur
de
FGFR2
dans
la
cohorte
Cagekid.
.......................................
161
Figure
91
:
Expression
des
FGFs
dans
les
cohortes
Cagekid
et
TCGA.
...........................................................
163
Figure
92
:
Confirmation
des
changements
d’expression
de
FGF1,
FGF5,
FGF7
et
FGF9
par
RT-‐qPCR.
........
163
Figure
93
:
Changement
d’expression
de
FGF2
dans
les
cohortes
Cagekid
et
TCGA.
...................................
164
Figure
94
:
Changement
d’expression
de
FGF5
et
association
avec
des
paramètres
cliniques
dans
la
cohorte
TCGA.
.....................................................................................................................................................
165
Figure
95
:
Changement
d’expression
RNA-‐seq
de
SEF
dans
les
cohortes
Cagekid
et
TCGA.
.......................
166
Figure
96
:
Confirmation
du
changement
d'expression
de
SEF
par
RT-‐qPCR.
...............................................
166
Figure
97
:
Association
de
l’expression
de
SEF
et
des
paramètres
cliniques.
................................................
167
Figure
98
:
Association
du
z-‐score
intégrant
l’expression
de
FGF5,
FGF7,
FGF17,
FGF23,
SEF
et
SPRY2
et
des
paramètres
cliniques.
.............................................................................................................................
168
Figure
99
:
Représentation
de
l’expression
des
FGF/FGFR
et
des
régulateurs
négatifs
des
cohortes
Cagekid
et
TCGA.
.................................................................................................................................................
172
Figure
100
:
Associations
des
paramètres
cliniques
avec
l’expression
des
FGFs
et
des
régulateurs
des
FGFs
des
données
TCGA.
................................................................................................................................
175
Figure
101
:
Corrélation
entre
expression
des
ARNm
et
des
protéines.
.......................................................
176
Figure
102
:
Annotation
des
CpG
dans
les
données
de
puces
450K.
.............................................................
186
Figure
103
:
Validation
de
la
méthylation
des
biomarqueurs
par
pyroséquençage.
....................................
186
Figure
104
:
Optimisation
de
la
qPCR
méthylation-‐spécifique
PPFIA4
en
FAM.
...........................................
187
Figure
105
:
Signal
qPCR
du
triplex
ALB
(FAM)/PRKCB(LC670)/TFAP2B
amp1
(LC610).
................................
188
Figure
106
:
Nombre
d’échantillons
non-‐tumoraux
dont
la
méthylation
est
significative.
...........................
189
Figure
107
:
Nombre
d’échantillons
tumoraux
dont
la
méthylation
est
supérieure
à
différents
seuils.
......
190
Figure
108
:
Corrélations
entre
β-‐valeurs
associées
aux
CpG
sélectionnés.
.................................................
190
Figure
109
:
Nombre
d’échantillons
tumoraux
méthylés
sur
1
à
6
des
CpG
sélectionnés
dans
le
test
MethyLight.
............................................................................................................................................
191
Figure
110
:
Comparaison
des
kits
d'extraction
InnuConvert
et
Norgen
sur
du
plasma
sain.
.......................
191
Figure
111
:
Comparaison
des
rendements
de
l'étape
de
bisulfite
de
l’ADN
circulant.
................................
192
Figure
112
:
Comparaison
des
rendements
finaux
d’extraction
et
bisulfite
de
l’ADN
circulant.
..................
192
Figure
113
:
Répartition
des
mutations
non-‐synonymes
sur
la
protéine
VHL
dans
le
ccRCC.
.......................
195
Figure
114
:
Méthylation
du
cg18674980
(CA3)
dans
différents
types
de
tumeurs.
....................................
198
Figure
115
:
Pourcentage
de
patients
avec
une
quantité
d'ADN
circulant
détectable
dans
différents
types
de
cancers
avancés.
....................................................................................................................................
199
14.
-‐
11
-‐
Liste
des
tableaux
Tableau
1
:
Techniques
expérimentales
d’étude
de
l’épigénome.
.................................................................
38
Tableau
2
:
Kits
de
détection/prédiction
basés
sur
des
biomarqueurs
de
méthylation.
................................
53
Tableau
3
:
Kits
de
détection
de
cancers
basés
sur
la
méthylation
de
l'ADN
circulant
actuellement
commercialisés.
.......................................................................................................................................
59
Tableau
4
:
Classification
TNM
des
tumeurs
rénales.
.....................................................................................
62
Tableau
5
:
Attribution
des
stades
en
fonction
des
critères
TNM
du
cancer
du
rein.
.....................................
63
Tableau
6
:
Thérapies
ciblant
la
voie
FGF/FGFR
en
cours
d’essais
thérapeutiques
dans
le
traitement
des
RCC.
.................................................................................................................................................................
68
Tableau
7
:
Anticorps
utilisés
pour
les
immunoprécipitations:
références
et
quantités.
................................
77
Tableau
8
:
Amorces
de
PCR
utilisées
pour
les
qPCR
de
contrôle
d’enrichissement
des
immunoprécipitations.
.............................................................................................................................
78
Tableau
9
:
Amorces
d’amplification
PCR
et
de
pyroséquençage
utilisées
pour
les
validations
de
mutations.
.................................................................................................................................................................
94
Tableau
10
:
Pics
identifiés
par
ChIP-‐seq
ciblant
différentes
marques
d’histones.
.........................................
97
Tableau
11
:
Pics
identifiés
en
FAIRE-‐seq
et
reproductibilité
dans
les
différentes
lignées
de
RCC.
..............
101
Tableau
12
:
Calculs
des
rendements
des
extractions
FAIRE
des
différentes
lignées
de
RCC.
......................
101
Tableau
13
:
Identification
des
pics
ATAC-‐seq
dans
les
lignées
cellulaires.
..................................................
105
Tableau
14
:
Identification
des
éléments
régulateurs
actifs
par
les
marques
d’histones
des
différentes
lignées
cellulaires.
..................................................................................................................................
107
Tableau
15
:
Motifs
de
facteurs
de
transcription
enrichis
dans
les
éléments
régulateurs
actifs
identifiés.
.
111
Tableau
16
:
Identification
des
éléments
régulateurs
actifs
par
présence
des
marques
d’histones
et
du
signal
ATAC-‐seq.
...............................................................................................................................................
112
Tableau
17
:
Motifs
de
facteurs
de
transcription
enrichis
dans
les
éléments
régulateurs
actifs
identifiés.
.
113
Tableau
18
:
Mutations
somatiques
de
95
échantillons
de
ccRCC
à
travers
le
génome
et
sur
les
éléments
régulateurs
actifs.
..................................................................................................................................
114
Tableau
19
:
Nombre
d’îlots
de
mutations
identifiés
dans
les
éléments
régulateurs
actifs
des
ccRCC.
.......
115
Tableau
20
:
Liste
des
gènes
associés
aux
cancers
urogénitaux
et
dont
un
élément
régulateur
contenant
un
îlot
de
mutations
est
situé
à
proximité
du
TSS.
.....................................................................................
115
Tableau
21
:
Nombre
d’îlots
de
mutations
associés
à
un
changement
d’expression
d’un
gène
situé
à
une
distance
déterminée.
.............................................................................................................................
117
Tableau
22
:
Nombre
et
répartition
des
mutations
somatiques
totales
et
localisées
sur
les
éléments
régulateurs
actifs
identifiés
par
ChIP-‐seq
et
ATAC-‐seq.
.........................................................................
118
Tableau
23
:
Scores
de
conservation
et
motifs
de
liaison
créés
par
les
mutations
de
l’élément
régulateur
de
WWC1.
...................................................................................................................................................
123
Tableau
24
:
Scores
de
conservation
et
motifs
de
liaison
créés
par
les
mutations
de
l’élément
régulateur
de
IGF1R.
.....................................................................................................................................................
124
Tableau
25
:
Données
qualitatives
associées
aux
mutations
du
promoteur
de
TERT.
..................................
127
Tableau
26
:
Expression
des
échantillons
mutés
dans
le
promoteur
de
TERT
et
interprétation.
.................
128
Tableau
27
:
Nombre
de
données
utilisées
pour
l’analyse
des
dérégulations
du
système
FGF/FGFR.
.........
152
Tableau
28
:
Données
cliniques
associées
aux
échantillons
tumoraux
séquencés
en
RNA-‐seq.
..................
153
Tableau
29
:
Liste
des
amorces
de
qPCR.
......................................................................................................
155
Tableau
30
:
Amorces
de
PCR
et
de
pyroséquençage.
..................................................................................
157
Tableau
31
:
Expression
RNA-‐seq
des
FGF/FGFRs,
des
FHFs
et
des
régulateurs
SEF
et
SPRY2
dans
les
cohortes
Cagekid
et
TCGA.
.....................................................................................................................
170
Tableau
32
:
Liste
des
amorces
et
sondes
utilisées
pour
les
qPCR
MethyLight.
...........................................
182
Tableau
33
:
Séquences
des
amorces
et
sondes
utilisées
pour
la
quantification
de
l’ADN
bisulfité.
............
184
Tableau
34
:
Liste
des
biomarqueurs
hyperméthylés
retenus
après
analyse
des
données
de
puces
450K.
.
185
Tableau
35
:
Liste
des
qPCR
méthylation-‐spécifique
validées.
......................................................................
187
Tableau
36
:
Longueurs
d'onde
d'excitation
et
d'émission
des
sondes
FAM,
LC610
et
LC670
sur
Light
Cycler
480.
........................................................................................................................................................
188
Tableau
37
:
qPCR
optimisées
en
triplex.
......................................................................................................
189
15.
-‐
12
-‐
Tableau
38
:
Concentration
en
ADN
circulant
de
plasma
ou
sérum
de
patients
sains
ou
atteints
d’un
RCC
localisé
ou
métastatique.
.......................................................................................................................
199
16.
-‐
13
-‐
Abréviations
et
acronymes
3C
:
Chromosome
Conformation
Capture
4C
:
Circular
Chromosome
Conformation
Capture
5C
:
Carbon-‐Copy
Chromosome
Conformation
Capture
5CaC
:
5
carboxylcytosine
5fC
:
5
formylcytosine
5hmC
:
5
hydroxyméthylcytosine
5mC
:
5
méthyl
cytosine
A
:
adénine
Ac
:
acétyl
ADN
:
acide
désoxyribonucléique
ARN
:
acide
ribonucléique
ARNm
:
ARN
messager
ARNe
:
ARN
codé
par
un
enhancer
ATAC-‐seq
:
Assay
of
Transposase
Accessible
Chromatin
Sequencing
ATP
:
adénosine
triphosphate
C
:
cytosine
ccRCC
:
adénocarcinome
du
rein
à
cellules
claires
ChIA-‐PET
:
Chromatin
Interaction
Analysis
by
Paired-‐End
Tag
sequencing
ChIP-‐seq
:
Chromatin
Immuno-‐Precipitation
Sequencing
chr
:
chromosome
chRCC
:
adénocarcinome
du
rein
chromophobe
CIMP
:
CpG
Island
Methylator
Phenotype
CNV
:
variation
du
nombre
de
copies
CpG
:
nucléotide
C
suivi
d’un
nucléotide
G
CT
:
territoire
chromosomique
DNaseI-‐seq
:
DNase
I
hypersensitive
sites
sequencing
17.
-‐
14
-‐
DNMT
:
ADN
méthyltransférase
ETS
:
E-‐Twenty-‐Six
FAIRE-‐seq
:
Formaldheyde
Assisted
Isolation
of
Regulatory
Elements
Sequencing
FGF
:
facteur
de
croissance
des
fibroblastes
FGFR
:
récepteur
de
croissance
des
fibroblastes
G
:
guanine
GTF
:
facteur
général
de
la
transcription
GWAS
:
étude
d’association
pangénomique
H
:
histone
HAT
:
histone
acétyltransférase
HDAC
:
histone
désacétylase
Hi-‐C
:
étude
des
interactions
de
la
chromatine
à
l’échelle
du
génome
HMT
:
histone
méthyltransférase
IC
:
compartiment
inter-‐chromatinien
K
:
lysine
kb
:
kilo
paires
de
bases
KDM
:
histone
déméthylase
MBD
:
methyl-‐binding
domain
Me
:
méthyl
MeDIP-‐seq
:
Methylated
DNA
ImmunoPrecipitation
Sequencing
MNase-‐seq
:
Micrococcal
Nuclease
digestion
followed
by
Sequencing
p
:
p-‐valeur
de
test
statistique
pb
:
paire
de
bases
PCR
:
réaction
en
chaîne
par
polymérase
PIC
:
complexe
de
pré-‐initiation
de
la
transcription
pRCC
:
adénocarcinome
du
rein
papillaire
qPCR
:
réaction
en
chaîne
par
polymérase
quantitative
RCC
:
adénocarcinome
du
rein
18.
-‐
15
-‐
RNA-‐seq
:
séquençage
de
l’ARN
RPKM
:
Read
Per
Kilo
per
Million
map
reads
SAM
:
adénosylméthionine
SNP
:
single
nucleotide
polymorphism
SONO-‐seq
:
SONication
of
cross-‐linked
chromatin
Sequencing
T
:
thymine
TDG
:
thymine
DNA
glycosylase
TF
:
facteur
de
transcription
TSS
:
site
de
démarrage
de
la
transcription
UTR
:
région
non
traduite
WGBS
:
whole
genome
bisulfite
sequencing
WGS
:
séquençage
pangénomique
20.
-‐
17
-‐
Introduction
Cette
dernière
décennie,
l’avènement
du
séquençage
haut
débit
a
permis
d’améliorer
considérablement
la
caractérisation
des
altérations
génétiques
et
épigénétiques
des
tumeurs.
L’accumulation
de
ces
nouvelles
connaissances
permet
de
mieux
comprendre
les
processus
biologiques
menant
à
la
tumorigenèse
et
a
un
impact
grandissant
dans
la
capacité
à
diagnostiquer,
traiter
et
prévenir
les
cancers.
Parmi
les
nouveaux
cas
de
cancers
diagnostiqués
chaque
année
dans
le
monde,
330
000
sont
des
cancers
du
rein,
dont
la
majorité
sont
des
adénocarcinomes
du
rein
à
cellules
claires
(ccRCC).
La
mise
en
œuvre
d’études
génétiques
et
épigénétiques
du
ccRCC
a
permis
la
découverte
de
voies
de
signalisation
impliquées
dans
l’initiation
et
la
progression
tumorale
et
la
mise
au
point
de
thérapies
ciblées.
L’identification
du
lien
entre
les
altérations
du
gène
VHL
et
l’activation
de
l’angiogenèse
a
abouti
au
développement
de
thérapies
anti-‐angiogéniques.
De
même,
l’activation
de
la
voie
mTOR
dans
le
ccRCC
fait
l’objet
de
stratégies
thérapeutiques
ciblées.
Bien
que
les
patients
répondent
souvent
positivement
à
ces
thérapies,
des
résistances
apparaissent
rapidement
et
la
maladie
finit
par
progresser
[1,
2].
Approfondir
la
caractérisation
moléculaire
des
ccRCC
constitue
donc
un
enjeu
majeur
pour
améliorer
la
prise
en
charge
des
malades.
Cette
thèse
s’inscrit
dans
ce
contexte
et
se
compose
de
trois
projets
qui
visent
à
poursuivre
l’identification
des
altérations
moléculaires
caractérisant
le
ccRCC
et
à
établir
de
nouveaux
marqueurs
de
diagnostic.
Le
premier
projet
cherche
à
identifier
de
nouveaux
évènements
génétiques
impliqués
dans
la
tumorigénèse.
Bien
que
les
mutations
de
l’ADN
codant
aient
été
largement
étudiées
sur
différentes
cohortes
de
centaines
d’échantillons
de
ccRCC,
les
mutations
affectant
l’ADN
non-‐codant
n’ont
jusqu’à
présent
pas
été
explorées
[3-‐5].
Or,
la
plupart
des
mutations
somatiques
des
cancers
se
trouvent
dans
ces
régions
et
peuvent
affecter
de
nombreux
éléments
régulateurs
de
la
transcription
[6].
Le
premier
projet
de
cette
thèse
a
donc
pour
but
d’identifier
des
mutations
non-‐codantes
localisées
sur
les
éléments
régulateurs
actifs
du
ccRCC.
Le
deuxième
projet
propose
d’analyser
les
altérations
moléculaires
d’une
voie
de
signalisation
qui
est
la
cible
de
traitements
en
cours
de
tests
cliniques
dans
le
ccRCC
:
la
voie
FGF/FGFR
[7].
Bien
qu’elle
soit
l’objet
de
thérapies
ciblées,
très
peu
d’études
ont
analysé
les
dérégulations
de
cette
voie
dans
le
ccRCC
et
aucune
ne
l’a
faite
sur
l’ensemble
des
gènes
de
cette
famille.
Le
deuxième
projet
de
cette
thèse
consiste
donc
en
l’étude
systématique
des
altérations
moléculaires
affectant
les
membres
composant
la
famille
FGF/FGFR
et
les
régulateurs
négatifs
de
la
voie
qu’ils
activent,
sur
des
centaines
d’échantillons
de
ccRCC.
Enfin,
le
troisième
projet
consiste
à
la
mise
au
point
d’un
test
de
diagnostic
non-‐invasif
qui
permettrait
de
dépister
le
ccRCC
à
des
stades
plus
précoces.
L’ADN
circulant,
présent
dans
le
plasma
sanguin,
peut
être
utilisé
comme
biomarqueur
des
tumeurs
car
il
comporte
les
modifications
génétiques
et
épigénétiques
des
cellules
tumorales
dont
il
est
issu
[8].
Le
troisième
projet
de
cette
thèse
consiste
ainsi
au
développement
21.
-‐
18
-‐
d’un
test
de
diagnostic
basé
sur
la
détection
sensible
de
biomarqueurs
de
méthylation
de
l’ADN
circulant
de
patients
atteints
de
ccRCC.
Avant
de
décrire
les
résultats
de
ces
trois
projets,
le
premier
chapitre
est
consacré
à
la
mise
en
contexte
de
cette
thèse.
22.
-‐
19 -
Chapitre
I
:
Mise
en
contexte
des
projets
1.
Organisation
de
la
chromatine
et
régulation
de
la
transcription
.............................................
20
1.1.
De
l’ADN
à
la
chromatine
.....................................................................................................................
20
1.2.
L’ADN
non-‐codant
................................................................................................................................
24
1.3.
Les
mécanismes
épigénétiques,
régulateurs
de
la
transcription
.........................................................
27
1.4.
Cartographie
des
éléments
régulateurs
du
génome
...........................................................................
36
2.
Les
cancers
:
caractéristiques
biologiques,
génétique,
épigénétique
......................................
40
2.1.
Caractéristiques
fondamentales
des
cancers
......................................................................................
40
2.2.
Génétique
des
cancers
.........................................................................................................................
45
2.3.
Epigénétique
des
cancers
....................................................................................................................
51
2.4.
Interactions
entre
modifications
génétiques
et
épigénétiques
...........................................................
54
2.5.
Les
consortia
de
génétique
et
épigénétique
des
cancers
....................................................................
55
2.6.
L’ADN
circulant
comme
biomarqueur
génétique
ou
épigénétique
de
cancer
.....................................
56
3.
L’adénocarcinome
du
rein
à
cellules
claires
............................................................................
60
3.1.
Epidémiologie
et
classification
.............................................................................................................
60
3.2.
Diagnostic
............................................................................................................................................
62
3.3.
Modifications
génétiques
et
épigénétiques
du
cancer
du
rein
............................................................
63
3.4.
Le
consortium
Cagekid
.........................................................................................................................
66
3.5.
Traitements
actuels
.............................................................................................................................
66
3.6.
La
voie
FGF/FGFR
.................................................................................................................................
68
4.
Sujet
de
thèse
........................................................................................................................
71
23. Chapitre
I
:
Mise
en
contexte
des
projets
-‐
20
-‐
1. Organisation
de
la
chromatine
et
régulation
de
la
transcription
L’étude
de
la
structure
chromatinienne
et
son
implication
dans
la
régulation
de
l’expression
des
gènes
est
un
domaine
de
recherche
en
plein
essor.
L’objectif
de
cette
partie
est
de
poser
les
bases
nécessaires
à
la
compréhension
de
ces
mécanismes
épigénétiques.
1.1. De
l’ADN
à
la
chromatine
1.1.1. L’ADN,
molécule
clé
du
vivant
Les
cellules
somatiques
eucaryotes
contiennent
approximativement
six
milliards
de
paires
de
bases
d’ADN,
ce
qui
correspond
à
une
longueur
théorique
de
deux
mètres
d’ADN.
L’intégrité
de
ce
matériel
est
contenu
dans
le
noyau,
dont
le
diamètre
est
d’environ
dix
à
vingt
microns,
ce
qui
implique
une
compaction
extrême
de
l’ADN
[9].
Pour
celà,
l’ADN
s’associe
à
des
protéines,
les
histones,
qui
sont
en
charge
d’organiser
le
contenu
nucléaire
en
une
structure
dense,
appelée
chromatine
[10].
1.1.2. L’organisation
de
la
chromatine
L’organisation
de
la
chromatine
comporte
différents
niveaux
[11]
(Figure
1).
Au
niveau
de
l’organisation
primaire
de
la
chromatine,
l’ADN
est
compacté
en
nucléosomes,
unités
fondamentales
de
la
chromatine,
comprenant
chacun
147
paires
de
bases
d’ADN
enroulées
autour
d’un
octamère
d’histones
et
un
ADN
de
liaison
au
nucléosome
suivant
[12].
L’octamère
d’histones
est
composé
de
deux
copies
des
histones
H2A,
H2B,
H3
et
H4.
Ces
histones
sont
de
petites
protéines
extrêmement
conservées
au
cours
de
l’évolution
comportant
un
domaine
central
et
des
extrémités
qui
sortent
du
nucléosome
et
qui
sont
le
siège
de
diverses
modifications
post-‐traductionnelles
(décrites
en
§1.3.2).
La
structure
primaire
en
«
collier
de
perles
»
constituée
de
l’enchaînement
des
nucléosomes
a
un
diamètre
de
11
nm
et
constitue
le
premier
niveau
de
compactage
de
la
chromatine
[11].
En
plus
de
l’enroulement
de
la
molécule
d’ADN
autour
de
l’octamère
d’histones,
la
compaction
peut
être
rendue
encore
plus
forte
par
la
liaison
de
l’histone
H1
au
nucléosome
et
à
l’ADN
de
liaison.
Cette
structure
de
30
nm
de
diamètre
forme
la
fibre
de
chromatine
[13].
Le
repliement
de
la
fibre
de
chromatine
à
un
niveau
de
compaction
supérieur
forme
une
fibre
de
300
nm
de
diamètre
comprenant
des
boucles
de
chromatine.
Enfin,
les
niveaux
supérieurs
d’organisation
de
la
chromatine
conduisent
à
la
formation
de
chromosomes
(Figure
1).
25. Chapitre
I
:
Mise
en
contexte
des
projets
-‐
22
-‐
1.1.4. Organisation
des
chromosomes
dans
le
noyau
Les
chromosomes
sont
contenus
dans
un
noyau.
Ce
dernier
n’est
pas
seulement
un
organite
permettant
de
séparer
le
génome
du
cytoplasme,
il
joue
également
un
rôle
important
dans
l’organisation
de
la
chromatine
et
la
régulation
de
l’expression.
Le
noyau
est
délimité
par
une
double
membrane
nucléaire.
Accolée
à
sa
face
interne,
se
trouve
la
lamina,
ensemble
de
filaments
intermédiaires,
de
lamines
et
d’autres
protéines,
essentiel
dans
l’organisation
de
la
chromatine
[15].
Elle
est
impliquée
dans
la
régulation
de
l’expression
des
gènes
en
interagissant
avec
de
nombreux
régulateurs
transcriptionnels
et
participe
à
l’organisation
de
l’hétérochromatine.
Les
domaines
associés
à
la
lamina
sont
donc
des
domaines
où
la
chromatine
se
trouve
sous
forme
d’hétérochromatine,
tels
que
les
centromères,
télomères
ou
les
gènes
dont
la
transcription
est
réprimée
[15].
Ces
domaines
se
retrouvent
donc
préférentiellement
en
périphérie
du
noyau
[15]
(Figure
3).
Figure
3
:
Organisation
de
la
chromatine
dans
le
noyau.
Au
niveau
de
la
lamina,
se
trouvent
des
domaines
d’hétérochromatine.
L’euchromatine
se
trouve
préférentiellement
vers
le
centre
du
noyau.
Hormis
la
localisation
périphérique
de
l’hétérochromatine,
l’arrangement
chromosomique
dans
le
noyau
est
également
organisé
de
manière
non
aléatoire.
A
l’interphase,
les
chromosomes
occupent
des
régions
discrètes
dans
le
noyau,
appelées
territoires
chromosomiques
chacun
contenant
un
seul
chromosome
[16].
L’agencement
des
territoires
chromosomiques
les
uns
par
rapport
aux
autres
n’est
pas
aléatoire.
Les
petits
chromosomes
sont
préférentiellement
situés
vers
l’intérieur
du
noyau
et
les
chromosomes
plus
grands
vers
la
périphérie
[17].
Le
contenu
nucléaire
est
également
important
puisqu’à
taille
égale,
un
chromosome
pauvre
en
gènes
(comme
le
chromosome
18)
est
situé
plus
en
périphérie
qu’un
autre
plus
riche
en
gènes
(comme
le
chromosome
19)
[18]
(Figure
4).
Cette
constatation
est
tout
de
même
nuancée
par
le
fait
que
l’agencement
des
territoires
chromatiniens
peut
varier
d’un
type
cellulaire
à
l’autre
[19].
Hétérochroma5ne((
lamina(
chroma5ne(
noyau(
hétérochroma5ne(
euchroma5ne(
26. Organisation
de
la
chromatine
et
régulation
de
la
transcription
-‐
23
-‐
Figure
4
:
Territoires
chromosomiques
et
agencement
radial
dans
le
noyau.
Les
chromosomes
sont
arrangés
en
territoires
chromosomiques
au
sein
du
noyau
;
chaque
territoire
contenant
un
chromosome.
L’agencement
radial
au
sein
du
noyau
est
dépendant
de
la
taille
et
de
la
richesse
en
gènes
des
chromosomes.
Au
sein
d’un
territoire
chromosomique,
la
localisation
des
gènes
semble
également
être
liée
à
l’expression,
les
gènes
transcriptionnellement
actifs
étant
préférentiellement
localisés
en
périphérie
du
territoire
[20].
L’hypothèse
actuelle
serait
que
cette
organisation
favoriserait
les
interactions
inter-‐chromosomiques.
Deux
modèles
sont
actuellement
proposés
pour
décrire
ces
interactions
(Figure
6).
Le
modèle
CT-‐IC
(chromosome
territory-‐interchromatin
compartment)
décrit
deux
compartiments
principaux
:
les
territoires
chromosomiques
(CTs)
et
le
compartiment
interchromatinien
(IC).
Dans
ce
modèle,
les
territoires
chromosomiques
sont
séparés
par
le
compartiment
interchromatinien
qui
forme
des
canaux
riches
en
complexes
nécessaires
à
la
transcription
des
gènes
mais
également
à
la
réplication
[21].
Des
boucles
de
chromatine
contenant
des
gènes
actifs
s’étendent
à
l’extérieur
des
territoires
dans
l’espace
inter-‐chromatinien
et
offrent
la
possibilité
d’interactions
inter-‐chromosomiques
[22].
Le
modèle
ICN
(Inter-‐Chromatin
Network)
propose
des
zones
de
recouvrement
dans
lequels
les
fibres
de
chromatine
de
territoires
voisins
sont
étroitement
associées.
Dans
ce
modèle,
les
protéines
nécessaires
à
la
transcription
et
à
la
réplication
diffusent
librement
entre
les
boucles
de
chromatine.
Figure
5
:
Les
modèles
d’interactions
entre
territoires
chromosomiques.
Deux
modèles
ont
été
proposés
pour
décrire
les
interactions
entre
territoires
chromosomiques
voisins
(CT).
A.
Le
modèle
CT-‐IC
propose
une
séparation
des
territoires
par
un
espace
inter-‐chromatinien
(IC),
où
se
trouvent
les
complexes
nécessaires
à
la
transcription
(TF).
B.
Le
modèle
ICN
propose
un
recouvrement
partiel
des
territoires
chromatiniens
et
une
absence
d’espace
inter-‐chromatinien.
Figure
issue
du
site
http://www.mechanobio.info/.
Richesse(en(gènes(Taille(des(chromosomes(
27. Chapitre
I
:
Mise
en
contexte
des
projets
-‐
24
-‐
Dans
cette
partie,
l’organisation
de
la
chromatine
a
été
décrite
et
mise
en
lien
avec
l’activité
transcriptionnelle
de
gènes.
La
partie
suivante
se
recentre
sur
la
molécule
d’ADN
et
plus
particulièrement
sur
les
éléments
non-‐codants
qui
entrent
en
jeu
dans
la
régulation
de
la
transcription.
1.2. L’ADN
non-‐codant
1.2.1. L’ADN
codant,
par
opposition
à
l’ADN
non-‐codant
L’ADN
est
composé
de
régions
codantes
et
de
régions
non-‐codantes.
Les
régions
codantes
de
l’ADN
sont
définies
comme
les
régions
du
génome
qui
codent
pour
des
protéines.
Elles
consistent
en
des
séquences
de
nucléotides
qui
correspondent
à
des
séquences
d’acides
aminés
de
protéines.
Ces
portions
codantes,
constituées
d’exons,
sont
interrompues
par
des
sections
non
codantes,
les
introns,
l’ensemble
formant
un
gène.
Le
génome
humain
comporte
près
de
21
000
gènes
différents
codant
pour
des
protéines
[6].
Ces
régions
codantes
représentent
seulement
1,5
à
2,5
%
du
génome
[23,
24]
et
sont
fortement
conservées
entre
les
espèces
[25].
Le
reste
du
génome
est
appelé
ADN
non-‐codant.
1.2.2. L’ADN
non-‐codant,
ADN
poubelle
?
L’ADN
non-‐codant
représente
environ
98
%
du
génome
humain
[24]
et
a
longtemps
été
appelé
«
ADN
poubelle
»
car
il
était
considéré
comme
non-‐fonctionnel
[26,
27].
C’est
une
des
raisons
pour
laquelle
les
études
de
génomique
étaient
alors
centrées
sur
l’analyse
des
régions
codantes.
Cependant,
l’existence
de
séquences
conservées
dans
les
régions
non-‐codantes
implique
qu’elles
aient
été
sous
pression
de
sélection,
ce
qui
est
généralement
signe
de
fonctionnalité
[28-‐30].
Parmi
les
fonctionnalités
décrites
de
l’ADN
non-‐codant,
on
retrouve
des
éléments
impliqués
dans
la
reconnaissance
de
la
machinerie
transcriptionnelle
et
des
facteurs
de
transcription
tels
que
les
promoteurs,
les
enhancers,
les
silencers
et
les
insulators.
L’ADN
non-‐codant
contient
également
des
séquences
qui
sont
transcrites
en
molécules
d’ARN
non-‐codantes
mais
fonctionnelles
telles
que
les
ARNs
de
transfert,
ARNs
ribosomaux,
micro-‐ARNs
et
longs
ARNs
non-‐codants.
Enfin,
d’autres
éléments
fonctionnels
composent
l’ADN
non-‐codant
tels
que
les
séquences
répétées
jouant
un
rôle
structural
à
l’échelle
chromosomique
(télomères,
centromères),
les
introns
et
les
origines
de
réplication
[23]
(Figure
6).
Dans
le
cadre
de
ce
travail,
le
sujet
d’intérêt
se
portera
principalement
sur
les
promoteurs
et
les
enhancers.
1.2.3. Les
promoteurs
Un
promoteur
est
une
séquence
d’ADN
située
en
amont
de
la
séquence
codante
du
gène.
Il
contribue
à
l’initiation
et
à
la
régulation
de
la
transcription
en
interagissant
avec
de
multiples
partenaires
dont
l’ARN
polymérase
II.