SlideShare ist ein Scribd-Unternehmen logo
1 von 24
Downloaden Sie, um offline zu lesen
Mise en place de serveurs
Galaxy dans le cadre du réseau
CATI BBRIC
{Sebastien.Carrere, Ludovic.Legrand,Jerome.Gouzy}@toulouse.inra.fr
{Fabrice.Legeai,Anthony.Bretaudeau}@rennes.inra.fr
CATI BBRIC
►

35 bioinformaticiens

►

15 unités

►

10 sites

Domaines d’applications
►
►

Annotation structurale des génomes (gènes codants pour des protéines / ncRNA)

►

Annotation fonctionnelle (genomes/transcriptomes)

►

Modèles d’intérêt

Assemblage (genomes/transcriptomes)

Analyse de l’expression (RNAseq, puces)

►

Détection et analyse du polymorphisme

►

Plantes

►

Metagenomique

►

Bactéries

►

Epigénomique

►

Insectes

►

Modélisation des réseaux métaboliques et de régulation.

►

Nématodes

►

Gestion de collections (bactéries, insectes, etc.)

►

Champignons

►

Systématique: identification des espèces de groupes d’espèces d’intérêt

►

Oomycetes

►

Phylogénie, évolution

►

Virus

►

Génomique des populations

04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Architecture bioinformatique BBRIC
4 composants interopérables
DONNEES
données accessibles
via internet

BBRIC Data Archive(s)

ANALYSES
BBRIC Pipelines/Bioinformatics
Toolkit

RESULTATS

doi
http
ldap ou public

BBRIC reference data repository

Mise à jour
manuelle par un bioinfo

BBRIC Workspace
upload en ligne
de commande
04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Architecture bioinformatique BBRIC
4 composants interopérables
DONNEES
données accessibles
via internet

BBRIC Data Archive(s)

ANALYSES
BBRIC Pipelines/Bioinformatics
Toolkit

RESULTATS

doi
http
ldap ou public

BBRIC reference data repository

Mise à jour
manuelle par un bioinfo

BBRIC Workspace
upload en ligne
de commande
04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Galaxy @ BBRIC
S’adapter au réseau
►

Des instances au plus proche des données
 @Rennes
 Accès contrôlé
►

annuaire LDAP

 @Toulouse
 Accès contrôlé
►

Fédération Education Recherche (Shibboleth)

 @Ailleurs ?
►

Un toolshed pour partager les outils

►

Un système pour maintenir les données de
référence
04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Galaxy @ BBRIC
Pré-requis avant un passage en production
► Utilisation

de fichiers compressés

 fastq.gz
► Interopérabilité

avec les instances d’Archive

 Les utilisateurs doivent pouvoir analyser leurs données
► Interopérabilité

avec les instances Workspace

 Les utilisateurs doivent pouvoir être autonomes dans le postprocessing des résultats intermédiaires

04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Utilisation de fichiers
compressés
►

De nombreux outils le permettent, pourquoi s’en priver ?

►

Pourquoi Galaxy décompresse automatiquement ?

►

Extension des datatypes
 datatypes_conf.xml
 lib/galaxy/datatypes/data.py

►

Modification du code de l’upload
 tools/data_source/upload.py

►

Modification des fiches des outils pour ajout du nouveau
type accepté
04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Interopérabilité avec Archive
Qu’est-ce que l’Archive ?
►

Un système de conservation des données brutes



►

générique
sans limite de taille de fichier

Un système ouvert



conversion vers les formats standards (SRA, GEO pour les séquences)



►

accès programmatique (API, client)
publication des données/métadonnées (DOI, lien permanent)

Un accès sécurisé et authentifié



►

droits d’accès par fichier
authentification par la fédération Education Recherche

Un outil accessible aux producteurs de données (les biologistes)


interface web (consultation, gestion)



moteur de recherche

04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Interopérabilité avec Archive

04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Interopérabilité avec Archive

04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Interopérabilité avec Archive

04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Interopérabilité avec Archive

04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Interopérabilité avec
Workspace

04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Interopérabilité avec
Workspace

04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Interopérabilité avec
Workspace

04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Interopérabilité avec
Workspace

04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Atelier 29-30/10/2013
►

Quinzaine de bioinformaticiens du CATI BBRIC

►

1/3 connaissait les aspects techniques de Galaxy

►

Etape 1: déployer un outil simple dans Galaxy from
scratch
 Démystifier Galaxy

►

Etape 2: utiliser Appli.pm
 Se faciliter la vie

►

Etape 3: Déployer un outil complexe (pipeline)
 Se rendre utile

04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Atelier 29-30/10/2013
►

Etape 1: déployer un outil simple dans Galaxy from
scratch
 Predotar, tmhmm, signalpHMM
 Bilan des difficultés rencontrées
 Gestion dynamique des formats de sortie
►

Paramètres conditionnels

►

Itérateurs / collection

►

Sélection des datatypes

►

Gestion des paths

►

Débogage

Mais tout le monde peut y arriver
et tout le monde y est arrivé !
04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Atelier 29-30/10/2013
►

Etape 2: Appli.pm

►

Qu’est-ce ?
 Un module Perl de la « lipmutils » permettant de décrire un programme.
 Développé pour déployer des services Mobyle & BioMOBY étendu à
Galaxy

►

Pourquoi  faire?
 décrire une et une seule fois son programme
 générer autant d’usage que d’outils (CLI, Mobyle, Galaxy, JSON, next ?)

►

Sous quelles contraintes?
 Perl
 Connaitre les datatypes des interfaces (mobyle ≠ biomoby ≠ galaxy ≠
GetOptLong ≠ EDAM)
04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Atelier 29-30/10/2013
►

Etape 2: Appli.pm

►

Quel cas d'utilisation ?
 un programme à ajouter dans Galaxy
 ce programme a une interface en ligne de commande
 j'écris un wrapper Perl utilisant Appli pour générer son usage
Galaxy

►

Résultat
 Permet d’obtenir rapidement un outil fonctionnel
 Permet de générer facilement une trame du XML Galaxy
  Gère les collections, mais pas les paramètres
conditionnels

04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Atelier 29-30/10/2013
►

Etape3: Déployer un outil complexe (pipeline)

►

EuGène-P
 Pipeline d’annotation de génomes procaryotes
►

Intègre des données de similarité (Blastx)

►

Intègre des données de transcriptomique (RNA-seq)

►

Intègre des résultats de prédicteurs ab-initio (Prodigal, tRNAScan-SE,…)

 Le wrapper devait
►

prendre en entrée X banques de RNA-seq, un génome nu

►

générer l’environnement (fichiers de conf, arborescence pour
l’exécution du pipeline

►

produire un fichier d’annotation au format GFF3

OK pour la majorité des binômes, quelque soit le
langage et la méthode utilisée
04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Bilan de l’atelier
+ Montée en compétence commune
+ Prise en main de l’outil
- Crash des handlers
En cause: l’écriture de caractères spéciaux sur stderr !

- Difficultés logs
Comment trouver les commandes exécutées ?

~ Les types de données, les ontologies
~ Nécessité de redémarrer régulièrement
Problèmes de cache

04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
Bonnes pratiques
► Toolshed

 Partager les outils
► Appli.pm

(ou autre ?)

 Si demain, l’outil à la mode n’est plus Galaxy
► Déployer

des outils de haut niveau

 Utilisables
 Utiles
► Fichiers

compressés

 Obligatoire dans un environnement de
production
Merci

Weitere ähnliche Inhalte

Ähnlich wie Galaxy @ BBRIC , GalaxyDay, IFB, 20131204

OpenMinTeD - Une infrastructure text-mining au service des scientifiques
OpenMinTeD - Une infrastructure text-mining au service des scientifiquesOpenMinTeD - Une infrastructure text-mining au service des scientifiques
OpenMinTeD - Une infrastructure text-mining au service des scientifiquesopenminted_eu
 
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...Le_GFII
 
Databases for Bioinformatics
Databases for BioinformaticsDatabases for Bioinformatics
Databases for BioinformaticsKarim Mezhoud
 
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...kmichel69
 
Chap XIV : Calcul parallèle (Fondements & Principe d'utilisation)
Chap XIV : Calcul parallèle (Fondements & Principe d'utilisation)Chap XIV : Calcul parallèle (Fondements & Principe d'utilisation)
Chap XIV : Calcul parallèle (Fondements & Principe d'utilisation)Mohammed TAMALI
 
Publication des données publiques (Open Data), WCF Data Services, OData
Publication des données publiques (Open Data), WCF Data Services, ODataPublication des données publiques (Open Data), WCF Data Services, OData
Publication des données publiques (Open Data), WCF Data Services, ODataMicrosoft Ideas
 
Presentation hibernate nfe103
Presentation hibernate nfe103Presentation hibernate nfe103
Presentation hibernate nfe103MRamo2s
 
Redoc: Réseau documentaire de Grenoble
Redoc: Réseau documentaire de GrenobleRedoc: Réseau documentaire de Grenoble
Redoc: Réseau documentaire de Grenobletassadit ALLOUNE
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
Nettoyer et transformer ses données avec Openrefine : partie 1
Nettoyer et transformer ses données avec Openrefine : partie 1Nettoyer et transformer ses données avec Openrefine : partie 1
Nettoyer et transformer ses données avec Openrefine : partie 1Mathieu Saby
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesY. Nicolas
 
L’acquisition d’un outil de découverte_Expérience de l'Université Sherbrooke_...
L’acquisition d’un outil de découverte_Expérience de l'Université Sherbrooke_...L’acquisition d’un outil de découverte_Expérience de l'Université Sherbrooke_...
L’acquisition d’un outil de découverte_Expérience de l'Université Sherbrooke_...nst2011
 
Cours de C++, en français, 2002 - Cours 3.3
Cours de C++, en français, 2002 - Cours 3.3Cours de C++, en français, 2002 - Cours 3.3
Cours de C++, en français, 2002 - Cours 3.3Laurent BUNIET
 
POO Licence L2 Partie I.pdf
POO Licence L2 Partie I.pdfPOO Licence L2 Partie I.pdf
POO Licence L2 Partie I.pdfLarbaSAWADOGO2
 
Cours partie1 elgarrai zineb
Cours partie1 elgarrai zinebCours partie1 elgarrai zineb
Cours partie1 elgarrai zinebZineb ELGARRAI
 
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIFMieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIFEquipex Biblissima
 

Ähnlich wie Galaxy @ BBRIC , GalaxyDay, IFB, 20131204 (20)

OpenMinTeD - Une infrastructure text-mining au service des scientifiques
OpenMinTeD - Une infrastructure text-mining au service des scientifiquesOpenMinTeD - Une infrastructure text-mining au service des scientifiques
OpenMinTeD - Une infrastructure text-mining au service des scientifiques
 
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
 
Databases for Bioinformatics
Databases for BioinformaticsDatabases for Bioinformatics
Databases for Bioinformatics
 
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
 
Chap XIV : Calcul parallèle (Fondements & Principe d'utilisation)
Chap XIV : Calcul parallèle (Fondements & Principe d'utilisation)Chap XIV : Calcul parallèle (Fondements & Principe d'utilisation)
Chap XIV : Calcul parallèle (Fondements & Principe d'utilisation)
 
Publication des données publiques (Open Data), WCF Data Services, OData
Publication des données publiques (Open Data), WCF Data Services, ODataPublication des données publiques (Open Data), WCF Data Services, OData
Publication des données publiques (Open Data), WCF Data Services, OData
 
Cemagref
CemagrefCemagref
Cemagref
 
Presentation hibernate nfe103
Presentation hibernate nfe103Presentation hibernate nfe103
Presentation hibernate nfe103
 
Redoc: Réseau documentaire de Grenoble
Redoc: Réseau documentaire de GrenobleRedoc: Réseau documentaire de Grenoble
Redoc: Réseau documentaire de Grenoble
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Nettoyer et transformer ses données avec Openrefine : partie 1
Nettoyer et transformer ses données avec Openrefine : partie 1Nettoyer et transformer ses données avec Openrefine : partie 1
Nettoyer et transformer ses données avec Openrefine : partie 1
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartes
 
L’acquisition d’un outil de découverte_Expérience de l'Université Sherbrooke_...
L’acquisition d’un outil de découverte_Expérience de l'Université Sherbrooke_...L’acquisition d’un outil de découverte_Expérience de l'Université Sherbrooke_...
L’acquisition d’un outil de découverte_Expérience de l'Université Sherbrooke_...
 
Cours de C++, en français, 2002 - Cours 3.3
Cours de C++, en français, 2002 - Cours 3.3Cours de C++, en français, 2002 - Cours 3.3
Cours de C++, en français, 2002 - Cours 3.3
 
POO Licence L2 Partie I.pdf
POO Licence L2 Partie I.pdfPOO Licence L2 Partie I.pdf
POO Licence L2 Partie I.pdf
 
Cours partie1 elgarrai zineb
Cours partie1 elgarrai zinebCours partie1 elgarrai zineb
Cours partie1 elgarrai zineb
 
4 Solutions Linux Spar
4 Solutions Linux Spar4 Solutions Linux Spar
4 Solutions Linux Spar
 
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIFMieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
 

Galaxy @ BBRIC , GalaxyDay, IFB, 20131204

  • 1. Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC {Sebastien.Carrere, Ludovic.Legrand,Jerome.Gouzy}@toulouse.inra.fr {Fabrice.Legeai,Anthony.Bretaudeau}@rennes.inra.fr
  • 2. CATI BBRIC ► 35 bioinformaticiens ► 15 unités ► 10 sites Domaines d’applications ► ► Annotation structurale des génomes (gènes codants pour des protéines / ncRNA) ► Annotation fonctionnelle (genomes/transcriptomes) ► Modèles d’intérêt Assemblage (genomes/transcriptomes) Analyse de l’expression (RNAseq, puces) ► Détection et analyse du polymorphisme ► Plantes ► Metagenomique ► Bactéries ► Epigénomique ► Insectes ► Modélisation des réseaux métaboliques et de régulation. ► Nématodes ► Gestion de collections (bactéries, insectes, etc.) ► Champignons ► Systématique: identification des espèces de groupes d’espèces d’intérêt ► Oomycetes ► Phylogénie, évolution ► Virus ► Génomique des populations 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 3. Architecture bioinformatique BBRIC 4 composants interopérables DONNEES données accessibles via internet BBRIC Data Archive(s) ANALYSES BBRIC Pipelines/Bioinformatics Toolkit RESULTATS doi http ldap ou public BBRIC reference data repository Mise à jour manuelle par un bioinfo BBRIC Workspace upload en ligne de commande 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 4. Architecture bioinformatique BBRIC 4 composants interopérables DONNEES données accessibles via internet BBRIC Data Archive(s) ANALYSES BBRIC Pipelines/Bioinformatics Toolkit RESULTATS doi http ldap ou public BBRIC reference data repository Mise à jour manuelle par un bioinfo BBRIC Workspace upload en ligne de commande 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 5. Galaxy @ BBRIC S’adapter au réseau ► Des instances au plus proche des données  @Rennes  Accès contrôlé ► annuaire LDAP  @Toulouse  Accès contrôlé ► Fédération Education Recherche (Shibboleth)  @Ailleurs ? ► Un toolshed pour partager les outils ► Un système pour maintenir les données de référence 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 6. Galaxy @ BBRIC Pré-requis avant un passage en production ► Utilisation de fichiers compressés  fastq.gz ► Interopérabilité avec les instances d’Archive  Les utilisateurs doivent pouvoir analyser leurs données ► Interopérabilité avec les instances Workspace  Les utilisateurs doivent pouvoir être autonomes dans le postprocessing des résultats intermédiaires 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 7. Utilisation de fichiers compressés ► De nombreux outils le permettent, pourquoi s’en priver ? ► Pourquoi Galaxy décompresse automatiquement ? ► Extension des datatypes  datatypes_conf.xml  lib/galaxy/datatypes/data.py ► Modification du code de l’upload  tools/data_source/upload.py ► Modification des fiches des outils pour ajout du nouveau type accepté 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 8. Interopérabilité avec Archive Qu’est-ce que l’Archive ? ► Un système de conservation des données brutes   ► générique sans limite de taille de fichier Un système ouvert   conversion vers les formats standards (SRA, GEO pour les séquences)  ► accès programmatique (API, client) publication des données/métadonnées (DOI, lien permanent) Un accès sécurisé et authentifié   ► droits d’accès par fichier authentification par la fédération Education Recherche Un outil accessible aux producteurs de données (les biologistes)  interface web (consultation, gestion)  moteur de recherche 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 9. Interopérabilité avec Archive 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 10. Interopérabilité avec Archive 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 11. Interopérabilité avec Archive 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 12. Interopérabilité avec Archive 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 13. Interopérabilité avec Workspace 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 14. Interopérabilité avec Workspace 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 15. Interopérabilité avec Workspace 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 16. Interopérabilité avec Workspace 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 17. Atelier 29-30/10/2013 ► Quinzaine de bioinformaticiens du CATI BBRIC ► 1/3 connaissait les aspects techniques de Galaxy ► Etape 1: déployer un outil simple dans Galaxy from scratch  Démystifier Galaxy ► Etape 2: utiliser Appli.pm  Se faciliter la vie ► Etape 3: Déployer un outil complexe (pipeline)  Se rendre utile 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 18. Atelier 29-30/10/2013 ► Etape 1: déployer un outil simple dans Galaxy from scratch  Predotar, tmhmm, signalpHMM  Bilan des difficultés rencontrées  Gestion dynamique des formats de sortie ► Paramètres conditionnels ► Itérateurs / collection ► Sélection des datatypes ► Gestion des paths ► Débogage Mais tout le monde peut y arriver et tout le monde y est arrivé ! 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 19. Atelier 29-30/10/2013 ► Etape 2: Appli.pm ► Qu’est-ce ?  Un module Perl de la « lipmutils » permettant de décrire un programme.  Développé pour déployer des services Mobyle & BioMOBY étendu à Galaxy ► Pourquoi  faire?  décrire une et une seule fois son programme  générer autant d’usage que d’outils (CLI, Mobyle, Galaxy, JSON, next ?) ► Sous quelles contraintes?  Perl  Connaitre les datatypes des interfaces (mobyle ≠ biomoby ≠ galaxy ≠ GetOptLong ≠ EDAM) 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 20. Atelier 29-30/10/2013 ► Etape 2: Appli.pm ► Quel cas d'utilisation ?  un programme à ajouter dans Galaxy  ce programme a une interface en ligne de commande  j'écris un wrapper Perl utilisant Appli pour générer son usage Galaxy ► Résultat  Permet d’obtenir rapidement un outil fonctionnel  Permet de générer facilement une trame du XML Galaxy   Gère les collections, mais pas les paramètres conditionnels 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 21. Atelier 29-30/10/2013 ► Etape3: Déployer un outil complexe (pipeline) ► EuGène-P  Pipeline d’annotation de génomes procaryotes ► Intègre des données de similarité (Blastx) ► Intègre des données de transcriptomique (RNA-seq) ► Intègre des résultats de prédicteurs ab-initio (Prodigal, tRNAScan-SE,…)  Le wrapper devait ► prendre en entrée X banques de RNA-seq, un génome nu ► générer l’environnement (fichiers de conf, arborescence pour l’exécution du pipeline ► produire un fichier d’annotation au format GFF3 OK pour la majorité des binômes, quelque soit le langage et la méthode utilisée 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 22. Bilan de l’atelier + Montée en compétence commune + Prise en main de l’outil - Crash des handlers En cause: l’écriture de caractères spéciaux sur stderr ! - Difficultés logs Comment trouver les commandes exécutées ? ~ Les types de données, les ontologies ~ Nécessité de redémarrer régulièrement Problèmes de cache 04/12/2013 – Galaxy Day IFB –Sebastien.Carrere@toulouse.inra.fr
  • 23. Bonnes pratiques ► Toolshed  Partager les outils ► Appli.pm (ou autre ?)  Si demain, l’outil à la mode n’est plus Galaxy ► Déployer des outils de haut niveau  Utilisables  Utiles ► Fichiers compressés  Obligatoire dans un environnement de production
  • 24. Merci