SlideShare ist ein Scribd-Unternehmen logo
1 von 31
Downloaden Sie, um offline zu lesen
1
TASSEL
Trait Analysis by aSSociation, Evolution and
Linkage
2
Mapeamento por associação
● Software para o mapeamento por associação
de traços (características) complexos [1].
3
Conceitos
● Mapeamento por associação
– Método para mapear QTLs
● QLT (quantitative trait loci)
– Expressão de caracteres fenotípicos
– Caracteres quantitativos
● Vários genes
● Distribuição contínua
● Quantidades: peso, altura etc.
4
Estudo de associação
● Identificar associações entre o fenótipo e um
ou mais marcadores genéticos
● Marcador genético
– Diferenças entre indivíduos
– Detectar QTLs
– Exemplo: SNPs
5
SNPs
● Single Nucleotide Polymosphisms
● Grande abundância
– A cada 300 ~ 600 nucleotídeos [2]
● Tecnologias de genotipagem
● Mutações que se propagaram ao longo de
gerações
6
SNPs
7
TASSEL - Instalação
● http://www.maizegenetics.net/tassel
8
TASSEL - Instalação
● Recomendável via git
– https://git-scm.com/downloads
● Para copiar o projeto:
– git clone <endereço da versão>
● Para atualizações:
– git pull
9
TASSEL Pipeline
● Consiste em módulos (plugins)
● Saída de um módulo pode ser utilizada como
entrada para outro módulo
10
Termos importantes
● Sequence File: arquivo texto com uma
sequência de DNA e informações adicionais da
plataforma Illumina.
● Taxa: amostra individual
● Key File: arquivo texto usado para atribuir um
GBS Bar Code para uma Taxa
● GBS Tag: sequência DNA
11
Arquivos de teste
● Download de arquivos de testes:
– http://mirrors.iplantcollaborative.org/browse/iplan
t/home/shared/panzea/tassel/GBSTestData.tar
● Pasta GBS
– Pipeline_Testing_key.txt → key file
12
Tassel GBS Pipeline
● 3 pipelines
– Discovery Pipeline (genoma de referência)
● Vários passos
– Production Pipeline
● Utiliza informação do Discovery Pipeline
● Um passo
– UNEAK (sem um genoma de referência)
13
Estrutura de diretórios
● É necessária uma estrutura de diretórios
– ./fastq
– ./tagCounts
– ./mergedTagCounts
– (…)
● Exemplo: o plugin FastqToTagCountPlugin
redireciona sua saída para o diretório
tagCounts.
14
Discovery Pipeline
● Genoma de referência
● Na pasta GBS (arquivos de teste) possui um
genoma de referência:
– ZmB73_RefGen_(...)
15
Discovery Pipeline
● Execução por linha de comando através de um
script em Perl que se comunica com a
aplicação Java
● Sintaxe:
– run_pipeline.pl -fork1 -PluginName –plugin-option(s)
-endPlugin -runfork1
● TASSEL pode rodar vários processos de uma
vez, combinar resultados etc.
16
TASSEL GBS Pipeline
● Sintaxe:
– run_pipeline.pl -fork1 -PluginName –plugin-option(s)
-endPlugin -runfork1
● Em máquinas Windows sem o Perl instalado,
pode-se utilizar o “run_pipeline.bat”
● Cada passo do pipeline é especificado com um
comando “-fork” e um número
17
TASSEL GBS Pipeline
● Sintaxe:
– run_pipeline.pl -fork1 -PluginName –plugin-option(s)
-endPlugin -runfork1
● O “fork” é seguido pelo nome do plugin e as
opções do plugin.
● “-endPlugin” sinaliza o final das opções.
● “-runfork1” executa o plugin especificado.
18
TASSEL GBS Pipeline
● Sintaxe:
– run_pipeline.pl -fork1 -PluginName –plugin-option(s)
-endPlugin -runfork1
● Caso você chame o plugin sem argumento
algum, então serão impressas suas
opções/argumentos.
19
TASSEL GBS Pipeline
20
TASSEL GBS Pipeline
● Exemplos de argumentos para o plugin
FastqToTagCountPlugin
– -i → especifica o diretório de entrada contendo
arquivo FASTQ
– -e → especifica enzima utilizada na criação de uma
biblioteca GBS (exemplo: ApeKI)
– -o → diretório de saída
21
TASSEL GBS Pipeline
● Exemplo de comando:
– run_pipeline.pl -fork1 -FastToTagCountPlugin -i
fastq -k myGBSProject_key.txt -e ApeKI -o
tagCounts -endPlugin -runfork1
● fastq → faz parte da estrutura de diretórios
● -k → key file
● -e → enzima de restrição (ApeKI)
● -o → saída para o diretório tagCounts
22
TASSEL GBS Pipeline
● Exemplo comando com vários fork's
Run_pipeline.bat -fork1 –h mdp_genotype.hmp.txt -
filterAlign -filterAlignMinFreq 0.05 -fork2 -r
mdp_traits.txt -fork3 -q mdp_population_structure.txt -
excludeLastTrait -fork4 -k mdp_kinship.txt -combine5 -
input1 -input2 -input3 -intersect -combine6 -input5 -
input4 -mlm -export mlm_output_tutorial -runfork1 -
runfork2 -runfork3 -runfork4
23
Enzimas de restrição
● TASSEL-GBS pipeline não se limita às enzimas
de restrição específicas usadas nos protocolos
GBS.
● Novas enzimas podem ser adicionadas:
– Basta solicitar no Google Group
– http://groups.google.com/group/tassel
24
TASSEL GBS Pipeline
● O default de memória é 1.5GB, caso tenha
mais memória, é aconselhável aumentar a
quantidade de memória editando o arquivo
run_pipeline.pl
● Ou passando por argumento:
– run_pipeline.pl -Xmx6g (...)
25
TASSEL GBS Pipeline
● O primeiro passo do pipeline requer pelo
menos 6G.
● Recomendável 16G
26
TASSEL GBS Pipeline
● Muitos dos comandos produzem uma saída
enorme no console
● Pode ser útil redirecionar a saída para um
arquivo
● Utiliza-se o comando: | tee log.txt
– run_pipeline.pl (…) | tee log.txt
27
Discovery Pipeline
28
TASSEL GBS Pipeline
● Alguns arquivos (exemplo: TagCounts) estão
em formato binário.
● Para converter para um formato legível:
– BinaryToTextPlugin
● Para arquivos de textos muito grandes:
– Utilizar os comandos head e/ou tail
● head -10 meuArquivo.txt
● Mostra as 10 primeiras linhas de meuArquivo.txt
29
GUI
30
Linha de comando
● Vantagens:
– Pode ser usada a saída de um comando como
entrada de outro comando através de scripts
– Execução em servidor
– Consome menos recursos
31
Referências
● [1]
http://bioinformatics.oxfordjournals.org/content/
23/19/2633.full.pdf
● [2]
http://www.lge.ibi.unicamp.br/lgeextensao2008/
extsup/snps.pdf
● Wiki Tassel:
– https://bitbucket.org/tasseladmin/tassel-5-source/wi
ki/Home

Weitere ähnliche Inhalte

Ähnlich wie TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

Apresentação comsolid 2016
Apresentação comsolid 2016Apresentação comsolid 2016
Apresentação comsolid 2016Laryssa Muniz
 
aula 7de redes de computador de EIGRP.pdf
aula 7de redes de computador de EIGRP.pdfaula 7de redes de computador de EIGRP.pdf
aula 7de redes de computador de EIGRP.pdfDanielMiguelGolome
 
PostgreSQL: O melhor banco de dados Universo
PostgreSQL: O melhor banco de dados UniversoPostgreSQL: O melhor banco de dados Universo
PostgreSQL: O melhor banco de dados Universoelliando dias
 
Capítulo 16 rsyslog
Capítulo 16   rsyslogCapítulo 16   rsyslog
Capítulo 16 rsyslogPaulo Kutwak
 
Java Virtual Threads.pptx
Java Virtual Threads.pptxJava Virtual Threads.pptx
Java Virtual Threads.pptxssuser980608
 
SENAI - Segurança firewall
SENAI - Segurança   firewall SENAI - Segurança   firewall
SENAI - Segurança firewall Carlos Melo
 
OpenLDAP, criando e explorando um overlay
OpenLDAP, criando e explorando um overlayOpenLDAP, criando e explorando um overlay
OpenLDAP, criando e explorando um overlayDiego Santos
 
Open ldap criando e explorando um overlay
Open ldap   criando e explorando um overlayOpen ldap   criando e explorando um overlay
Open ldap criando e explorando um overlayMarcelo Fleury
 
Firewall - Introducao.pdf
Firewall - Introducao.pdfFirewall - Introducao.pdf
Firewall - Introducao.pdfssusere0b5a8
 
CoGrOO 4.0 no FISL 13
CoGrOO 4.0 no FISL 13CoGrOO 4.0 no FISL 13
CoGrOO 4.0 no FISL 13William Colen
 
Sistemas operacionais 14
Sistemas operacionais 14Sistemas operacionais 14
Sistemas operacionais 14Nauber Gois
 
PostgreSQL Tuning: O elefante mais rápido que um leopardo
PostgreSQL Tuning: O elefante mais rápido que um leopardoPostgreSQL Tuning: O elefante mais rápido que um leopardo
PostgreSQL Tuning: O elefante mais rápido que um leopardoelliando dias
 
TP2 - Amplificação do Gene pgmG a partir do DNA Cromossómico de Sphingomonas ...
TP2 - Amplificação do Gene pgmG a partir do DNA Cromossómico de Sphingomonas ...TP2 - Amplificação do Gene pgmG a partir do DNA Cromossómico de Sphingomonas ...
TP2 - Amplificação do Gene pgmG a partir do DNA Cromossómico de Sphingomonas ...Luís Rita
 
Seguranca em Servidores Linux
Seguranca em Servidores LinuxSeguranca em Servidores Linux
Seguranca em Servidores LinuxAlessandro Silva
 
UFPA PPGCC LPRAD 2014-02 - Edinaldo La-Roque - OPNET - Apresentacao do Simula...
UFPA PPGCC LPRAD 2014-02 - Edinaldo La-Roque - OPNET - Apresentacao do Simula...UFPA PPGCC LPRAD 2014-02 - Edinaldo La-Roque - OPNET - Apresentacao do Simula...
UFPA PPGCC LPRAD 2014-02 - Edinaldo La-Roque - OPNET - Apresentacao do Simula...Edinaldo La-Roque
 
Bancos de dados analíticos open source
Bancos de dados analíticos open sourceBancos de dados analíticos open source
Bancos de dados analíticos open sourceMatheus Espanhol
 
Apresentação Sobre Sistemas Operacionais com Orbis OS
Apresentação Sobre Sistemas Operacionais com Orbis OSApresentação Sobre Sistemas Operacionais com Orbis OS
Apresentação Sobre Sistemas Operacionais com Orbis OSLucasNogueira565696
 

Ähnlich wie TASSEL - Trait Analysis by aSSociation, Evolution and Linkage (20)

Apresentação comsolid 2016
Apresentação comsolid 2016Apresentação comsolid 2016
Apresentação comsolid 2016
 
aula 7de redes de computador de EIGRP.pdf
aula 7de redes de computador de EIGRP.pdfaula 7de redes de computador de EIGRP.pdf
aula 7de redes de computador de EIGRP.pdf
 
PostgreSQL: O melhor banco de dados Universo
PostgreSQL: O melhor banco de dados UniversoPostgreSQL: O melhor banco de dados Universo
PostgreSQL: O melhor banco de dados Universo
 
Capítulo 16 rsyslog
Capítulo 16   rsyslogCapítulo 16   rsyslog
Capítulo 16 rsyslog
 
Java Virtual Threads.pptx
Java Virtual Threads.pptxJava Virtual Threads.pptx
Java Virtual Threads.pptx
 
SENAI - Segurança firewall
SENAI - Segurança   firewall SENAI - Segurança   firewall
SENAI - Segurança firewall
 
OpenLDAP, criando e explorando um overlay
OpenLDAP, criando e explorando um overlayOpenLDAP, criando e explorando um overlay
OpenLDAP, criando e explorando um overlay
 
Open ldap criando e explorando um overlay
Open ldap   criando e explorando um overlayOpen ldap   criando e explorando um overlay
Open ldap criando e explorando um overlay
 
Firewall - Introducao.pdf
Firewall - Introducao.pdfFirewall - Introducao.pdf
Firewall - Introducao.pdf
 
CoGrOO 4.0 no FISL 13
CoGrOO 4.0 no FISL 13CoGrOO 4.0 no FISL 13
CoGrOO 4.0 no FISL 13
 
Minicurso Linux
Minicurso Linux Minicurso Linux
Minicurso Linux
 
Primeiros Passos Com Elasticsearch
Primeiros Passos Com ElasticsearchPrimeiros Passos Com Elasticsearch
Primeiros Passos Com Elasticsearch
 
Sistemas operacionais 14
Sistemas operacionais 14Sistemas operacionais 14
Sistemas operacionais 14
 
PostgreSQL Tuning: O elefante mais rápido que um leopardo
PostgreSQL Tuning: O elefante mais rápido que um leopardoPostgreSQL Tuning: O elefante mais rápido que um leopardo
PostgreSQL Tuning: O elefante mais rápido que um leopardo
 
Comando Traceroute
Comando TracerouteComando Traceroute
Comando Traceroute
 
TP2 - Amplificação do Gene pgmG a partir do DNA Cromossómico de Sphingomonas ...
TP2 - Amplificação do Gene pgmG a partir do DNA Cromossómico de Sphingomonas ...TP2 - Amplificação do Gene pgmG a partir do DNA Cromossómico de Sphingomonas ...
TP2 - Amplificação do Gene pgmG a partir do DNA Cromossómico de Sphingomonas ...
 
Seguranca em Servidores Linux
Seguranca em Servidores LinuxSeguranca em Servidores Linux
Seguranca em Servidores Linux
 
UFPA PPGCC LPRAD 2014-02 - Edinaldo La-Roque - OPNET - Apresentacao do Simula...
UFPA PPGCC LPRAD 2014-02 - Edinaldo La-Roque - OPNET - Apresentacao do Simula...UFPA PPGCC LPRAD 2014-02 - Edinaldo La-Roque - OPNET - Apresentacao do Simula...
UFPA PPGCC LPRAD 2014-02 - Edinaldo La-Roque - OPNET - Apresentacao do Simula...
 
Bancos de dados analíticos open source
Bancos de dados analíticos open sourceBancos de dados analíticos open source
Bancos de dados analíticos open source
 
Apresentação Sobre Sistemas Operacionais com Orbis OS
Apresentação Sobre Sistemas Operacionais com Orbis OSApresentação Sobre Sistemas Operacionais com Orbis OS
Apresentação Sobre Sistemas Operacionais com Orbis OS
 

Mehr von Marcos Castro

Árvores de Decisão
Árvores de DecisãoÁrvores de Decisão
Árvores de DecisãoMarcos Castro
 
Colored de Bruijn Graphs
Colored de Bruijn GraphsColored de Bruijn Graphs
Colored de Bruijn GraphsMarcos Castro
 
Maratona de Programação
Maratona de ProgramaçãoMaratona de Programação
Maratona de ProgramaçãoMarcos Castro
 
Ferramentas para Bioinformática
Ferramentas para BioinformáticaFerramentas para Bioinformática
Ferramentas para BioinformáticaMarcos Castro
 
A importância da Bioinformática
A importância da BioinformáticaA importância da Bioinformática
A importância da BioinformáticaMarcos Castro
 
Redes Neurais Artificiais
Redes Neurais ArtificiaisRedes Neurais Artificiais
Redes Neurais ArtificiaisMarcos Castro
 
Problema do Caixeiro Viajante
Problema do Caixeiro ViajanteProblema do Caixeiro Viajante
Problema do Caixeiro ViajanteMarcos Castro
 
Metaheurística Simulated Annealing
Metaheurística Simulated AnnealingMetaheurística Simulated Annealing
Metaheurística Simulated AnnealingMarcos Castro
 
Expressões Regulares com Python 3
Expressões Regulares com Python 3Expressões Regulares com Python 3
Expressões Regulares com Python 3Marcos Castro
 
Programação dinâmica
Programação dinâmicaProgramação dinâmica
Programação dinâmicaMarcos Castro
 
Busca em largura - BFS
Busca em largura - BFSBusca em largura - BFS
Busca em largura - BFSMarcos Castro
 
Análise Assintótica
Análise AssintóticaAnálise Assintótica
Análise AssintóticaMarcos Castro
 
Listas, tuplas, conjuntos e dicionários
Listas, tuplas, conjuntos e dicionáriosListas, tuplas, conjuntos e dicionários
Listas, tuplas, conjuntos e dicionáriosMarcos Castro
 
Python - Dicionários
Python - DicionáriosPython - Dicionários
Python - DicionáriosMarcos Castro
 

Mehr von Marcos Castro (20)

Árvores de Decisão
Árvores de DecisãoÁrvores de Decisão
Árvores de Decisão
 
Colored de Bruijn Graphs
Colored de Bruijn GraphsColored de Bruijn Graphs
Colored de Bruijn Graphs
 
Maratona de Programação
Maratona de ProgramaçãoMaratona de Programação
Maratona de Programação
 
Bioinformática
BioinformáticaBioinformática
Bioinformática
 
Arquivos FASTQ
Arquivos FASTQArquivos FASTQ
Arquivos FASTQ
 
Ferramentas para Bioinformática
Ferramentas para BioinformáticaFerramentas para Bioinformática
Ferramentas para Bioinformática
 
A importância da Bioinformática
A importância da BioinformáticaA importância da Bioinformática
A importância da Bioinformática
 
Bioinformática
BioinformáticaBioinformática
Bioinformática
 
Redes Neurais Artificiais
Redes Neurais ArtificiaisRedes Neurais Artificiais
Redes Neurais Artificiais
 
Problema do Caixeiro Viajante
Problema do Caixeiro ViajanteProblema do Caixeiro Viajante
Problema do Caixeiro Viajante
 
Metaheurística Simulated Annealing
Metaheurística Simulated AnnealingMetaheurística Simulated Annealing
Metaheurística Simulated Annealing
 
Expressões Regulares com Python 3
Expressões Regulares com Python 3Expressões Regulares com Python 3
Expressões Regulares com Python 3
 
Algoritmos gulosos
Algoritmos gulososAlgoritmos gulosos
Algoritmos gulosos
 
Programação dinâmica
Programação dinâmicaProgramação dinâmica
Programação dinâmica
 
Busca em largura - BFS
Busca em largura - BFSBusca em largura - BFS
Busca em largura - BFS
 
Análise Assintótica
Análise AssintóticaAnálise Assintótica
Análise Assintótica
 
Listas, tuplas, conjuntos e dicionários
Listas, tuplas, conjuntos e dicionáriosListas, tuplas, conjuntos e dicionários
Listas, tuplas, conjuntos e dicionários
 
Python - Set
Python - SetPython - Set
Python - Set
 
Python - Dicionários
Python - DicionáriosPython - Dicionários
Python - Dicionários
 
Tabela Hash
Tabela HashTabela Hash
Tabela Hash
 

TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

  • 1. 1 TASSEL Trait Analysis by aSSociation, Evolution and Linkage
  • 2. 2 Mapeamento por associação ● Software para o mapeamento por associação de traços (características) complexos [1].
  • 3. 3 Conceitos ● Mapeamento por associação – Método para mapear QTLs ● QLT (quantitative trait loci) – Expressão de caracteres fenotípicos – Caracteres quantitativos ● Vários genes ● Distribuição contínua ● Quantidades: peso, altura etc.
  • 4. 4 Estudo de associação ● Identificar associações entre o fenótipo e um ou mais marcadores genéticos ● Marcador genético – Diferenças entre indivíduos – Detectar QTLs – Exemplo: SNPs
  • 5. 5 SNPs ● Single Nucleotide Polymosphisms ● Grande abundância – A cada 300 ~ 600 nucleotídeos [2] ● Tecnologias de genotipagem ● Mutações que se propagaram ao longo de gerações
  • 7. 7 TASSEL - Instalação ● http://www.maizegenetics.net/tassel
  • 8. 8 TASSEL - Instalação ● Recomendável via git – https://git-scm.com/downloads ● Para copiar o projeto: – git clone <endereço da versão> ● Para atualizações: – git pull
  • 9. 9 TASSEL Pipeline ● Consiste em módulos (plugins) ● Saída de um módulo pode ser utilizada como entrada para outro módulo
  • 10. 10 Termos importantes ● Sequence File: arquivo texto com uma sequência de DNA e informações adicionais da plataforma Illumina. ● Taxa: amostra individual ● Key File: arquivo texto usado para atribuir um GBS Bar Code para uma Taxa ● GBS Tag: sequência DNA
  • 11. 11 Arquivos de teste ● Download de arquivos de testes: – http://mirrors.iplantcollaborative.org/browse/iplan t/home/shared/panzea/tassel/GBSTestData.tar ● Pasta GBS – Pipeline_Testing_key.txt → key file
  • 12. 12 Tassel GBS Pipeline ● 3 pipelines – Discovery Pipeline (genoma de referência) ● Vários passos – Production Pipeline ● Utiliza informação do Discovery Pipeline ● Um passo – UNEAK (sem um genoma de referência)
  • 13. 13 Estrutura de diretórios ● É necessária uma estrutura de diretórios – ./fastq – ./tagCounts – ./mergedTagCounts – (…) ● Exemplo: o plugin FastqToTagCountPlugin redireciona sua saída para o diretório tagCounts.
  • 14. 14 Discovery Pipeline ● Genoma de referência ● Na pasta GBS (arquivos de teste) possui um genoma de referência: – ZmB73_RefGen_(...)
  • 15. 15 Discovery Pipeline ● Execução por linha de comando através de um script em Perl que se comunica com a aplicação Java ● Sintaxe: – run_pipeline.pl -fork1 -PluginName –plugin-option(s) -endPlugin -runfork1 ● TASSEL pode rodar vários processos de uma vez, combinar resultados etc.
  • 16. 16 TASSEL GBS Pipeline ● Sintaxe: – run_pipeline.pl -fork1 -PluginName –plugin-option(s) -endPlugin -runfork1 ● Em máquinas Windows sem o Perl instalado, pode-se utilizar o “run_pipeline.bat” ● Cada passo do pipeline é especificado com um comando “-fork” e um número
  • 17. 17 TASSEL GBS Pipeline ● Sintaxe: – run_pipeline.pl -fork1 -PluginName –plugin-option(s) -endPlugin -runfork1 ● O “fork” é seguido pelo nome do plugin e as opções do plugin. ● “-endPlugin” sinaliza o final das opções. ● “-runfork1” executa o plugin especificado.
  • 18. 18 TASSEL GBS Pipeline ● Sintaxe: – run_pipeline.pl -fork1 -PluginName –plugin-option(s) -endPlugin -runfork1 ● Caso você chame o plugin sem argumento algum, então serão impressas suas opções/argumentos.
  • 20. 20 TASSEL GBS Pipeline ● Exemplos de argumentos para o plugin FastqToTagCountPlugin – -i → especifica o diretório de entrada contendo arquivo FASTQ – -e → especifica enzima utilizada na criação de uma biblioteca GBS (exemplo: ApeKI) – -o → diretório de saída
  • 21. 21 TASSEL GBS Pipeline ● Exemplo de comando: – run_pipeline.pl -fork1 -FastToTagCountPlugin -i fastq -k myGBSProject_key.txt -e ApeKI -o tagCounts -endPlugin -runfork1 ● fastq → faz parte da estrutura de diretórios ● -k → key file ● -e → enzima de restrição (ApeKI) ● -o → saída para o diretório tagCounts
  • 22. 22 TASSEL GBS Pipeline ● Exemplo comando com vários fork's Run_pipeline.bat -fork1 –h mdp_genotype.hmp.txt - filterAlign -filterAlignMinFreq 0.05 -fork2 -r mdp_traits.txt -fork3 -q mdp_population_structure.txt - excludeLastTrait -fork4 -k mdp_kinship.txt -combine5 - input1 -input2 -input3 -intersect -combine6 -input5 - input4 -mlm -export mlm_output_tutorial -runfork1 - runfork2 -runfork3 -runfork4
  • 23. 23 Enzimas de restrição ● TASSEL-GBS pipeline não se limita às enzimas de restrição específicas usadas nos protocolos GBS. ● Novas enzimas podem ser adicionadas: – Basta solicitar no Google Group – http://groups.google.com/group/tassel
  • 24. 24 TASSEL GBS Pipeline ● O default de memória é 1.5GB, caso tenha mais memória, é aconselhável aumentar a quantidade de memória editando o arquivo run_pipeline.pl ● Ou passando por argumento: – run_pipeline.pl -Xmx6g (...)
  • 25. 25 TASSEL GBS Pipeline ● O primeiro passo do pipeline requer pelo menos 6G. ● Recomendável 16G
  • 26. 26 TASSEL GBS Pipeline ● Muitos dos comandos produzem uma saída enorme no console ● Pode ser útil redirecionar a saída para um arquivo ● Utiliza-se o comando: | tee log.txt – run_pipeline.pl (…) | tee log.txt
  • 28. 28 TASSEL GBS Pipeline ● Alguns arquivos (exemplo: TagCounts) estão em formato binário. ● Para converter para um formato legível: – BinaryToTextPlugin ● Para arquivos de textos muito grandes: – Utilizar os comandos head e/ou tail ● head -10 meuArquivo.txt ● Mostra as 10 primeiras linhas de meuArquivo.txt
  • 30. 30 Linha de comando ● Vantagens: – Pode ser usada a saída de um comando como entrada de outro comando através de scripts – Execução em servidor – Consome menos recursos