Os arquivos FASTQ armazenam sequências de DNA e informações de qualidade do sequenciamento. Dois formatos comuns são FASTA e FASTQ, sendo que FASTQ contém scores de qualidade ausentes em FASTA. Arquivos FASTQ possuem quatro linhas para cada sequência: identificador, sequência, identificador repetido e valores de qualidade.
2. Arquivos FASTQ
• Existem vários formatos de arquivos em Bioinformática.
• São nesses arquivos que as sequências são armazenadas.
• Dois formatos são muito comuns em Bioinformática: FASTA e FASTQ.
• Exemplo de arquivo FASTA:
3. Arquivos FASTQ
• Arquivos no formato FASTQ também são muito populares.
• As máquina sequenciadores fornecem os arquivos no formato FASTQ.
• Exemplo de máquina sequenciadora: Illumina.
• O FASTQ é parecido com o FASTA, mas contém informações adicionais
em relação à qualidade do sequenciamento.
8. Arquivos FASTQ
• Na linha 3 temos o caractere “+”, é opcionalmente seguido pelo
mesmo identificador da sequência novamente.
9. Arquivos FASTQ
• A linha 4 contém os valores de qualidade da sequência da linha 2.
• A quarta linha representa os valores de qualidade.
• A qualidade tem o mesmo tamanho da sequência.
• No FASTQ, a linha da sequência é uma só.
10. Arquivos FASTQ
• Que tal converter FASTQ para FASTA?
• A lib Biopython te ajuda
• Curso de Bioinformática:
https://www.udemy.com/curso-de-bioinformatica-com-biopython/