8
ответов

Преобразование FASTQ к FASTA с SED/AWK

У меня есть данные в том, всегда прибывает в блок четыре в следующем формате (названный FASTQ): @SRR018006.2016 GA2:6:1:20:650 length=36 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGN +SRR018006.2016 GA2:6:1:20:...
вопрос задан: 12 December 2018 11:29
2
ответа

Есть ли способ заменить все вхождения определенных символов, но только в каждой n-й строке?

Я пытаюсь заменить все символы, которые не являются C, T, A или G, на N в части последовательности файла fasta - т.е. каждую 2-ю строку я думаю, что некоторая комбинация awk и tr нужна мне ...
вопрос задан: 25 March 2019 15:44
2
ответа

Perl с извлечением последовательности FASTA имеет проблемы (только) с первой последовательностью

Я использую функцию / подпрограмму extract_seq, доступную в Интернете, для извлечения последовательностей в файлах FASTA. Вкратце: последовательность начинается с первой строки, обозначенной символом «>», за которой следует идентификатор и другие ...
вопрос задан: 17 January 2019 08:04
2
ответа

обработка файла multiFASTA

Мне было любопытно знать, существует ли какой-либо инструмент биоинформатики, который там в состоянии обработать multiFASTA файл, дающий мне infos как количество последовательностей, длины, содержания нуклеотида/аминокислоты, и т.д. и возможно...
вопрос задан: 27 January 2016 21:04
0
ответов

игра в хаос для последовательностей ДНК

Я попробовал математический код для создания игры в хаос для последовательностей ДНК, размещенной по этому адресу: http: // facstaff .unca.edu / mcmcclur / blog / GeneCGR.html, который выглядит следующим образом: genome = Import ["c: \ data \ ...
вопрос задан: 22 October 2012 21:36
0
ответов

Написание файлов fasta с использованием пакета R seqinr?

Когда я использую write.fasta в seqinr, файл, который он выводит, выглядит следующим образом :> Имя последовательности 1 > Имя последовательности 2 > Имя последовательности 3... и т. д. Последовательность 1 Последовательность 2 Последовательность 3... и т
вопрос задан: 6 August 2012 00:00
0
ответов

Использование realloc для расширения буфера при чтении из файла приводит к сбою

Я пишу код, который должен читать файлы fasta, поэтому часть моего кода (включенного ниже) является парсером fasta. Поскольку одна последовательность может занимать несколько строк в формате fasta, мне нужно конкатенировать ...
вопрос задан: 23 January 2012 14:26
0
ответов

Объяснение алгоритма FASTA

Я пытаюсь понять основные шаги алгоритма FASTA при поиске похожих последовательностей последовательности запросов в базе данных. Это шаги алгоритма: Определить общие k-слова между I ...
вопрос задан: 5 December 2011 20:56
0
ответов

синтаксический анализ файла fasta с помощью генератора (python)

Я пытаюсь проанализировать большой файл fasta, и у меня возникают ошибки нехватки памяти. Будем признательны за некоторые предложения по улучшению обработки данных. В настоящее время программа правильно распечатывает ...
вопрос задан: 5 October 2011 01:21
0
ответов

Эффективные методы буферизации и сканирования больших файлов на Python

Описание проблема, с которой я столкнулся, немного сложна, и я сделаю ошибку, предоставив более полную информацию. Для нетерпеливых вот самый краткий способ резюмировать это: ...
вопрос задан: 11 March 2011 14:06