обработка файла multiFASTA

Таблицы имеют смысл только, когда Вы пытаетесь отобразить табличные данные и вот именно. Для разметок необходимо всегда использовать ОТДЕЛЕНИЯ и играть с расположениями CSS.

7
задан Kevin 27 January 2016 в 21:04
поделиться

2 ответа

Некоторые инструменты тиснения представляют собой набор небольших инструментов, которые могут вам помочь.

  • seqstats возвращает длину последовательности
  • pepstats должен предоставить вам содержание аминокислот и т. Д. . Некоторые инструменты также предлагают функции построения графиков. Очень удобно. http://emboss.sourceforge.net/apps/release/5.0/emboss/apps/groups.html

Для подсчета количества записей fasta я использую: grep -c '^>' mySequences.fasta .

Чтобы убедиться, что ни одна из записей не повторяется, я проверяю, получаю ли я тот же номер при выполнении этого: grep '^>' mySequences.fasta | сортировать | uniq | wc -l

7
ответ дан 7 December 2019 в 03:17
поделиться

Вы также можете быть заинтересованы в Fasize , который является инструментом из дерева источника , хотя это требует немного усилий (вы должны dload и compile), чем просто используя grep ... вот какой-то пример вывода:

me@my-lab ~/data $ time faSize myfile.fna
215400419 bases (104761 N's 215295658 real 215295658 upper 0 lower) in 731620 sequences in 1 files
Total size: mean 294.4 sd 138.5 min 30 (F5854LK02GG895) max 1623 (F5854LK01AHBEH) median 307
N count: mean 0.1 sd 0.4
U count: mean 294.3 sd 138.5
L count: mean 0.0 sd 0.0
%0.00 masked total, %0.00 masked real

real    0m3.710s
user    0m3.541s
sys     0m0.164s
2
ответ дан 7 December 2019 в 03:17
поделиться
Другие вопросы по тегам:

Похожие вопросы: