Выборка геномной последовательности эффективно в Python?

Как я могу выбрать геномную последовательность эффективно с помощью Python? Например, из .fa файла или некоторого другого легко полученного формата? Я в основном хочу интерфейс fetch_seq (chrom, скрутка, запустите, конец), который возвратится, последовательность [запускаются, конец] на данной хромосоме на указанной скрутке.

Аналогично, существует ли программный интерфейс Python для получения phastCons очки?

спасибо.

6
задан 7 July 2010 в 03:48
поделиться

2 ответа

См. мой ответ на ваш вопрос на сайте Biostar:

http://biostar.stackexchange.com/questions/1639/getting-genomic-sequences-and-phastcons-scores-using-python-from-ensembl-ucsc

Используйте SeqIO с файлами Fasta, и вы получите обратно объекты записи для каждого элемента в файле. Затем вы можете сделать:

region = rec.seq[start:end]

для извлечения фрагментов. Приятным моментом в использовании стандартной библиотеки является то, что вам не нужно беспокоиться о переносах строк в исходном файле fasta.

3
ответ дан 16 December 2019 в 21:33
поделиться

Посмотрите на biopython, который поддерживает несколько форматов генных последовательностей. В частности, он поддерживает файлы FASTA и GenBank, и это лишь некоторые из них.

1
ответ дан 16 December 2019 в 21:33
поделиться
Другие вопросы по тегам:

Похожие вопросы: