Как я могу выбрать геномную последовательность эффективно с помощью Python? Например, из .fa файла или некоторого другого легко полученного формата? Я в основном хочу интерфейс fetch_seq (chrom, скрутка, запустите, конец), который возвратится, последовательность [запускаются, конец] на данной хромосоме на указанной скрутке.
Аналогично, существует ли программный интерфейс Python для получения phastCons очки?
спасибо.
См. мой ответ на ваш вопрос на сайте Biostar:
Используйте SeqIO с файлами Fasta, и вы получите обратно объекты записи для каждого элемента в файле. Затем вы можете сделать:
region = rec.seq[start:end]
для извлечения фрагментов. Приятным моментом в использовании стандартной библиотеки является то, что вам не нужно беспокоиться о переносах строк в исходном файле fasta.
Посмотрите на biopython, который поддерживает несколько форматов генных последовательностей. В частности, он поддерживает файлы FASTA и GenBank, и это лишь некоторые из них.