15
ответов

Поощрение хороших методов разработки для непрофессиональных программистов? [закрытый]

В мое обильное свободное время я сотрудничаю со многими учеными (главным образом биологи), кто разрабатывает программное обеспечение, базы данных и другие инструменты, связанные с работой, которую они делают. Обычно эти проекты разрабатываются...
вопрос задан: 16 January 2016 19:11
11
ответов

Удалить элемент из списка на основе следующего элемента в том же списке

Я только начал изучать питон, и здесь у меня есть отсортированный список белковых последовательностей (всего 59 000 последовательностей), а некоторые из них перекрываются. Например, я сделал список игрушек: ABCDE ABCDEFG ABCDEFGH ...
вопрос задан: 14 July 2018 00:18
10
ответов

Как использовать stdin в R [duplicate]

У меня есть сценарий R, который я пытаюсь выполнить в сценарии bash, но я не уверен, как сделать два совместимых моего R-скрипта (seq_trimming.R): #! / Usr / bin / Rscript input & lt; - file ('stdin ',' r ') row & lt; - ...
вопрос задан: 28 January 2010 00:40
10
ответов

Есть ли какие-либо существующие решения для создания универсальной базы данных последовательности DNA с фронтэндом веб-сайта?

Я хотел бы создать базу данных последовательности rRNA с веб-фронтэндом для лаборатории, в которой я работаю. Кажется распространенным в биологии хотеть искать большое количество последовательностей с помощью алгоритмов выравнивания такой как...
вопрос задан: 12 December 2009 17:09
8
ответов

Почему Perl используется так экстенсивно в исследовании биологии? [закрытый]

Я работаю персоналом поддержки в научно-исследовательском институте биологии как студент, и Perl, кажется, используется везде. Не для каждого проекта, но кажется, что больше чем у половины людей здесь есть некоторые...
вопрос задан: 16 January 2016 15:55
7
ответов

Что лучший способ состоит в том, чтобы разделить большие файлы на Python для многопроцессорной обработки?

Я натыкаюсь на большое количество "смущающе параллельных" проектов, которые я хотел бы параллелизировать с многопроцессорным модулем. Однако они часто вовлекают чтение в огромные файлы (больше, чем 2 ГБ), обрабатывая их...
вопрос задан: 23 May 2017 12:26
7
ответов

Clojure или Scala для биоинформатики / биостатистики / медицинских исследований [закрыто]

Я не профессиональный программист (моя область - медицинские исследования), но Я хорошо владею C / C ++, и различные языки сценариев. Некоторое время назад я был заинтригован Лиспом, но у меня не было времени ...
вопрос задан: 26 January 2016 23:05
7
ответов

Выполнение BLAST/SmithWaterman ищет непосредственно из моего приложения

Я работаю над небольшим приложением и думаю об интеграции BLAST или других локальных поисков выравнивания в мое приложение. Мой поиск только поднял программы, которые должны быть установлены и...
вопрос задан: 20 March 2012 14:11
7
ответов

Нахождение соответствия ключам в двух больших словарях и выполнении его быстро

Я пытаюсь найти соответствующие ключи в двух различных словарях. Каждый имеет о 600k записях. Скажите, например: myRDP = {'Actinobacter': 'GATCGA... TCA', 'subtilus SP'.: 'ATCGATT... ACT'}...
вопрос задан: 23 August 2009 00:27
6
ответов

Как я изменяю это на “идиоматический” Perl?

Я начинаю копаться глубже в Perl, но испытываю затруднения при писании кода "Perl-ly" вместо того, чтобы писать C в Perl. Как я могу изменить следующий код для использования большего количества идиом Perl, и как я должен пойти...
вопрос задан: 2 June 2013 18:55
6
ответов

ресурсы биоинформатики [закрываются]

Когда о программировании, у нас бесспорный есть некоторые блоги для следования, но когда взгляды для попытки другого поля, как можно найти знаменитостей? Я хочу попробовать bioinfrmatics поле и добавить в мой...
вопрос задан: 13 January 2010 06:58
5
ответов

Генерация синтетического продукта последовательность DNA с уровнем замены

Учитывая эти исходные данные: мой $init_seq = "AAAAAAAAAA" #length 10 bp мой $sub_rate = 0.003; мой $nof_tags = 1000; мой @dna = QW (C G T); я хочу генерировать: Одна тысяча длин 10 Замен тегов...
вопрос задан: 30 July 2018 01:39
5
ответов

Изменение оси X seqlogo фигурирует в MATLAB

Я делаю большое количество seqlogos программно. Они - сотни широких столбцов, и настолько рабочий seqlogo обычно создает буквы, которые являются слишком тонкими для наблюдения. Я заметил, что только забочусь...
вопрос задан: 27 February 2015 08:30
5
ответов

То, что Вы думаете, является лучшим языком для Биоинформатики? [закрытый]

Я сделал пару исследовательских работ в Биоинформатике, и я использовал Matlab для них. Matlab имел много мощных инструментов и был прост в использовании. Я сделал думает с упорядочиванием генома и предсказанием...
вопрос задан: 8 June 2010 00:38
5
ответов

R оптимизация: Как я могу избежать для цикла в этой ситуации?

Я пытаюсь сделать простое геномное пересечение дорожки в R и сталкиваюсь с главными проблемами производительности, вероятно, связанными с моим использованием для циклов. В этой ситуации я предопределил окна в...
вопрос задан: 25 March 2010 17:23
5
ответов

рабочий BLAST (bl2seq), не создавая файлы последовательности

У меня есть сценарий, который выполняет запросы BLAST (bl2seq) работы сценария как это: Получите последовательность a, упорядочьте последовательность записи b к b последовательности записи filea к fileb команде выполнения 'bl2seq-i...
вопрос задан: 11 February 2010 21:55
5
ответов

Какие языки функционального программирования имеют библиотеки биоинформатики? [закрытый]

Какие языки функционального программирования имеют легко доступные библиотеки биоинформатики? (Не включайте языки мультипарадигмы, такие как Ruby), Обновление: Список, который основное функциональное программирование...
вопрос задан: 5 December 2009 00:01
4
ответа

Запросы служебных книжек DNS для нахождения имени хоста и TCP/IP

В газете об Идентификаторах Науки о жизни (см. Тестер LSID, инструмент для тестирования сервисов разрешения Идентификатора Науки о жизни), доктор Roderic DM записал Page: Учитывая LSID urn:lsid **:ubio.org **:...
вопрос задан: 21 April 2016 09:36
4
ответа

Как создать матрицу дизайна для идентификации дифференцированных метилированных областей между двумя наборами образцов? [Дубликат]

& GT; head (ICGC_2) наивный.1 памятьCS.1 наивный.2 памятьCS.2 наивный.3 памятьCS.3 cg00000029 0.6199970 0.5703951 0.6383819 0.5831206 0.7012571 0.6000816 cg00000108 0.9083578 ...
вопрос задан: 30 March 2013 21:59
4
ответа

Более быстрый способ разделить строку и символы количества с помощью R?

Я ищу более быстрый способ вычислить содержание GC для строкового чтения DNA в из файла FASTA. Это сводится к взятию строки и подсчету количества раз, что буква 'G' или 'C' появляется...
вопрос задан: 15 March 2010 17:22
4
ответа

Python, огромная итеративная проблема выполнения

Я делаю повторение через 3 слова, каждый приблизительно 5 миллионов символов в длину, и я хочу найти последовательности 20 символов, который определяет каждое слово. Таким образом, я хочу найти все последовательности длины...
вопрос задан: 21 December 2009 19:12
4
ответа

Существует ли регулярное выражение для ферментативного расщепления?

Существует ли регулярное выражение для (теоретического) триптического расщепления белковых последовательностей? Правило расщепления для трипсина: после R или K, но не перед P. Пример: расщепление последовательности ...
вопрос задан: 5 December 2009 23:56
3
ответа

Как я могу найти несколько мотивов (подстрока) в последовательности белка (строка)?

Следующий сценарий для нахождения одного мотива в последовательности белка. используйте строгий; используйте предупреждения; мой @file_data = (); мой $protein_seq = ''; мой $h =' [VLIM]'; мой $s =' [AG]'; мой $x =' [ARNDCEQGHILKMFPSTWYV]';...
вопрос задан: 23 February 2010 22:24
3
ответа

Как я могу говорить с UniProt по HTTP в Python?

Я пытаюсь получить некоторые результаты UniProt, который является базой данных белка (детали не важны). Я пытаюсь использовать некоторый сценарий, который переводит из одного вида идентификатора другому. Я смог сделать...
вопрос задан: 1 May 2009 05:49
2
ответа

Python для определения минимальных хромосомных областей среди образцов

У меня есть несколько файлов примеров (> 20), которые выглядят так: chr startpos endpos 1 14930 818094 1 818161 31595422 2 35593931 35865807 2 35868158 104785784 И я хотел бы вывести ...
вопрос задан: 18 March 2019 14:35
2
ответа

Разобрать DNAstringsSets в нормальные строки

Это происходит из библиотеки R с именем "VariantAnnotation" и ее зависимости "Biostrings". У меня есть DNAstringsSetList и я хочу преобразовать его в обычный список или вектор строк. библиотека(...
вопрос задан: 16 January 2019 14:25
2
ответа

обработка файла multiFASTA

Мне было любопытно знать, существует ли какой-либо инструмент биоинформатики, который там в состоянии обработать multiFASTA файл, дающий мне infos как количество последовательностей, длины, содержания нуклеотида/аминокислоты, и т.д. и возможно...
вопрос задан: 27 January 2016 21:04
2
ответа

Какая лучшая книга по биоинформатике для программиста? [закрыто]

Я аспирант, интересующийся исследованиями в области биоинформатики. У меня нет хорошего опыта работы с биологией. Какая лучшая книга по биоинформатике для программиста?
вопрос задан: 25 December 2013 22:11
2
ответа

Как извлечь первые элементы хита из файла BLAST XML NCBI?

Я пытаюсь извлечь только первый хит из NCBI xml файл BLAST. затем я хотел бы получить только первый HSP. в заключительном этапе я хотел бы получить их на основе лучшего счета. ясно дать понять вещи...
вопрос задан: 27 May 2011 06:35
2
ответа

Выборка геномной последовательности эффективно в Python?

Как я могу выбрать геномную последовательность эффективно с помощью Python? Например, из .fa файла или некоторого другого легко полученного формата? Я в основном хочу интерфейс fetch_seq (chrom, скрутка, запустите, конец), который...
вопрос задан: 7 July 2010 03:48