2
ответа

решения для Python для управления графом зависимостей научных данных значениями спецификации

У меня есть проблема управления научных данных, которая кажется общей, но я не могу найти существующее решение или даже описание его, над которым я долго ломал голову. Я собираюсь начать главный...
вопрос задан: 19 June 2010 19:34
2
ответа

Совершенствование данных, хранивших в SQLite - как присоединиться к нескольким контактам?

Я храню контакты между различными элементами. Я хочу устранить элементы определенного типа и сохранить новые контакты элементов, которые были взаимосвязаны устраненным элементом. Проблема...
вопрос задан: 25 May 2010 20:28
2
ответа

кластерные короткие, гомогенные строки (DNA) согласно общим подшаблонам и согласию извлечения классов

Задача: кластеризировать большой бассейн коротких фрагментов DNA в классах, которые совместно используют общий sub-sequence-patterns и находят последовательность согласия каждого класса. Пул: приблизительно 300 фрагментов последовательности 8 - 20...
вопрос задан: 2 October 2009 12:50
1
ответ

Bio.Motifs выбрасывает KeyError 'd'

Я использую Biopython для обработки некоторых данных NGS. Но я сталкиваюсь со странной проблемой, когда использую модуль мотивов в Biopython. Вот код frame = pd.DataFrame ({'Spacer': seqs1.values ​​()}, index = seqs.keys ()) ...
вопрос задан: 22 March 2019 10:17
1
ответ

Создание рабочего процесса с динамическим вводом без использования устаревшего динамического API

Я хотел бы создать рабочий процесс, который загружает список некоторых файлов FASTQ с удаленного сервера, проверяет md5 и выполняет некоторую постобработку, например, выравнивая. Я понимаю, как реализовать это с помощью двух ...
вопрос задан: 18 January 2019 12:33
1
ответ

Получите все возможные перестановки последовательности ДНК с неоднозначным основанием R

Допустим, у меня есть последовательность ДНК с неоднозначным основанием, N, где N может представлять любое основание (это гибкое положение). dna.seq < - 'ATGCN' Я хочу вектор каждой возможной последовательности ДНК, которая могла бы ...
вопрос задан: 15 January 2019 18:32
1
ответ

Ошибка в применении (matt1, 2, медиана): dim (X) должен иметь положительную длину [дубликат]

Я работал над следующей проблемой за последний час, посмотрел на несколько бывших должностей на SO и все равно, не повезло. Итак, у меня есть матрица mat_allFC с NCOL = 17 и NROW = 14,000, где каждый ...
вопрос задан: 27 May 2016 19:43
1
ответ

Как вы используете Ruby on Rails в научных целях (если применимо)?

Мы проводим исследования в области системной биологии. Мы предпочитаем использовать существующие наборы данных, потому что сбор новых биологических данных стоит дорого. Таким образом, многие сценарии, которые мы пишем, представляют собой не более чем пре
вопрос задан: 20 March 2012 14:07
1
ответ

Потяните цветную сферу из декартовых координат в pymol

Я смотрел в Wiki, как преобразовать следующую информацию о бусинках, декартовы координаты + энергия: 23.4 54.6 12.3 - 123.5 54.5 23.1 9.45 - 56.7....... к ничьей в pymol, который содержит...
вопрос задан: 13 January 2010 21:58
0
ответов

Как вычесть строки в Python

По сути, если у меня есть строка «AJ» и другая строка «AJYF», я бы хотел написать «AJYF» - «AJ» и получить «YF». Я попробовал это, но получил синтаксическую ошибку. Просто на боковой ноте вычитатель будет ...
вопрос задан: 29 September 2019 02:18
0
ответов

В чем разница между динамическим преобразованием времени и алгоритмом Нидлмана-Вунша?

Я ищу различия между динамическим преобразованием времени и алгоритмом Нидлмана-Вунша. По сути, они оба находят общий балл. Мне нужно вычислить оценку совпадения (сходства) между ...
вопрос задан: 5 August 2019 11:40
0
ответов

Несколько запросов к серверу и запись в файл без ожидания ответа

Я делаю программу прогнозирования белка, основанную на геномных данных, и в какой-то момент мне нужно отправить несколько запросов на сервер и записать результаты в файл. У меня есть около 100 запросов и файл записи ...
вопрос задан: 29 March 2019 13:22
0
ответов

ValueError: X имеет 2 функции на выборку; ожидая 10

Здравствуйте, я новичок в кодировании и должен сделать анализ генов для моего класса биоинформатики. Когда я классифицирую некоторые гены. Я получаю следующую ошибку: Файл "C: \ Users \ arthi \ Anaconda3 \ lib \ site-packages \ ...
вопрос задан: 18 March 2019 00:56
0
ответов

Snakemake отказывается распаковывать функцию ввода, когда правило A является зависимостью от правила B, но принимает ее, когда правило A является последним правилом.

У меня есть рабочий процесс создания змей для проекта метагеномики. В какой-то момент в рабочем процессе я сопоставляю считывания последовательности ДНК (одно- или парные) со сборками метагенома, созданными одним и тем же рабочим процессом. Я сделал ...
вопрос задан: 5 March 2019 16:45
0
ответов

Скрытая марковская модель для трехсторонних игральных костей

Меня учили HMM и давали эту домашнюю задачу. Отчасти я понял, но не уверен, что это правильно. Проблема в следующем: представьте себе другую игру, в которой дилер не подбрасывает монету ...
вопрос задан: 25 February 2019 12:22
0
ответов

Какой объем памяти потребуется для хранения генома человека?

Я ищу объем памяти в байтах (МБ, ГБ, ТБ и т.д.), необходимый для хранения одного генома человека. Я прочитал несколько статей в Википедии о ДНК, хромосомах, парах оснований, генах и имею некоторые...
вопрос задан: 3 February 2019 15:06
0
ответов

Как сделать DataFrame для панд из списка интерфейсов PISA

Я пытаюсь создать DataFrame в пандах со страницы результатов интерфейса на сервере PISA. После нажатия кнопки LaunchPDBePisa, я нажимаю кнопку Интерфейсы, чтобы получить страницу с таблицей ...
вопрос задан: 19 January 2019 23:21
0
ответов

Алгоритм для размещения сетки поверх неупорядоченного набора точек

Учитывая большой набор (от десятков тысяч до миллионов) неупорядоченных точек, представленных в виде трехмерных декартовых векторов, какой алгоритм является хорошим для создания регулярной квадратной сетки (из определяемый пользователем интервал), которы
вопрос задан: 9 November 2018 23:10
0
ответов

Как кешировать чтения?

Я использую python / pysam для анализа данных секвенирования. В своем руководстве (pysam - интерфейс для чтения и записи файлов SAM) для помощника по команде говорится: «Этот метод слишком медленный для высокого ...
вопрос задан: 14 February 2018 07:53
0
ответов

Удалить часть строки после «.»

Я работаю с инвентарными номерами эталонной последовательности NCBI, такими как переменная a: a <- c("NM_020506.1","NM_020519.1","NM_001030297.2","NM_010281.2","NM_011419.3" , "NM_053155.2") Чтобы получить информацию...
вопрос задан: 14 February 2018 07:31
0
ответов

Нахождение перекрытия в диапазонах с R

У меня есть два data.frames каждый с тремя столбцами: chrom, start & stop, давайте назовем их rangeA и rangeB. Для каждой строки диапазонов A я ищу, чтобы найти (если таковые имеются) строки в rangeB полностью ...
вопрос задан: 11 January 2018 13:02
0
ответов

Примеры топологической сортировки на больших группах DAG

Я ищу приложения для реального мира, где топологическая сортировка выполняется на больших графиках. Некоторые поля, в которых я нахожу такие примеры, - это биоинформатика, зависимость ...
вопрос задан: 20 June 2017 22:34
0
ответов

'StringCut' слева или справа от определенной позиции с использованием Mathematica

Читая этот вопрос, я подумал, что следующая проблема будет простой с использованием StringSplit. Учитывая следующую строку, я хочу "разрежьте" его слева от каждого "D" так, чтобы: Я получил Список ...
вопрос задан: 23 May 2017 11:48
0
ответов

R извлечь часть строки

У меня есть вопрос об извлечении части строки. Например, у меня есть такая строка: a <- "DP=26;AN=2;DB=1;AC=1;MQ=56;MZ=0;ST=5:10,7:2;CQ=SYNONYMOUS_CODING. ;GN=NOC2L;PA=1^1:0.720&2^1:0"...
вопрос задан: 13 December 2016 08:38
0
ответов

Стиль словаря заменяет несколько элементов

У меня есть большой data.frame символьных данных, которые я хочу преобразовать на основе того, что обычно называется словарем в других языках. В настоящее время я делаю это так: foo <- data.frame (snp1 = ...
вопрос задан: 2 December 2016 09:00
0
ответов

Профилирование SVM (e1071) в R

Я новичок в R и SVM и пытаюсь профилировать функцию svm из пакета e1071. Однако я не могу найти большой набор данных, который позволил бы мне получить хороший диапазон результатов профилирования, различающийся размером ...
вопрос задан: 11 November 2016 07:56
0
ответов

Как бутстреппинг улучшает качество филогенетической реконструкции

Привет, ребята: Насколько я понимаю, бутстреппинг состоит в том, что вы 1) строите «дерево», используя некоторый алгоритм из матрицы последовательностей (скажем, нуклеотидов). {{ 1}} 2) Вы храните это дерево. 3) Возмущать матрицу ...
вопрос задан: 17 May 2016 00:52
0
ответов

Проблемы с "моим" [закрыто]

У меня есть программа, предназначенная для извлечения строк из мультифаста и запуска их через THREADER: # ¡/ usr / bin / perl use warnings; использовать строгое; использовать File :: Temp qw (tempfile); мой $ filename = 'unchar_prot'; #открыть ...
вопрос задан: 20 March 2016 13:22
0
ответов

Лучший способ организовать проекты в области биоинформатики? [закрыто]

Я вырос в информатике. фон, но сейчас я занимаюсь геномикой. Мои проекты включают в себя много биоинформатики, обычно включающей: выравнивание последовательностей, сравнение перекрытия и т. Д. Между последовательностями ...
вопрос задан: 16 January 2016 12:35
0
ответов

Как удалить повторяющиеся SNP с помощью PLink?

Я работаю с PLINK над анализом данных всего генома. Кто-нибудь знает, как удалить повторяющиеся SNP?
вопрос задан: 25 June 2015 15:27