Помогите мне скопировать данные по EC2 Amazon и запустить скрипт

Я - новичок до использования облачных вычислений, но я получаю понятие, и довольно хорошо в следовании инструкциям. Я хотел бы сделать, некоторые моделирования на моих данных и каждом шаге занимают несколько минут. Учитывая иерархию в моих данных, требуется несколько часов для каждого набора. Я хотел бы ускорить это путем выполнения его на облаке Amazon EC2.

После чтения этого я знаю, как запустить AMI, соединиться с ним через оболочку и запустить R в командной строке.

То, на чем я хотел бы справку, является способностью скопировать данные (.rdata файлы) и сценарий и просто получить ее в командной строке R. Затем после того как все результаты записаны в новые .rdata файлы, я хотел бы скопировать их назад в мою локальную машину.

Как я делаю это?

5
задан Maiasaura 16 June 2010 в 21:03
поделиться

1 ответ

Я мало что знаю о R, но делаю то же самое с другими языками. То, что я предлагаю, вероятно, даст вам некоторые идеи.

  1. Настройте FTP-сервер на локальном компьютере.
  2. Создайте «сценарий запуска», который вы запускаете с вашим экземпляром.
  3. Разрешите сценарию запуска загрузить файлы R с вашего локального компьютера, инициализировать R и выполнить вычисления, а затем загрузить новые файлы на ваш компьютер.

Сценарий запуска:

#!/bin/bash
set -e -x
apt-get update && apt-get install curl + "any packages you need"
wget ftp://yourlocalmachine:21/r_files > /mnt/data_old.R
R CMD BATCH data_old.R -> /mnt/data_new.R
/usr/bin/curl -T /mnt/data_new.r -u user:pass ftp://yourlocalmachine:21/new_r_files

Запуск экземпляра со сценарием запуска

ec2-run-instances --key KEYPAIR --user-data-file my_start_up_script ami-xxxxxx
3
ответ дан 15 December 2019 в 00:50
поделиться
Другие вопросы по тегам:

Похожие вопросы: