Это - то, чего я хотел бы достигнуть:
Проблема, я не хочу использовать iFrame, потому что затем я не могу пересечь DOM загруженной страницы.
Единственные решения, о которых я могу думать, состоят в том, чтобы проанализировать страницу для относительного URL и установить их как абсолютных. Не мог бы работать везде. Иначе должен выполнить wget и сохранить все (даже изображения) во временной папке. Масштабирование этого было бы невозможно.
Какие-либо другие идеи?
Звучит как простой обратный прокси. Ваша конечная часть rails может использовать open-uri для загрузки сайта в действие и рендеринга того же HTML.
class ProxyController < ActionController::Base
def get
require 'open-uri'
file = open params[:url]
render :inline => file.read
end
end
Доступ к этому с помощью чего-то вроде: (не забудьте закодировать URL-адрес по мере необходимости)
http://mysite.com/proxy/get?url=http://www.proxiedsite.com
Вы можете сделать некоторый синтаксический анализ перед рендерингом HTML, добавив на страницу все, что вы хотите, включая javascript.
Я предполагаю, что вы будете обращаться к условиям использования для любого контента, который вы проксируете.