Вот простой скрипт, который принимает тег привязки с немецким URL-адресом в нем, и извлекает URL:
# encoding: utf-8
require 'uri'
url = URI.extract('<a href="http://www.example.com/wp content/uploads/2012/01/München.jpg">München</a>')
puts url
http://www.example.com/wp-content/uploads/2012/01/M
Метод extract
останавливается на ü
. Как мне заставить его работать с неанглийскими буквами? Я использую ruby-1.9.3- p0.