Как мне извлечь URL-адрес с неанглийскими символами из строки?

Вот простой скрипт, который принимает тег привязки с немецким URL-адресом в нем, и извлекает URL:

# encoding: utf-8

require 'uri'

url = URI.extract('<a href="http://www.example.com/wp content/uploads/2012/01/München.jpg">München</a>')

puts url

http://www.example.com/wp-content/uploads/2012/01/M

Метод extract останавливается на ü . Как мне заставить его работать с неанглийскими буквами? Я использую ruby-1.9.3- p0.

9
задан the Tin Man 31 January 2012 в 19:51
поделиться