Регулярное выражение для изображения url

Я уже разбираю страницы с HtmlAgilityPack и получаю большинство исходников img. Однако многие сайты включают img urls в местах, отличных от img src атрибутов (например, inlined javascript, другой атрибут, другой элемент). Я хотел бы отбросить немного более широкую сеть и запустить регекс по всей html-строке, захватив в регексе следующее.

  1. Должно начинаться с http://, https://, //, или /
  2. Затем, любое количество допустимых символов url-пути
  3. Должно заканчиваться либо .jpeg, .jpg, .png, либо .gif

Думаю, это было бы просто написать, однако я не удивительный регексер. Я представляю, что части выглядели бы так

  1. ^((https?\:\/\/)|(\/{1,2})))).
  2. (есть идеи?)
  3. (.(jpe?g|png|gif))$

Кто-нибудь может помочь мне заполнить пробелы?

Спасибо

Answer

(https?:)?//?[^\'"<>]+?\.(jpg|jpeg|gif|png)
5
задан Adrian Adkison 30 May 2011 в 08:00
поделиться