Я уже разбираю страницы с HtmlAgilityPack и получаю большинство исходников img. Однако многие сайты включают img urls в местах, отличных от img src атрибутов (например, inlined javascript, другой атрибут, другой элемент). Я хотел бы отбросить немного более широкую сеть и запустить регекс по всей html-строке, захватив в регексе следующее.
Думаю, это было бы просто написать, однако я не удивительный регексер. Я представляю, что части выглядели бы так
Кто-нибудь может помочь мне заполнить пробелы?
Спасибо
Answer
(https?:)?//?[^\'"<>]+?\.(jpg|jpeg|gif|png)