У меня есть строка с некоторым кодом HTML, например:
This is <strong id="c1-id-8">some</strong> <em id="c1-id-9">text</em>
I мне нужно исключить атрибут id
из каждого тега HTML, но у меня нет опыта работы с регулярными выражениями, поэтому я поискал кое-где в Интернете и написал этот шаблон: [\ s] + id = \ ". * \"
К сожалению, он работает не так, как я ожидал. На самом деле, я надеялся, что регулярное выражение уловит id = "
, за которым следует любой символ, повторяющийся любое количество раз и оканчивающийся ближайшей двойной кавычкой; Практически в этом примере я ожидал поймать id = "c1-id-8"
и id = "c1-id-9"
.
Но вместо этого шаблон вернул мне подстроку id = "c1-id-8"> некоторые , он находит первое вхождение
id = "
и последнее наличие символа двойной кавычки.
Не могли бы вы рассказать, что не так в моем шаблоне и как это исправить? Большое спасибо