Как искать текст, заключенный в двойные кавычки, с помощью RegEx?

У меня есть строка с некоторым кодом HTML, например:

This is <strong id="c1-id-8">some</strong> <em id="c1-id-9">text</em>

I мне нужно исключить атрибут id из каждого тега HTML, но у меня нет опыта работы с регулярными выражениями, поэтому я поискал кое-где в Интернете и написал этот шаблон: [\ s] + id = \ ". * \"

К сожалению, он работает не так, как я ожидал. На самом деле, я надеялся, что регулярное выражение уловит id = ", за которым следует любой символ, повторяющийся любое количество раз и оканчивающийся ближайшей двойной кавычкой; Практически в этом примере я ожидал поймать id = "c1-id-8" и id = "c1-id-9" . Но вместо этого шаблон вернул мне подстроку id = "c1-id-8"> некоторые , он находит первое вхождение id = " и последнее наличие символа двойной кавычки.

Не могли бы вы рассказать, что не так в моем шаблоне и как это исправить? Большое спасибо

7
задан Cesco 28 September 2011 в 04:37
поделиться