Регулярное выражение для замены перевода строки на пробел, только если разрыв отсутствует в содержимом атрибута HTML

Я пытаюсь написать регулярное выражение, которое заменяет перевод строки между определенными областями текстовый файл, но только для обычного текстового содержимого (т.е. исключает текст внутри содержимого атрибута HTML, например href), но без особого успеха после первой части.

Пример ввода:

AUTHOR: Me
DATE: Now
CONTENT:
This is an example. This is another example. <a href="http://www.stackoverflow/example-
link-that-breaks">This is an example.</a> This is an example. This is yet another
example.
END CONTENT
COMMENTS: 0

Пример вывода:

AUTHOR: Me
DATE: Now
CONTENT:
This is an example. This is another example. <a href="http://www.stackoverflow/example-link-that-breaks">This is an example.</a> This is an example. This is yet another example.
END CONTENT
COMMENTS: 0

Итак, в идеале, пробел заменяет разрывы строк, если они встречаются в обычном тексте, но удаляет их без добавления пробела, если они находятся внутри параметров HTML (в основном href, и я в порядке, если мне придется ограничить его этим).

1
задан Rod Boev 21 October 2010 в 23:23
поделиться