Вы в основном хотите найти что-нибудь между '<mark'
и '/>'
, поэтому вы начинаете с паттерна
r'<mark .* />'
Однако .*
будет жадным, так что вы не будете жадным до вас. нужно добавить ?
, просто используйте re.sub
, чтобы заменить эти совпадения пустой строкой
>>> re.sub(r'<mark .*? />', '', s)
'Bla bla bla bla bla bla. Yadda yadda yadda yadda.'
Обычный способ обработать такую вещь с \frontmatter
команда. Поместите его после \begin{document}
, и затем помещенный \mainmatter
прямо перед \chapter
Вы хотите соответствовать главе 1. Это может только работать в book
класс. Если Вы используете \chapter
в a report
, затем \chapter*
должен также создать главу, которая не имеет никакого числа и не обнаружится в оглавлении.
Действительно, как неизвестный (Google) упомянул, с помощью \frontmatter
и \mainmatter
лучшее решение. Это также скорректирует Вашу нумерацию страницы к строчным римским цифрам для вступительной части. Однако это работает только над book
и классы аналогичного документа.
В случае, если Вы используете report
, попробовать \chapter*
. Это создаст главу без числа, которое не появляется в оглавлении.