У меня есть следующая строка, и я пытаюсь найти наилучший способ ее устранения.
Решение должно быть несколько гибким, поскольку я получаю эти данные от API, и я не могу быть абсолютно уверен, что текущая структура символов(\n
в отличие от\r
)всегда будет одинаковой.
'"If it ain\'t broke, don\'t fix it." \nWent in for a detailed car wash.\nThe attendants raved-up my engine when taking the car into
the tunnel. NOTE: my car is...'
Похоже, что это регулярное выражение должно работать:
text_excerpt = re.sub(r'[\s"\\]', ' ', raw_text_excerpt).strip()
Я также читал, что decode()
может работать (и в целом было бы лучшим решением ).
raw_text_excerpt.decode('string_unescape')
Пробовал что-то в этом роде, но это не сработало. Какие-либо предложения? Регулярное выражение здесь лучше?