Я ищу хорошую библиотеку регулярных выражений C / C ++ с открытым исходным кодом, которая имеет полную поддержку Unicode.
Я использую это в среде, где библиотека может получить ASCII, UTF-8 или UTF-16. Если он получает кодировку UTF-16, он может иметь или не содержать необходимые символы кавычек (FF FE) или (FE FF).
I ' Я осмотрелся и, похоже, не нашел никаких других вариантов, кроме PCRE.
Моя вторая проблема заключается в том, что в настоящее время я использую flex для создания ОГРОМНЫХ регулярных выражений. В идеале у меня был бы гибкий генератор лексических выражений, который также обрабатывает Unicode.
Есть предложения?