Из-за ошибок моих предшественников база данных (MySQL), которую я хотел бы использовать, содержит много HTML-сущностей (например, €
вместо €
).
Поскольку база данных должна содержать необработанные данные (база данных не должна иметь ничего общего с HTML), я хочу удалить их из БД и хранить в правильном UTF8, коллокация уже такова.
Что было бы хорошим способом исправить это? Единственное, что я могу придумать, это написать PHP скрипт, который получает все данные, прогоняет их через html_entity_decode() и записывает обратно. Это выполнимо, поскольку это одноразовая операция, а размер БД составляет всего около 100 МБ, но это все равно менее оптимально.
Есть идеи?