У меня есть текст, преобразованный из pdf-файла. В тексте есть некоторые нежелательные символы, и я хочу преобразовать их в символы utf-8.
Например, 'Artificial Immune System' преобразуется как 'Artificial Immune System'. fi преобразуется как один символ, и я использовал gdex
, чтобы узнать ascii
значение символа, но я не знаю, как заменить его реальным значением во всем содержимом.