Я использую этот метод для удаления диакритических знаков из моих строк: статический строковый RemoveAccents (представляют вход в виде строки) {строка, нормализованная = вход. Нормализуйте (NormalizationForm. FormKD); разработчик StringBuilder = новый...
У меня есть строка UTF8 с объединяющимися диакритическими знаками. Я хочу соответствовать ему \w regex последовательность. Это соответствует символам, которые имеют диакритические знаки, но не, если существует латинский символ с объединяющимися диакритиче
Я пытаюсь изучить Python и не мог выяснить, как перевести следующий сценарий жемчуга в Python: #!/usr/bin/perl-w используют открытый QW (: станд.: utf8); в то время как (<>) {s/\x {...
СЦЕНАРИЙ Мои пользователи будут копировать ячейки из Excel (таким образом, помещая его в буфер обмена), и мое приложение будет извлекать эти ячейки из буфера обмена. ПРОБЛЕМА Мой код извлекает формат CSV из ...
У меня есть это приложение теста, где я соответствую тому, что люди вводят с правильным ответом. На данный момент то, что я делаю, в основном что: если ($input = ~ / $answer/i) {печатают, "Вы победили";} Это хорошо, как будто...
Дубликат 249 087 у меня есть набор сгенерированных адресов пользователя, которые могут содержать символы с диакритическими знаками. Что является самым эффективным (т.е. универсальным), путь (кроме простой замены)...
Я пытаюсь генерировать документацию Java в Eclipse. Исходные файлы являются закодированным UTF-8 и содержат некоторые умляуты. Получающиеся файлы HTML не указывают кодирование и не используют объекты HTML, таким образом...
Я должен сравнить названия европейских мест, которые записаны с помощью Латинского алфавита с (диакритическими знаками) меток диакритического знака на некоторых символах. Существует много центральноевропейских и восточноевропейских имен это...
Я хотел бы настроить CKEditor для сохранения акцентируемых букв, как они и не изменяют их на свой HTML-эквивалент, так как я работаю работа с UTF8 так или иначе. На где и что я должен установить...
Немецкие символы Umlaut с диакритическим знаком “ö”, “ä” и “ü” часто заменяются версиями нес диакритическим знаком, когда пользователи вводят, часто для удобства, когда у них нет корректной клавиатуры. С большинством...
Может кто-то предоставлять некоторый код кода для разделения диакритических знаков (т.е. символы замены, имеющие диакритические знаки, умляуты, и т.д., с их безударным, unumlauted, и т.д., эквивалентами символов, например...
Я пытаюсь написать функцию фильтра для моего приложения, которая будет принимать входную строку и отфильтровывать все объекты, которые каким-либо образом не соответствуют заданному вводу. Самый простой способ сделать это будет ...
Я хотел бы иметь возможность сделать запросы, которые нормализуют символы с диакритикой, так, чтобы, например: é, è, и ê все рассматривают как 'e' в использовании запросов '=' и 'как'. Я ссорюсь с полевым набором имени пользователя...
Кажется, что при вызове ToAscii () или ToUnicode (), в то время как в глобальном рычаге WH_KEYBOARD_LL, и мертвая клавиша нажимается, она будет 'уничтожена'. Например, скажите конфигурирование входного языка в...
Мне нужно регулярное выражение в программе на C #. Я должен записать имя файла с определенной структурой. Я использовал класс \ w char, но проблема в том, что этот класс не соответствует ни одному символу с акцентом. Тогда как ...
Параметры сортировки моей таблицы - «utf8_general_ci». Если я запрошу такой запрос: SELECT * FROM mytable WHERE myfield = "FÖÖ", я получу результаты, где: ... myfield = "FÖÖ"
... myfield = "FOO" - это значение по умолчанию для "...
Я прихожу к вам, потому что у меня небольшая проблема с моим веб-приложением Java. Я использую файл xls (Excel), в котором указаны сообщения моего приложения, например: & lt; b & gt; Меню Général & lt; / b & gt; ...
Я хочу изменить это предложение: Et ça sera sa moitié. To: Et ca sera sa moitie. Есть ли простой способ сделать это в Java, как я бы сделал в Objective-C? NSString * str = @ "Et ça sera sa ...
У меня есть задача подсчитать количество символов, воспринимаемых пользователем во входных данных. Входные данные - это группа целых чисел (мы можем думать о ней как о int []), которая представляет кодовые точки Unicode. java.text.BreakIterator ....
Возможный дубликат: Как лучше всего удалить акценты в строке Unicode Python? Python и нормализация символов Я хотел бы удалить акценты, перевести все символы в нижний регистр и ...
Персонаж, изображенный выше, несколько месяцев назад написал в Твиттере Микко Хиппёнен, эксперт по компьютерной безопасности, известный своей работой с компьютерными вирусами и выступлениями на TED по компьютерной безопасности. В отношении С.О. я...
я ищу метод или, может быть, таблица преобразования, которая знает, как преобразовать умляуты и специальные символы в их наиболее вероятное представление в ascii. Пример: Ärger = aerger
Bôhme = bohme
...
Используя класс MailMessage в .NET 4, я обнаружил сегодня проблему, которую пока не могу решить. Смотрите следующий код: using (var message = new MailMessage())
{ message.From = new ...
У меня есть регулярное выражение JavaScript, которое в основном находит двухбуквенные слова. Проблема, похоже, в том, что он интерпретирует акцентированные символы как границы слов. Действительно, кажется, что A word ...
Я получил базу данных. Я получил столбец терминов в этом классе data.table (базовый $ term) [1] длина символа (базовый $ term) [1] 27486 Я могу удалить ударения из строки. Я могу удалить акценты от ...
Я ищу javascript Regex, чтобы убедиться, что строка содержит только пробелы, буквы, и - - дело несомненно. Я уже попробовал: / ^ za-z _] * [a-za-z] [A-ZA-Z _] * $ / Но он не принять к нему.
При попытке обработать JSON-ответ с помощью GSON (если вы спрашиваете, вывод сделан из API flickr) я столкнулся с тем, что я бы описал как довольно странную кодировку некоторых специальных символов: Вот ...
месяцев = [«« Januar »,« Februar »,« März »,« Апрель »,« Май » , "Джуни", "Джули", "Август", "Сентябрь", "Октобер", "Ноябрь", "дежебер"] Печатающие месяцы [2]. Одеcode («UTF-8») Печать месяца [2] ...