2
ответа

То, почему не делает Đ, сглажено к D при Удалении Диакритических знаков/Диакритических знаков

Я использую этот метод для удаления диакритических знаков из моих строк: статический строковый RemoveAccents (представляют вход в виде строки) {строка, нормализованная = вход. Нормализуйте (NormalizationForm. FormKD); разработчик StringBuilder = новый...
вопрос задан: 6 December 2010 11:05
2
ответа

Python regex \w не соответствует объединяющимся диакритическим знакам?

У меня есть строка UTF8 с объединяющимися диакритическими знаками. Я хочу соответствовать ему \w regex последовательность. Это соответствует символам, которые имеют диакритические знаки, но не, если существует латинский символ с объединяющимися диакритиче
вопрос задан: 29 June 2010 13:25
2
ответа

Как заменить unicode символы символами ASCII в Python (данный сценарий жемчуга)?

Я пытаюсь изучить Python и не мог выяснить, как перевести следующий сценарий жемчуга в Python: #!/usr/bin/perl-w используют открытый QW (: станд.: utf8); в то время как (<>) {s/\x {...
вопрос задан: 23 April 2010 18:01
2
ответа

Получить данные CSV из буфера обмена (вставленные из Excel), содержащие символы с акцентом

СЦЕНАРИЙ Мои пользователи будут копировать ячейки из Excel (таким образом, помещая его в буфер обмена), и мое приложение будет извлекать эти ячейки из буфера обмена. ПРОБЛЕМА Мой код извлекает формат CSV из ...
вопрос задан: 9 June 2009 03:02
2
ответа

Как я могу проигнорировать диакритические знаки при сравнении строк в Perl?

У меня есть это приложение теста, где я соответствую тому, что люди вводят с правильным ответом. На данный момент то, что я делаю, в основном что: если ($input = ~ / $answer/i) {печатают, "Вы победили";} Это хорошо, как будто...
вопрос задан: 22 December 2008 18:46
1
ответ

Замена accented/umlauted символы с их неукрашенными дубликатами в C# [дубликат]

Дубликат 249 087 у меня есть набор сгенерированных адресов пользователя, которые могут содержать символы с диакритическими знаками. Что является самым эффективным (т.е. универсальным), путь (кроме простой замены)...
вопрос задан: 23 May 2017 12:16
1
ответ

Как генерировать документацию Javadoc с умляутами?

Я пытаюсь генерировать документацию Java в Eclipse. Исходные файлы являются закодированным UTF-8 и содержат некоторые умляуты. Получающиеся файлы HTML не указывают кодирование и не используют объекты HTML, таким образом...
вопрос задан: 9 January 2016 08:49
1
ответ

Удаление диакритического знака отмечает (диакритические знаки) от латинских символов для сравнения [дубликат]

Я должен сравнить названия европейских мест, которые записаны с помощью Латинского алфавита с (диакритическими знаками) меток диакритического знака на некоторых символах. Существует много центральноевропейских и восточноевропейских имен это...
вопрос задан: 17 October 2014 16:36
1
ответ

Как предотвратить CKEditor перевод букв с диакритическим знаком к их HTML-кодам?

Я хотел бы настроить CKEditor для сохранения акцентируемых букв, как они и не изменяют их на свой HTML-эквивалент, так как я работаю работа с UTF8 так или иначе. На где и что я должен установить...
вопрос задан: 27 July 2011 00:49
1
ответ

Как я могу сделать не чувствительный к диакритическим знакам поиск в Пост-ГРЭС 8.3.x с DB в utf-8?

Испытанный выбор to_ascii ('главарь банды', 'LATIN1'), to_ascii ('çapo', 'LATIN1') и результаты отличается....
вопрос задан: 11 September 2010 04:30
1
ответ

Обработка различных версий нес диакритическим знаком символов Umlaut

Немецкие символы Umlaut с диакритическим знаком “ö”, “ä” и “ü” часто заменяются версиями нес диакритическим знаком, когда пользователи вводят, часто для удобства, когда у них нет корректной клавиатуры. С большинством...
вопрос задан: 28 June 2010 12:42
1
ответ

Код для разделения диакритических знаков с помощью ICU

Может кто-то предоставлять некоторый код кода для разделения диакритических знаков (т.е. символы замены, имеющие диакритические знаки, умляуты, и т.д., с их безударным, unumlauted, и т.д., эквивалентами символов, например...
вопрос задан: 7 June 2010 18:24
1
ответ

Поиск строки Java без учета акцентов

Я пытаюсь написать функцию фильтра для моего приложения, которая будет принимать входную строку и отфильтровывать все объекты, которые каким-либо образом не соответствуют заданному вводу. Самый простой способ сделать это будет ...
вопрос задан: 7 March 2010 20:20
1
ответ

нормализация символов с диакритикой в запросах MySQL

Я хотел бы иметь возможность сделать запросы, которые нормализуют символы с диакритикой, так, чтобы, например: é, è, и ê все рассматривают как 'e' в использовании запросов '=' и 'как'. Я ссорюсь с полевым набором имени пользователя...
вопрос задан: 20 February 2010 16:24
1
ответ

ToAscii/ToUnicode в захвате клавиатуры уничтожает мертвые клавиши

Кажется, что при вызове ToAscii () или ToUnicode (), в то время как в глобальном рычаге WH_KEYBOARD_LL, и мертвая клавиша нажимается, она будет 'уничтожена'. Например, скажите конфигурирование входного языка в...
вопрос задан: 31 December 2009 03:59
0
ответов

Без учета акцента в регулярных выражениях?

Мне нужно регулярное выражение в программе на C #. Я должен записать имя файла с определенной структурой. Я использовал класс \ w char, но проблема в том, что этот класс не соответствует ни одному символу с акцентом. Тогда как ...
вопрос задан: 25 September 2019 17:15
0
ответов

MySQL DB выбирает записи с умляутами и без них. например: '.. where something = FÖÖ'

Параметры сортировки моей таблицы - «utf8_general_ci». Если я запрошу такой запрос: SELECT * FROM mytable WHERE myfield = "FÖÖ", я получу результаты, где: ... myfield = "FÖÖ" ... myfield = "FOO" - это значение по умолчанию для "...
вопрос задан: 9 August 2018 09:49
0
ответов

Атрибут кодирования XLS в JSP-файле

Я прихожу к вам, потому что у меня небольшая проблема с моим веб-приложением Java. Я использую файл xls (Excel), в котором указаны сообщения моего приложения, например: & lt; b & gt; Меню Général & lt; / b & gt; ...
вопрос задан: 13 July 2018 12:06
0
ответов

Простой способ удалить акценты из строки Unicode? [Дубликат]

Я хочу изменить это предложение: Et ça sera sa moitié. To: Et ca sera sa moitie. Есть ли простой способ сделать это в Java, как я бы сделал в Objective-C? NSString * str = @ "Et ça sera sa ...
вопрос задан: 20 March 2018 16:46
0
ответов

Каков правильный алгоритм определения количества символов, воспринимаемых пользователем?

У меня есть задача подсчитать количество символов, воспринимаемых пользователем во входных данных. Входные данные - это группа целых чисел (мы можем думать о ней как о int []), которая представляет кодовые точки Unicode. java.text.BreakIterator ....
вопрос задан: 26 September 2017 03:18
0
ответов

удаление акцента и специальных символов [дубликат]

Возможный дубликат: Как лучше всего удалить акценты в строке Unicode Python? Python и нормализация символов Я хотел бы удалить акценты, перевести все символы в нижний регистр и ...
вопрос задан: 23 May 2017 12:22
0
ответов

Как защититься от диакритических знаков, таких как текст Zalgo

Персонаж, изображенный выше, несколько месяцев назад написал в Твиттере Микко Хиппёнен, эксперт по компьютерной безопасности, известный своей работой с компьютерными вирусами и выступлениями на TED по компьютерной безопасности. В отношении С.О. я...
вопрос задан: 23 May 2017 12:17
0
ответов

Преобразовать специальный символ (например, умлаут) в наиболее вероятное представление в ascii [дубликат]

я ищу метод или, может быть, таблица преобразования, которая знает, как преобразовать умляуты и специальные символы в их наиболее вероятное представление в ascii. Пример: Ärger = aerger Bôhme = bohme ...
вопрос задан: 23 May 2017 12:17
0
ответов

Ошибочное отображение приемника электронной почты при использовании немецких умляутов и запятой в имени

Используя класс MailMessage в .NET 4, я обнаружил сегодня проблему, которую пока не могу решить. Смотрите следующий код: using (var message = new MailMessage()) { message.From = new ...
вопрос задан: 23 May 2017 11:53
0
ответов

Как создать регулярное выражение, учитывающее акцентированные символы?

У меня есть регулярное выражение JavaScript, которое в основном находит двухбуквенные слова. Проблема, похоже, в том, что он интерпретирует акцентированные символы как границы слов. Действительно, кажется, что A word ...
вопрос задан: 23 May 2017 11:48
0
ответов

Удалить акценты из столбца данных в R

Я получил базу данных. Я получил столбец терминов в этом классе data.table (базовый $ term) [1] длина символа (базовый $ term) [1] 27486 Я могу удалить ударения из строки. Я могу удалить акценты от ...
вопрос задан: 25 August 2016 15:05
0
ответов

JavaScript Regex Принять только буквы, пробелы и

Я ищу javascript Regex, чтобы убедиться, что строка содержит только пробелы, буквы, и - - дело несомненно. Я уже попробовал: / ^ za-z _] * [a-za-z] [A-ZA-Z _] * $ / Но он не принять к нему.
вопрос задан: 20 April 2016 17:18
0
ответов

GSON / JSON : Странная проблема со специальными символами (умляут)

При попытке обработать JSON-ответ с помощью GSON (если вы спрашиваете, вывод сделан из API flickr) я столкнулся с тем, что я бы описал как довольно странную кодировку некоторых специальных символов: Вот ...
вопрос задан: 18 December 2015 16:46
0
ответов

Python: Работа с немецким Умлаутом

месяцев = [«« Januar »,« Februar »,« März »,« Апрель »,« Май » , "Джуни", "Джули", "Август", "Сентябрь", "Октобер", "Ноябрь", "дежебер"] Печатающие месяцы [2]. Одеcode («UTF-8») Печать месяца [2] ...
вопрос задан: 3 October 2015 08:53
0
ответов

регулярное выражение без учета акцента

Мой код: jQuery.fn.extend ({выделить: функция (поиск) {var regex = new RegExp ( '(<[^>] *>) | (' + search.replace (/[.+] i /, "$ 0") + ')', 'ig'); вернуть this.html (this.html () .replace (regex, ...
вопрос задан: 11 April 2015 00:18