0
ответов

Могут ли специальные символы французского и испанского языков содержаться в varchar?

Во французском и испанском языках есть специальные символы, которые не используются в обычном английском языке (гласные с ударением и т. Д.). Поддерживаются ли эти символы в varchar? Или мне для них нужен nvarchar? (ПРИМЕЧАНИЕ: у меня есть ...
вопрос задан: 24 August 2011 21:07
0
ответов

Почему символ Unicode для символа «Сердца» не работает с HTML

Насколько я понимаю, следующая разметка HTML должна отображать символ сердца, но это не так. Что мне не хватает? Я получил данные о символах Unicode здесь: http://en.wikipedia.org/wiki/...
вопрос задан: 23 August 2011 03:03
0
ответов

WebClient.DownloadString приводит к искажению символов из-за проблем с кодировкой, но браузер в порядке

Следующий код: var text = (new WebClient ()). DownloadString ("http://export.arxiv.org// api / query? search_query = au: Freidel_L * & start = 0 & max_results = 20 ")); приводит к изменяемому тексту, который ...
вопрос задан: 21 August 2011 08:10
0
ответов

] Что такое чрезмерно длинная форма / кодировка? [

] Читая статью в Википедии о UTF-8, я задавался вопросом о термине «длинный». Этот термин используется несколько раз, но в статье нет определения или ссылки на его значение. Я бы ... [
вопрос задан: 21 August 2011 07:13
0
ответов

Выражение символов Юникода UTF-16 в JavaScript

Чтобы выразить, например, символ U + 10400 в JavaScript, я использую "\ uD801 \ uDC00" или String.fromCharCode (0xD801) + String.fromCharCode (0xDC00) . Как мне определить это для данного символа Юникода? ...
вопрос задан: 19 August 2011 22:09
0
ответов

UTF-8 в кодовые точки Unicode

Есть ли функция, которая изменит UTF-8 на Unicode, оставив неспециальные символы как обычные буквы и цифры? т.е. немецкое слово «tchüß» будет отображаться как что-то вроде «tch \ 20AC \ 21AC» (...
вопрос задан: 18 August 2011 13:51
0
ответов

Программно определять, занимает ли символ Unicode более одного символьного пространства в терминале

Я обнаружил, что в Mac OS X Terminal некоторые символы Unicode занимают более одного символьного пространства. Например, 27FC (длинная стрелка вправо от бара). Он печатает шириной в два символа, но ...
вопрос задан: 17 August 2011 04:28
0
ответов

Требуется ли для разработки с помощью scalaz клавиатура, подобная Unicode / APL?

Можно ли использовать scalaz без клавиатуры? содержащие соответствующие символы Unicode, или каждый идентификатор Unicode также имеет эквивалент "ASCII" (и если да, есть ли гарантия, что он останется ...
вопрос задан: 16 August 2011 22:12
0
ответов

PHP utf8_encode () преобразует пробелы в неразрывные пробелы

Совершенно просто: utf8_encode ($ string) заменяет обычные пробелы неразрывными пробелами ("\ u00a0") . Я попытался отфильтровать результат с помощью str_replace: str_replace ("\ u00a0", "", utf8_encode ($ string)) ...
вопрос задан: 16 August 2011 21:46
0
ответов

llvm-лязг; функция/имена переменной, содержащая unicode символы

Я интересуюсь использованием unicode символы (как \apha) на имена function/varaible в моей программе C++, которую я скомпилирую с лязгом ++ на Linux. Делает любой знает о хорошем руководстве / список правил пойти...
вопрос задан: 15 August 2011 09:40
0
ответов

Как я могу преобразовать строка в символ юникода?

В Javascript '\ uXXXX' возвращается в виде символа юникода. Но как я могу получить символ Юникода, если часть XXXX является переменной? Например: var input = '2122'; console.log ('\\ u' + ввод); ...
вопрос задан: 15 August 2011 09:04
0
ответов

Как преобразовать 'u00e9' в символ utf8, в mysql или php?

Я выполняю некоторую очистку некоторых грязных данных, которые являются импортируются в mysql. Данные содержат «псевдо» символы Unicode, которые фактически встроены в строки как «u00e9» и т. д. Итак, один ...
вопрос задан: 15 August 2011 03:02
0
ответов

Как сравнить строки Unicode, содержащие неанглийские символы, для сортировки в алфавитном порядке?

Я пытаюсь отсортировать массив / списки / любые данные на основе строковых значений Unicode в них, которые содержат неанглийские символы, я хочу, чтобы они были правильно отсортированы по алфавиту. Я написал много ...
вопрос задан: 14 August 2011 02:07
0
ответов

В какой кодировке хранятся символы Java?

Гарантировано ли сохранение типа символов Java в какой-либо конкретной кодировке? Изменить: я неправильно сформулировал этот вопрос. Я хотел спросить, гарантировано ли использование символьных литералов в какой-либо конкретной кодировке? ...
вопрос задан: 11 August 2011 01:26
0
ответов

Это лучший способ отменить экранирование escape-последовательностей Unicode в Ruby?

У меня есть текст, содержащий escape-последовательности Unicode, например \ u003C. Вот что я придумал, чтобы избавиться от этого: string.gsub (/ \ u (....) /) {| m | [$ 1] .pack ("H *"). Unpack ("n *"). Pack ("U *")} Это правильно? ...
вопрос задан: 10 August 2011 20:18
0
ответов

Можно ли напечатать текст или символы Unicode в MATLAB?

Можно ли напечатать некоторые символы, такие как 'ح' (U + 062D), в качестве заголовка изображения во вспомогательном графике?
вопрос задан: 10 August 2011 19:27
0
ответов

Получение python для печати в UTF8 в Windows XP с помощью консоли

Я хотел бы настроить свою консоль в Windows XP для поддержки UTF8, чтобы python обнаруживал это и работал с ним. Пока что мои попытки: C: \ Documents and Settings \ Philippe> C: \ Python25 \ python.exe ...
вопрос задан: 10 August 2011 16:34
0
ответов

Следует ли мне удалить TCHAR из кода Windows?

Я пересматриваю некоторые очень старые (10 лет) C код. Код компилируется на Unix / Mac с GCC и кросс-компилируется для Windows с MinGW. В настоящее время повсюду используются строки TCHAR. Я бы хотел избавиться от ...
вопрос задан: 10 August 2011 10:18
0
ответов

Manova ny "tady" ho "tady" amin'ny Python nefa tsy manova encode

dia manana ireto manaraka ireto aho: u '\ x96' Te-hamadika azy ho toy izao aho: '\ x96' Misy fomba hanaovana izany ve? str () tsy mandeha ary rehefa mampiasa .encode (...) dia manova ny encoding. Ny tena tanjoko dia ny ...
вопрос задан: 10 August 2011 09:37
0
ответов

Как извлечь текст из документа PDF? [закрыто]

Как извлечь текст из документа PDF с помощью PHP? (Я не могу использовать другие инструменты, у меня нет корневого доступа) Я обнаружил, что некоторые функции работают с обычным текстом, но они плохо обрабатывают Unicode ...
вопрос задан: 9 August 2011 05:55
0
ответов

sys.argv как байты в Python 3k

Поскольку Python 3k вводит строгое различие между строками и байтами, аргументы командной строки в массиве sys. argv представлены в виде строк. Иногда необходимо рассматривать аргументы как байты, ...
вопрос задан: 9 August 2011 04:28
0
ответов

Подготовка PHP-приложения к использованию с UTF-8

UTF-8 сейчас де-факто стандарт для веб-приложений, но PHP это не кодировка по умолчанию для PHP (до 6.0). Большая часть сервера настроена для кодировки ISO-8859-1 по умолчанию. Как перегрузить ...
вопрос задан: 8 August 2011 20:08
0
ответов

Как мне получить представление Unicode / hex для символ из HTML с помощью JavaScript / jQuery?

Допустим, у меня есть такой элемент ... α Есть ли способ получить значение альфы в кодировке unicode / hex ...
вопрос задан: 6 August 2011 22:20
0
ответов

Использование Марковские модели для преобразования заглавных букв в смешанные и родственные задачи

I ' Я думал об использовании методов Маркова для восстановления недостающей информации в тексте на естественном языке. Восстановить заглавные буквы в смешанном регистре. Restore accents / diacritics to languages which should ...
вопрос задан: 6 August 2011 16:27
0
ответов

«utf8» \ x96 «не отображается в Unicode в < somefile.pl> в строке № - 321 ”Ошибка в Perl

Я настраиваю приложение Perl. Я получаю эту ошибку "utf8" \ x96 "не отображается в Unicode в" Может ли кто-нибудь сообщить мне причину и решение. Мне не хватает какой-либо конфигурации или это моя ...
вопрос задан: 5 August 2011 05:15
0
ответов

Как программно определить в Java, какая версия Unicode поддерживает?

В связи с тем, что код Java может быть запущен на любой виртуальной машине Java, я хотел бы знать, как можно программно определить, какая версия Unicode поддерживает?
вопрос задан: 4 August 2011 12:15
0
ответов

Как нанести удар по любой букве с помощью Unicode в Java

В моем приложении Java я хочу выводить зачеркнутые буквы (например, html делать). Есть ли способ сделать это с помощью Unicode (комбинировать)
вопрос задан: 3 August 2011 14:51
0
ответов

Почему MySQL обрабатывает é так же, как e?

Я сохраняю строки Unicode в базе данных MySQL с помощью веб-приложения Django. Я могу хранить данные Unicode нормально, но при запросе я обнаружил, что é и e обрабатываются так, как если бы они были одним и тем же символом: In ...
вопрос задан: 3 August 2011 07:20
0
ответов

Как получить надежное количество символов Юникода в Python?

Google App Engine использует Python 2.5.2, очевидно, с включенным UCS4. Но хранилище данных GAE внутренне использует UTF-8. Итак, если вы сохраняете u '\ ud834 \ udd0c' (длина 2) в хранилище данных, при его извлечении вы ...
вопрос задан: 3 August 2011 06:26
0
ответов

Может ли UTF-8 содержать нулевой байт?

Может ли строка UTF-8 содержать нулевые байты? Я собираюсь отправить его по протоколу открытого текста ascii, следует ли мне кодировать его чем-то вроде base64?
вопрос задан: 1 August 2011 17:37