0
ответов

Рабочий процесс UTF8 PHP, резюме MySQL [закрыто]

Я работаю с международными клиентами, у которых очень разные алфавиты, и поэтому я пытаюсь, наконец, получить обзор полного рабочего процесса между PHP и MySQL, который бы гарантировал все символы. ...
вопрос задан: 13 June 2012 12:25
0
ответов

Максимальная длина mysql для столбцов и обеспечение того, чтобы я не превышал этот предел, используя utf8_unicode_ci - PHP?

Я использую столбец TEXT с именем ut8_unicode_ci в mysql для хранения некоторых данных, полученных из Интернета. Собраны тексты с разных сайтов на разных языках. Я ...
вопрос задан: 13 June 2012 05:07
0
ответов

Python, .format() и UTF-8

Мой опыт работы с Perl, но я попробую Python плюс BeautifulSoup для нового проекта. В этом примере я пытаюсь извлечь и представить цели ссылки и текст ссылки, содержащиеся в одном ...
вопрос задан: 13 June 2012 03:07
0
ответов

UTF8 Bomless vs Cp1252

С точки зрения физического байтового потока, для каждого файла, хранящегося с использованием UTF8, я думаю, что UTF8 bomless точно такой же, как Cp1252, это правда?
вопрос задан: 9 June 2012 23:09
0
ответов

Почему я получаю сообщение об ошибке «Ошибка типа: приведение к Unicode: нужна строка или буфер, найдено целое число»?

После запуска этой небольшой программы: #!/usr/bin/env python2.7 # --*-кодирование:utf-8 --* а = 1 б = 2 с = 3 title = u"""a=""" + a + u""", b=""" + str(b) + \ u""", c=""" + str(c) print(title) Я получаю ...
вопрос задан: 9 June 2012 04:54
0
ответов

Как выглядит XSL-документ, если он отражает входные данные?

Типичное использование XSL: XML1.xml -> * преобразовано с использованием xsl * -> XML2.xml Каким образом документ XSL выглядит так, если я хочу просто отразить входные данные? пример: XML1.xml -> * преобразовано с использованием ...
вопрос задан: 7 June 2012 14:15
0
ответов

Как отобразить звездочку в верхнем индексе в UIlabel

Я хочу отображать символ звездочки в качестве верхнего индекса в своем приложении. Есть ли для этого значение Unicode?
вопрос задан: 7 June 2012 13:56
0
ответов

Регулярное выражение Java для поддержки Unicode?

Для сопоставления от A до Z мы будем использовать регулярное выражение: [A-Za-z] Как разрешить регулярному выражению сопоставлять символы utf8, введенные пользователем? Например, китайские слова, такие как 环保部
вопрос задан: 5 June 2012 09:50
0
ответов

Регулярное выражение для Unicode в верхнем регистре не соответствует «Ó»?

Кажется, что он не распознает букву Ó с ударением в верхнем регистре #!/usr/bin/env perl использовать строгий; использовать предупреждения; используйте 5.14.0; используйте utf8; использовать функцию 'unicode_strings'; " SIMÓN " =~ /^\s+(\p{Upper}+)/u
вопрос задан: 5 June 2012 05:12
0
ответов

Scrapy-паук :, работающий со страницами с неправильно -определенной кодировкой символов

Обновление :эту ошибку можно воспроизвести, просто запустив ее из командной строки :scrapy shell http://www.indiegogo.com/Straight-Talk-About-Your-FutureЯ использую Scrapy для обхода веб-сайта. Каждый...
вопрос задан: 2 June 2012 23:01
0
ответов

Значения Unicode в строках экранируются при выводе дампа в JSON в Python

Например: >>> print json.dumps('růže') "r\u016f\u017ee" (Разумеется, в реальной программе это не просто одна строка, и в файле она тоже выглядит так, при использовании json.dump())...
вопрос задан: 2 June 2012 19:16
0
ответов

Командная строка Windows unicode argv

Итак, вступив в новое тысячелетие, я переписал свой код на C ++ с помощью: int main (int argc, wchar_t ** argv) Если он построен с опциями Unicode или MBCS, то когда приложение запускается с commandline arg, либо ...
вопрос задан: 1 June 2012 17:39
0
ответов

Django создает файл CSV, который содержит Unicode и может быть открыт непосредственно в Excel

Я хочу создать файл CSV с помощью Django, который содержит данные Unicode (греческие символы), и я хочу, чтобы он был открывается прямо из MS Excel. В другом месте я читал о библиотеке unicodecsv и...
вопрос задан: 1 June 2012 10:30
0
ответов

Любой способ вернуть PHP json_encode с кодировкой UTF-8, а не Unicode?

Любой способ вернуть PHP json_encode с кодировкой UTF-8, а не Unicode? $ arr = массив ('a' => 'á'); эхо json_encode ($ arr); mb_internal_encoding ('UTF-8'); и $ arr = array_map ('utf8_encode', $ arr); не ...
вопрос задан: 31 May 2012 18:06
0
ответов

Регулярные выражения (регулярные выражения) на японском языке

Я изучаю Регулярные выражения (регулярные выражения) для английского языка, и хотя некоторые концепции кажутся применимыми к другим языкам, таким как японский, я чувствую, что многие другие не будут. За ...
вопрос задан: 30 May 2012 02:41
0
ответов

Почему ñ меняется на ñ?

Я не понимаю, когда я сохраняю любую строку, содержащую ñ, она меняется на ñ. Даже в базе данных с меняется на ñ. Примеры: ñ становится ñ. Ниньо становится Нианьо. Я понятия не имею, что...
вопрос задан: 29 May 2012 00:07
0
ответов

Есть ли что-нибудь лучше, чем библиотека kakasi для сортировки годзёон?

«Лучше» в первую очередь означает точность, но меня также интересуют любые другие критерии, по которым другие системы превосходят. Я пробовал Perl-связывание Text :: Kakasi на предмет корректности, правда, ограниченным образом ...
вопрос задан: 27 May 2012 23:40
0
ответов

gnuplot - терминал pdf - установка символа Юникода (символ солнечной массы/odot)

Я пытаюсь установить символ LaTeX \odot в терминале pdf gnuplot (4.6.0). Каков точный синтаксис для этого? Часто задаваемые вопросы по gnuplot дают некоторые подсказки, но должен ли я ввести {/Symbol \2299} или {/utf8 \2299}, ...
вопрос задан: 27 May 2012 12:27
0
ответов

UTF-16 в cmd.exe

Я создал каталог "•◘▬ ¨ŤlCęół♥☺☻0", и я хотел бы сделать его видимым с помощью команды dir /b. До сих пор не удалось выполнить команды chcp 10000, chcp 10001 и chcp 65000(utf-8) (исходное имя было ...
вопрос задан: 26 May 2012 08:55
0
ответов

Вывод файла UTF-8 в R

Я использую R 2.15.0 в 64-разрядной версии Windows 7. Я хотел бы вывести текст Unicode (CJK) в файл. В следующем коде показано, как не работает символ Unicode, отправленный для записи при подключении к файлу UTF-8...
вопрос задан: 21 May 2012 02:52
0
ответов

Разве это не можно вставить китайские символы в текстовое поле Windows Form

Я работаю над приложением WinForm, и у меня есть текстовое поле, в которое я вставляю текст из Google Translator. У меня есть положительные результаты с несколькими сематическими и индоязычными языками, но появляются китайские иероглифы ...
вопрос задан: 20 May 2012 20:52
0
ответов

Как пометить весь текст CJK в документе?

У меня есть файл file1.txt, содержащий текст на английском, китайском, японском и корейском языках. Для использования в ConTeXt мне нужно пометить каждую область текста в файле в соответствии с языком, кроме английского,...
вопрос задан: 19 May 2012 23:33
0
ответов

???? ?? ????, ? ??????? ????? PDF ????????? ???? ??????????

? ???????, ??? ?????????? ?????????? ????????? ????? ????????? ??????, ?????? ???????? ?? ??????. ??? ?? ??? ??????. ??? ??????: ???? ?? ???? ? ????? PDF...
вопрос задан: 18 May 2012 16:14
0
ответов

Юникод (utf-8) с git-bash

У меня возникли проблемы с запуском юникода для git-bash (в Windows 7). Я пробовал много вещей без успеха. Хотя я не совсем уверен, что за это отвечает, так что я мог бы быть ...
вопрос задан: 18 May 2012 12:02
0
ответов

Список символов Unicode, которые должны быть отфильтрованы в выводе?

Недавно я столкнулся с ошибкой из-за качества данных при поддержке браузера, и я я ищу безопасное правило для применения экранирования строки без двойного размера, если это не требуется Последовательность байтов UTF-8 "E2-80-A8" (U+...
вопрос задан: 16 May 2012 02:57
0
ответов

Erlang и бинарники с кириллицей

Мне нужно иметь возможность использовать бинарники с кириллицей в них. Я пытался просто написать <<"абвгд">>, но получил ошибку badarg. Как я могу работать со строками кириллицы (или юникода) в Erlang?
вопрос задан: 15 May 2012 20:48
0
ответов

Функция python isdigit() возвращает true для нецифрового символа u'\u2466'

Я столкнулся со странной проблемой, связанной с функцией python isdigit. Например: >>> a = u'\u2466' >>> a.isdigit() Выход[1]: Истина >>> a.isnumeric() Out[2]: True Почему это...
вопрос задан: 15 May 2012 15:32
0
ответов

Javascript RegExp + границы слов + символы Юникода

Я строю поиск и собираюсь использовать с ним автозаполнение javascript. Я из Финляндии (финский язык), поэтому мне приходится иметь дело с некоторыми специальными символами, такими как ä, ö и å. Когда пользователь вводит текст в...
вопрос задан: 14 May 2012 19:50
0
ответов

Какой API генерации PDF (Java )поддерживает шрифт гуджарати?

Я пробовал iText, PDFBox и Oracle Forms. И мне также удалось в случае с iText создать гуджаратский PDF-документ. Но, к сожалению, он не генерирует правильный шрифт на языке гуджарати (UTF -8 )....
вопрос задан: 14 May 2012 10:32
0
ответов

php find emoji [обновить существующий код]

Я пытаюсь обнаружить emoji в своем php-коде и запретить пользователям вводить его. У меня есть код: if(preg_match('/\xEE[\x80-\xBF][\x80-\xBF]|\xEF[\x81-\x83][\x80-\xBF]/', $value ) > 0) { //предупреждение....
вопрос задан: 12 May 2012 17:44