9
ответов

Разделите предложение на отдельные слова

Я должен разделить китайское предложение на отдельные слова. Проблема с китайским языком состоит в том, что нет никаких пробелов. Например, предложение может быть похожим: 主楼怎么走 (с пробелами это было бы: 主楼 怎么 走). В...
вопрос задан: 1 April 2019 13:57
7
ответов

Что такое многобайтовый набор символов?

Делает многобайтовый термин, относятся к набору символов, символы которого могут - но не должны быть - шире, чем 1 байт, (например, UTF-8), или делает он относится к наборам символов, которые в любом случае более широки, чем 1 байт (например....
вопрос задан: 14 April 2009 19:17
6
ответов

Как проверить, является ли слово японским или английским, используя PHP

Я хочу иметь разные процессы для английского слова и японского слова в этой функции function process_word ($ word) {if ($ word is english) {/////////} else if ($ word is japanese) {/ /// ...
вопрос задан: 29 April 2012 19:38
5
ответов

Проблема с utf-8, кодирующим использование MySQL PHP +

Я переместил данные из MySQL 4 (они были первоначально установлены на кодирование latin2) к MySQL 5, и установите кодирование на utf-8. Это выглядит хорошим в phpMyAdmin, и utf-8 хорошо. Однако вместо этого существуют вопросительные знаки...
вопрос задан: 21 December 2012 03:40
5
ответов

UTF8 по сравнению с UTF16 по сравнению с символом*, по сравнению с какой? Кто-то объясняет эту путаницу мне!

Мне удалось главным образом проигнорировать весь этот материал многобайтового символа, но теперь я должен сделать некоторую работу UI, и я знаю, что мое незнание в этой области собирается догнать меня! Может любой объяснять в некоторых...
вопрос задан: 31 March 2011 09:52
5
ответов

Являются PHP preg_functions многобайтовым сейфом?

Нет никаких многобайтовых функций 'preg', доступных в PHP, который означает, что значение по умолчанию preg_functions действительно ли весь МБ безопасно? Не удалось найти упоминание в php документации.
вопрос задан: 19 November 2009 20:58
3
ответа

многобайтовый strtr ()-> mb_strtr ()

У кого-либо есть записанный многобайтовый вариант функции strtr ()? Мне нужен этот. Отредактируйте 1 (пример желаемого использования): Пример: $from = 'ľľščťžýáíŕďňäô';//эти символы находятся в $to UTF-8 = '...
вопрос задан: 3 May 2010 16:05
3
ответа

Парсинг байтовой строки в PHP

Я хотел бы записать (HTML) синтаксический анализатор на основе конечного автомата, но у меня есть сомнения, как на самом деле читать/использовать вход. Я решил загрузить целый вход в одну строку и затем работать с ним как с...
вопрос задан: 7 April 2010 08:36
3
ответа

Разъяснение кодирования переменного байта

Я очень плохо знаком с миром байта, кодирующего, поэтому извините меня (и любой ценой, исправьте меня), если я использую/выражаю простые понятия неправильным способом. Я пытаюсь понять переменный байт...
вопрос задан: 28 March 2010 00:06
3
ответа

Unicode по сравнению с многобайтовым

Я действительно смущен этим unicode по сравнению с многобайтовой вещью. Скажите, что я компилирую свою программу в Unicode (но в конечном счете, я хочу решение, которое независимо от используемого набора символов). 1) все 'обуглится'...
вопрос задан: 9 February 2010 03:38
3
ответа

Как делает UTF-8 “переменная ширина, кодирующая” работу?

unicode стандарт имеет достаточно кодовых точек в нем, что Вам нужны 4 байта для хранения их всех. Это - то, что делает кодирование UTF-32. Все же кодировка UTF-8 так или иначе сжимает их в намного меньший...
вопрос задан: 21 October 2009 00:46
2
ответа

Усеките байтовую строку к n символам

Я пытаюсь получить этот метод в Строковой работе Фильтра: усеченная государственная функция ($string, $chars = 50, $terminator = '…'); я ожидал бы этот $in = "...
вопрос задан: 23 May 2017 11:58
2
ответа

Обнаружьте китайский (многобайтовый) символ в строке

$str = "Это - строка, содержащая 中文 символы. Еще некоторые символы - 中华人民共和国"; Как я обнаруживаю китайские символы от этой строки и печатаю часть, которая запускается с первого символа и...
вопрос задан: 4 May 2012 21:22
2
ответа

Что делает эти PHP mbstring настройки делают?

Я пытаюсь выяснить точно, что делают эти настройки php.ini. Что происходит, когда они установлены на различные значения? Когда они необходимы? Когда они вредны? mbstring.language mbstring....
вопрос задан: 24 August 2011 14:59
2
ответа

Как получить размер байта байтовой строки

Как я получаю размер байта строки многобайтовых символов в Визуальном C? Существует ли функция, или я должен считать символы сам? Или, более общий, как я получаю правильный размер байта TCHAR...
вопрос задан: 29 July 2010 00:28
2
ответа

Слияние двух Регулярных выражений для Усечения Слов в Строках

Я пытаюсь придумать следующую функцию, которая усекает строку к целым словам (если это возможно, иначе она должна усечь к символам): функционируйте Text_Truncate ($string, $limit, $more = '...') {...
вопрос задан: 21 April 2010 13:44
1
ответ

Ruby 1.9: как может я правильно upcase и downcase байтовые строки?

Таким образом, matz принял решение сохранить upcase и downcase ограниченными / [A-Z]/i в рубиновых 1.9.1. ActiveSupport:: Многобайтовый долго имел большой i18n случай jiggering в рубине 1.8.x через String#mb_chars. Однако...
вопрос задан: 11 September 2012 05:43
1
ответ

Многобайтовая безопасная функция wordwrap () для UTF-8

PHP-функция wordwrap () не работает правильно для многобайтовых строк, таких как UTF-8. В комментариях есть несколько примеров безопасных функций mb, но с некоторыми разными тестовыми данными все они кажутся ...
вопрос задан: 29 September 2010 19:41
1
ответ

Объедините два байта в Java/андроиде

У меня есть кадр 22 байтов. Кадр является входным потоком от акселерометра через Bluetooth. Чтения акселерометра являются разделением числа на 16 битов по поводу двух байтов. Когда я пытаюсь объединить байты с...
вопрос задан: 24 May 2010 10:07
0
ответов

Есть простой способ получить символ из многобайтовой строки в PHP?

Вот моя проблема: мой язык (португальский) использует кодировку символов ISO-8859-1! Когда я хочу получить доступ к символу из строки, такой как 'coração' (сердце), я использую: mb_internal_encoding('ISO-8859-1'); $str = "...
вопрос задан: 2 May 2012 11:11
0
ответов

Многобайтовая обрезка в PHP?

По-видимому, в семействе mb_*нет mb_trim, поэтому я пытаюсь реализовать его для себя. Недавно я нашел это регулярное выражение в комментарии на php.net:/(^\s+)|(\s+$)/u Итак, я бы реализовал его в...
вопрос задан: 9 April 2012 03:43
0
ответов

glob () не может найти имена файлов с многобайтовыми символами в Windows?

Я пишу файловый менеджер и мне нужно сканировать каталоги и иметь дело с переименованием файлов, которые могут содержать многобайтовые символы. Я работаю над этим локально на Windows / Apache PHP 5.3.8, со следующим файлом ...
вопрос задан: 12 March 2012 01:08
0
ответов

Могу ли я использовать memcmp two compare multibyte character string?

Я пытаюсь написать код для сравнения двух нить. В Windows я могу использовать strcmp, но я хочу писать для многобайтовой символьной строки, чтобы она была совместима со всеми другими платформами. Могу ли я использовать memcmp? если нет, то это ...
вопрос задан: 27 February 2012 06:18
0
ответов

PHP: безопасна ли функция implode () для многобайтовых строк?

Функция explode () имеет коррелирующую многобайтовую безопасную функцию в mb_split ( ). Я не вижу коррелирующей функции для implode (). Означает ли это, что сжатие уже безопасно для многобайтовых строк?
вопрос задан: 19 December 2011 17:22
0
ответов

Как обрабатывать многобайтовые строки в Python

В PHP есть функции многобайтовых строк для обработки многобайтовых строк (например, сценарий CJK). Например, я хочу подсчитать, сколько букв в многобайтовой строке, используя функцию len в python, но это ...
вопрос задан: 1 December 2011 18:46
0
ответов

preg_replace с кириллическими символами

Я хочу заменить эти символы [^ a-zа-з0-9_] на ноль, но я не могу этого сделать, если это многобайтовая строка. Я пробовал использовать mb_ *, iconv, PCRE, mb_eregi_replace и модификатор u (для PCRE), но ни один из них не работал ...
вопрос задан: 12 October 2011 16:45
0
ответов

многобайтовая функция для замены preg_match_all?

Я ищу многобайтовую функцию для замены preg_match_all (). Мне нужен тот, который даст мне массив совпадающих строк, например аргумент $ match из preg_match (). Функция mb_ereg_match () ...
вопрос задан: 6 October 2011 15:33
0
ответов

Кто-нибудь смог записать символы UTF-8, используя xlwt Python?

Я пытаюсь записать данные в файл Excel, содержащий японские символы. Я использую codec.open () для получения данных, и кажется, что это работает нормально, но я сталкиваюсь с этой ошибкой, когда пытаюсь записать данные: ...
вопрос задан: 25 August 2011 02:53
0
ответов

Зачем использовать многобайтовые строковые функции в PHP?

На данный момент я не понимаю, почему действительно важно использовать функции mbstring в PHP при работе с UTF-8? Моя локаль под Linux уже установлена ​​на UTF-8, поэтому почему не работает как ...
вопрос задан: 17 July 2011 06:41
0
ответов

Получить размер строки std :: string в байтах

Я бы хотел получить количество байтов, которые строка std :: string занимает в памяти, а не количество символов. Строка содержит многобайтовую строку. Будет ли std :: string :: size () делать это за меня? РЕДАКТИРОВАТЬ: Кроме того, ...
вопрос задан: 4 June 2011 08:10