Тестирование на японские/Китайские Символы в строке

Вы должны использовать position:relative с родительским блоком и position:absolute с дочерним блоком:

.bloc{
  background: red;
  position: relative;
  overflow: hidden;
  width: 200px;
  height: 300px;
}

.bloc .label{
  position: absolute;
  top: 15px;
  left: -20px;
  width: 120px;
  height: 20px;
  background: black;
  color: #fff;
  text-align: center;
  transform: rotate(-35deg);
}
<div class="bloc">
  <div class="label">
    Label here
  </div>
</div>
[117 ]
6
задан Suragch 1 February 2017 в 02:11
поделиться

5 ответов

Вы не сможете проверить один символ, чтобы с уверенностью сказать, что это японский или китайский язык из-за способа, которым кодовые точки unihan реализованы в стандарте Unicode. По сути, каждый китайский персонаж - это потенциальный японский персонаж. Однако обратное неверно. Кроме того, существует ряд соглашений, которые можно использовать для проверки наличия текста блока на одном языке или на другом.

  1. Упрощения - если проверяемый вами символ является КНР Упрощение , такое как 门, доступно только на основном китайском языке.
  2. Кана - если символ является одним из многих символов японского кана , таких как あ い う え お, то текстовый блок, с которым вы работаете определенно японский.

Проблема возникает с большим количеством общих символов и слов. Однако, если бы мне нужно было быстрое и грязное решение этой проблемы, я бы проверил все свои блоки текста на кана - если текст содержит кана, то я знаю, что это японский. Если вам нужно также различить корейский язык, я бы проверил на хангыль. Кроме того, если вам необходимо определить тип китайского языка, лучше всего подойдет тестирование на упрощение.

6
ответ дан 10 December 2019 в 02:53
поделиться

Процесс разработки Юникода включал в себя объединение Хань. Это потому, что многие японские иероглифы происходят от китайских иероглифов или совпадают с ними; аналогично с корейским. Есть некоторые символы (катакана и хирагана - см. глава 12 стандарта Unicode v5.1.0), обычно используемые на японском языке, которые указывают, что текст был японским, а не китайским, но я считаю, что это будет статистический тест, а не окончательный.

Посмотрите книгу О'Рейли по CJKV Information Processing (CJKV - сокращение от китайского, японского, корейского, вьетнамского; у меня где-то скрывается предшественник CJK). Есть также книга О'Рейли о Unicode Explained , которая может быть некоторой помощью, хотя, вероятно, не для этого вопроса (я не

2
ответ дан 10 December 2019 в 02:53
поделиться

Вы, вероятно, не можете сделать это надежно. Японский использует много тех же символов, что и китайский. Я думаю, что лучшее, что вы могли бы сделать, это посмотреть на блок текста. Если вы видите уникальные японские символы, то можете предположить, что весь блок - японский. Если нет, то это, вероятно, китайский.

Однако я просто учу китайский, поэтому я не эксперт.

тогда вы можете предположить, что весь блок японский. Если нет, то это, вероятно, китайский.

Однако я просто учу китайский, поэтому я не эксперт.

тогда вы можете предположить, что весь блок японский. Если нет, то это, вероятно, китайский.

Однако я просто учу китайский, поэтому я не эксперт.

1
ответ дан 10 December 2019 в 02:53
поделиться

тестирование символов в диапазонах катакана или хирагана должно быть очень надежным средством определения, является ли текст японским или нет, особенно если вы имеете дело с «обычным» текстом, сгенерированным пользователем. если вы просматриваете юридические документы или другие более официальные тарифы, это может быть немного сложнее, так как будет гораздо больше преимуществ со сложными китайскими иероглифами - но все равно это должно быть довольно надежно.

0
ответ дан 10 December 2019 в 02:53
поделиться

Обходной путь - проверить кодировку перед ее преобразованием в Unicode.

0
ответ дан 10 December 2019 в 02:53
поделиться
Другие вопросы по тегам:

Похожие вопросы: