Что делает хорошую тестовую строку для тестирования веб-форм для unicode совместимости?

Вариант ответа @Primusa без использования обновления:

from collections import Counter

words = ["tree", "bone", "indigo", "developer"]
counts = Counter(c for word in words for c in set(word.lower()) if c.isalpha())

Вывод

Counter({'e': 3, 'o': 3, 'r': 2, 'd': 2, 'n': 2, 'p': 1, 'i': 1, 'b': 1, 'v': 1, 'g': 1, 'l': 1, 't': 1})

В основном преобразует каждое слово в набор, а затем выполняет итерацию по каждому множество.

16
задан Yi Jiang 25 June 2012 в 15:04
поделиться

4 ответа

Ваше представление о HTML-чувствительных символах - хорошее начало. Мне также нравится использовать символы, которые можно читать, но которые все еще являются Unicode. Когда я проводил подобное тестирование для tabblo.com, я использовал эту строку:

Testing «ταБЬℓσ»: 1<2 & 4+1>3, now 20% off!

В ней есть HTML-чувствительные символы, ASCII, верхняя половина символов ISO и многобайтовые символы Unicode.

21
ответ дан 30 November 2019 в 16:19
поделиться

Ну, это немного грубый подход, но если вы хотите начать с какого-то хорошо сформированного Юникода и добавить некоторые ошибки, здесь есть большой ресурс для реальных вещей: http: // www. unicode.org/charts.

2
ответ дан 30 November 2019 в 16:19
поделиться

Тестирование в Турции!

http://www.moserware.com/2008/02/does-your-code-pass-turkey-test.html

Это действительно красиво расширенное тестирование интернационализации, не для слабонервных, включая форматирование даты, вычисление процентов, перевод в верхний / нижний регистр и т. д.

11
ответ дан 30 November 2019 в 16:19
поделиться

Эти смайлы с SuperUser.com тоже неплохо подходят для тестирования поддержки юникода ...

https://superuser.com/questions/52671/how-do-i- create-unicode-smilies-like

٩ (-̮̮̃-̃) ۶ ٩ (● ̮̮̃ • ̃) ۶ ٩ (͡ ๏ ̯͡ ๏) ۶ ٩ (-̮̮̃ • ̃).

7
ответ дан 30 November 2019 в 16:19
поделиться
Другие вопросы по тегам:

Похожие вопросы: