Я могу восстановить международные символы, по ошибке сохраненные в varchar поле?

Использование применяется для наложения скользящего среднего на каждую группу,

df['rolling_mean'] = df.groupby('Name').Values.apply(lambda x: x.rolling(3).mean())

    df  

  Name  Values  rolling_mean
0   A   1   NaN
1   A   2   NaN
2   A   3   2.000000
3   B   1   NaN
4   B   2   NaN
5   C   3   NaN
6   A   2   2.333333
7   A   6   3.666667
8   B   8   3.666667
9   B   3   4.333333
10  D   0   NaN
5
задан Chris 28 October 2008 в 21:47
поделиться

4 ответа

Работа от 5-го примера.

à является ASCII № 195 (C3). ¼, ASCII № 188 (до н.э).

Я предположил бы, что Müller предназначен, чтобы быть Müller.

Если это - UTF-8, основанный на http://en.wikipedia.org/wiki/UTF-8#Description

У нас есть C3 BC = 1100 0011 1011 1100

Применение отображения UTF-8:

(110) 00011 (10) 11 1100

0000 0000 1111 1100

00FC, который является Unicode ü

U+00FC (см. http://en.wikipedia.org/wiki/Latin_characters_in_Unicode),

Кажется мне, что Вы могли работать через это программно.

Теперь решая первый пример:

Jiå™ã был на самом деле JiÅ™¦-(Последний символ, не показанный).

Игнорирование Ji, который корректен,

C5 99 c3 AD

(110) 0 0101 (10) 01 1001 (110) 0 0011 (10) 10 1101

0159 00ED

ří

Таким образом, имя: Jiří. Википедия говорит, что специальный r является чешским и я - также. Кроме того, если я google Jiří (http://www.google.com/search?q=Ji%C5%99%C3%AD&ie=utf-8&oe=utf-8), я получаю много хитов. Мы находимся на победителе здесь.

Второй пример, Torbjörn, отображается приятно на Torbjörn, который звучит убедительным.

По моему скромному мнению, нет никакой большой потребности в человеческой проверке их, они, кажется, просто работают.

6
ответ дан 14 December 2019 в 09:04
поделиться

Офис Почты России сделал это. Кто-либо сохранял образ, прежде чем он исчез?

http://forums.thedailywtf.com/forums/p/7156/133456.aspx

1
ответ дан 14 December 2019 в 09:04
поделиться

В основном необходимо ввести его по абсолютному адресу через libiconv, преобразовав его в UTF8.

Полный список соответствующих наборов символов собирается зависеть от Вашего приложения, но можно высказать некоторые предположения на основе кода страны. Запустите с этой страницы на Википедию.

Предупреждение: Вам будет нужен человек для проверки каждого преобразования.

0
ответ дан 14 December 2019 в 09:04
поделиться

В дополнение к комментариям Richard: если веб-страница, содержащая форму, указывает набор символов (например, iso-8859-1 == unicode) и кодирующий (например, utf-8) затем, совместимый стандартами браузер должен отправить данные формы с помощью того набора символов и кодирования. Если Ваши веб-страницы указали unicode, то Вы, should't должны справиться со случайными кодовыми страницами Microsoft в данных - это должен все быть unicode.

0
ответ дан 14 December 2019 в 09:04
поделиться
Другие вопросы по тегам:

Похожие вопросы: