Использование применяется для наложения скользящего среднего на каждую группу,
df['rolling_mean'] = df.groupby('Name').Values.apply(lambda x: x.rolling(3).mean())
df
Name Values rolling_mean
0 A 1 NaN
1 A 2 NaN
2 A 3 2.000000
3 B 1 NaN
4 B 2 NaN
5 C 3 NaN
6 A 2 2.333333
7 A 6 3.666667
8 B 8 3.666667
9 B 3 4.333333
10 D 0 NaN
Работа от 5-го примера.
à является ASCII № 195 (C3). ¼, ASCII № 188 (до н.э).
Я предположил бы, что Müller предназначен, чтобы быть Müller.
Если это - UTF-8, основанный на http://en.wikipedia.org/wiki/UTF-8#Description
У нас есть C3 BC = 1100 0011 1011 1100
Применение отображения UTF-8:
(110) 00011 (10) 11 1100
0000 0000 1111 1100
00FC, который является Unicode ü
U+00FC (см. http://en.wikipedia.org/wiki/Latin_characters_in_Unicode),
Кажется мне, что Вы могли работать через это программно.
Теперь решая первый пример:
Jiå™ã был на самом деле JiÅ™¦-(Последний символ, не показанный).
Игнорирование Ji, который корректен,
C5 99 c3 AD
(110) 0 0101 (10) 01 1001 (110) 0 0011 (10) 10 1101
0159 00ED
ří
Таким образом, имя: Jiří. Википедия говорит, что специальный r является чешским и я - также. Кроме того, если я google Jiří (http://www.google.com/search?q=Ji%C5%99%C3%AD&ie=utf-8&oe=utf-8), я получаю много хитов. Мы находимся на победителе здесь.
Второй пример, Torbjörn, отображается приятно на Torbjörn, который звучит убедительным.
По моему скромному мнению, нет никакой большой потребности в человеческой проверке их, они, кажется, просто работают.
Офис Почты России сделал это. Кто-либо сохранял образ, прежде чем он исчез?
В основном необходимо ввести его по абсолютному адресу через libiconv, преобразовав его в UTF8.
Полный список соответствующих наборов символов собирается зависеть от Вашего приложения, но можно высказать некоторые предположения на основе кода страны. Запустите с этой страницы на Википедию.
Предупреждение: Вам будет нужен человек для проверки каждого преобразования.
В дополнение к комментариям Richard: если веб-страница, содержащая форму, указывает набор символов (например, iso-8859-1 == unicode) и кодирующий (например, utf-8) затем, совместимый стандартами браузер должен отправить данные формы с помощью того набора символов и кодирования. Если Ваши веб-страницы указали unicode, то Вы, should't должны справиться со случайными кодовыми страницами Microsoft в данных - это должен все быть unicode.