Быстрый способ отфильтровать недопустимый xml unicode символы в Python?

Question

Быстрый способ отфильтровать недопустимый xml unicode символы в Python?

Если я вас правильно понял, вы хотите нажать кнопку, и она запустит запрос, а затем выведет имена серверов в поле со списком. Простой.

Вам нужно перебрать имена и добавить их в список со списком Item, а не в список SelectedItem.

$comboBox1.Items.Clear()
$1 = Get-ADComputer -Filter * -SearchBase "OU=Servers, OU=Computer, DC=example, DC=com" -Properties Name | select name
Foreach($name in $1) {
    $comboBox1.Items.Add($Name.name)
}

Не забудьте очистить ComboBox перед его запуском, в противном случае вы получите дублирующиеся записи.

РЕДАКТИРОВАТЬ:

Чтобы запустить mstsc.exe с выбранным кодом, вставьте его в функцию кнопки.

mstsc.exe /v:$($comboBox1.SelectedItem)

27

unicode xml python

задан davidism 9 May 2016 в 15:46

2 ответа

Вы также можете использовать метод перевода Unicode для удаления выбранных кодовых точек. Тем не менее, ваше отображение довольно большое (2128 кодовых точек), и это может сделать его намного медленнее, чем просто с помощью регулярного выражения:

ranges = [(0, 8), (0xb, 0x1f), (0x7f, 0x84), (0x86, 0x9f), (0xd800, 0xdfff), (0xfdd0, 0xfddf), (0xfffe, 0xffff)]
# fromkeys creates  the wanted (codepoint -> None) mapping
nukemap = dict.fromkeys(r for start, end in ranges for r in range(start, end+1))
clean = dirty.translate(nukemap)

3

ответ дан u0b34a0f6ae 28 November 2019 в 05:50

Другие вопросы по тегам:

unicode xml python

Похожие вопросы:

score 18 · Accepted Answer

Недавно мы (сопровождающие Trac XmlRpcPlugin ) были уведомлены о том факте, что приведенное выше регулярное выражение удаляет суррогатные пары в узких сборках Python (см. th: комментарий: 13: ticket: 11050 ]). Альтернативный подход заключается в использовании следующего регулярного выражения (см. th: changeset: 13729 ).

_illegal_unichrs = [(0x00, 0x08), (0x0B, 0x0C), (0x0E, 0x1F), 
                        (0x7F, 0x84), (0x86, 0x9F), 
                        (0xFDD0, 0xFDDF), (0xFFFE, 0xFFFF)] 
if sys.maxunicode >= 0x10000:  # not narrow build 
        _illegal_unichrs.extend([(0x1FFFE, 0x1FFFF), (0x2FFFE, 0x2FFFF), 
                                 (0x3FFFE, 0x3FFFF), (0x4FFFE, 0x4FFFF), 
                                 (0x5FFFE, 0x5FFFF), (0x6FFFE, 0x6FFFF), 
                                 (0x7FFFE, 0x7FFFF), (0x8FFFE, 0x8FFFF), 
                                 (0x9FFFE, 0x9FFFF), (0xAFFFE, 0xAFFFF), 
                                 (0xBFFFE, 0xBFFFF), (0xCFFFE, 0xCFFFF), 
                                 (0xDFFFE, 0xDFFFF), (0xEFFFE, 0xEFFFF), 
                                 (0xFFFFE, 0xFFFFF), (0x10FFFE, 0x10FFFF)]) 

_illegal_ranges = ["%s-%s" % (unichr(low), unichr(high)) 
                   for (low, high) in _illegal_unichrs] 
_illegal_xml_chars_RE = re.compile(u'[%s]' % u''.join(_illegal_ranges))

p.s. См. этот пост о суррогатах , объясняющий, для чего они нужны.

Обновление , чтобы не соответствовать (заменить) 0x0D, который является действительным XML характер .