IRC - многое помогает мне; Особенно играть в такие мелочи, как игры, где самые быстрые получают очки. Вы также можете попробовать «typepeed» в Linux. Если вам действительно нужно больше скорости, и вы думаете, что освоили технику, вы также можете рассмотреть возможность использования раскладки клавиатуры Dvorak ; Это поможет вам быстро печатать, но вам действительно нужно адаптироваться к нему.
Пакет HTML Agility Pack анализирует html, а не xhtml, и это довольно снисходительно. Модель объекта будет вам знакома, если вы использовали XmlDocument
.
В зависимости от конкретных потребностей вы можете использовать HTML Tidy для очистки документа, а затем импортировать его с помощью объекта XMLDocument.
Возможно, вы захотите проверить ответ на этот вопрос .
В основном, где-то между портом beautifulsoup .NET и пакетом гибкости HTML есть способ.
Маловероятно, что вы сможете создать XmlDocument с таким уровнем искаженной структуры. XmlDocument (насколько мне известно) требует, чтобы содержимое xml соответствовало правильному синтаксису вложенности и закрытия.
Однако вы подозреваете, что вместо этого можете проанализировать это с помощью XmlReader. Он по-прежнему может генерировать исключения, если встречаются некоторые вопиющие ошибки, но, согласно документам MSDN, он может, по крайней мере, раскрыть местонахождение ошибок.
Если вы просто имеете дело с HTML, есть HTML Agility Пакет , который может пригодиться вам.
То, что вы пытаетесь сделать, очень сложно. HTML нельзя анализировать с помощью анализатора XML, поскольку XML является строгим, а HTML - нет. Если бы этот HTML был совместим с XHTML (HTML как XML), то синтаксический анализатор XML без проблем анализировал бы HTML.
Если вы действительно хотите использовать XML, вы можете проверить, существуют ли какие-либо преобразователи HTML в XHTML. синтаксический анализатор для HTML.
Другими словами, я еще не встречал синтаксического анализатора XML, который обрабатывает искаженный XML ... они не предназначены для приема свободной разметки, такой как HTML (тоже по уважительной причине :))
Невозможно загрузить искаженный XML в XmlDocument
.
Ознакомьтесь с Html Agility Pack на CodePlex