Игнорирование ошибок XML в Python

Хорошо, я изменяю свой ответ, чтобы вы могли лучше понять, если вы хотите играть сверху с позицией (сверху / справа / снизу / слева), вы должны указать:

position:relative;

или [118 ]

position: absolute;

в зависимости от ваших потребностей,

Я не знаю, опубликовали ли вы свой полный код, но вы должны попробовать этот код:

.contact{
    position: relative;
    top: 70px;
    left: 300px;
    width: 50%;
}

.contact2{
    position: absolute;
    top: 70px;
    left: 300px;
    width: 50%;
}

.contact3{
    padding-top: 70px;
    padding-left: 300px;
    width: 50%;
}

.contact4{
    margin-top: 70px;
    margin-left: 300px;
    width: 50%;
}
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <meta http-equiv="X-UA-Compatible" content="ie=edge">
    <title>Document</title>
    <link rel="stylesheet" href="style.css">
</head>
<body>
    <div class="contact" >
        <br>
        <p > Voor andere vragen kan u ons contacteren op: </p>
        <br>
        <br>
        <br>
        <br>
    
        <a href="mailto: XXX">  XXX  </a>
    </div>
</body>
</html>

вы можете либо переключить свой класс на

contact2, contact3, or contact4 to try it out,

Это должно быть хорошо

6
задан edef 30 December 2008 в 10:48
поделиться

3 ответа

Существует библиотека под названием BeautifulSoup, я думаю, что это - то, что Вы ищете. Поскольку Вы пытаетесь проанализировать недопустимый XML, нормальный синтаксический анализатор XML не будет работать. BeautifulSoup более терпим к сбою, он может все еще извлечь информацию из недопустимого XML.

Красивый Суп является синтаксическим анализатором HTML/XML Python, разработанным для быстрых оборотных проектов как анализ экранных данных. Три функции делают это мощным:

  1. Красивый Суп не будет дросселировать, если Вы дадите ему плохо разметку. Это приводит к дереву синтаксического анализа, которое имеет приблизительно столько же смысла сколько Ваш оригинал документа. Это обычно достаточно хорошо для сбора данных, в которых Вы нуждаетесь и убегаете.
  2. Красивый Суп обеспечивает несколько простых методов и идиом Pythonic для навигации, поиска и изменения дерева синтаксического анализа: инструментарий для разделения документа и извлечения, в чем Вы нуждаетесь. Вы не должны создавать пользовательский синтаксический анализатор для каждого приложения.
  3. Красивый Суп автоматически преобразовывает входящие документы Unicode и исходящие документы UTF-8. Вы не должны думать о кодировке, если документ не указывает кодирование, и Красивый Суп не может автоматически обнаружить тот. Затем просто необходимо указать исходное кодирование.

Красивый Суп анализирует что-либо, что Вы даете ему, и делает материал обхода дерева для Вас. Можно сказать, что это "Находит, что все ссылки", или "Находят, что все ссылки класса externalLink", или "Находят все ссылки, URL которых соответствуют "foo.com", или "Находят заголовок таблицы, это имеет полужирный текст, затем дайте мне тот текст".

12
ответ дан 8 December 2019 в 16:12
поделиться

Посмотрите, например, extracting-text-from-html-file-using-python для предложений относительно путей к парсингу HTML в Python.

0
ответ дан 8 December 2019 в 16:12
поделиться

Нужно отметить, что, в то время как HTML похож на XML, это не XML. XHTML является формой XML HTML.

3
ответ дан 8 December 2019 в 16:12
поделиться
Другие вопросы по тегам:

Похожие вопросы: