Разбор документа с помощью BeautifulSoup без анализа содержимого тегов

Question

Разбор документа с помощью BeautifulSoup без анализа содержимого тегов


   
   
   
   
      
         
          Я пишу приложение для блога с Django. Я хочу разрешить авторам комментариев использовать некоторые теги (например,   ,  a  и так далее), но отключить все остальные. 


 Кроме того, я хочу разрешить им добавлять код в тегах , и их анализируют пигменты. 


 Например, кто-то может написать этот комментарий: 

I like this article, but the third code example <em>could have been simpler</em>:

<code lang="c">
#include <stdbool.h>
#include <stdio.h>

int main()
{
    printf("Hello World\n");
}
</code>


 Проблема в том, что когда я анализирую комментарий с помощью BeautifulSoup, чтобы удалить запрещенные теги HTML, он также анализирует внутреннюю часть блоки  и обрабатывают  и , как если бы они были тегами HTML. 


 Как я могу сказать BeautifulSoup, чтобы он не анализировал блоки ? Может быть, есть другие парсеры HTML, которые лучше подходят для этой работы? 
         

         
            10

         
         
            python html django beautifulsoup pygments         
         
         
            задан Marcelo Cantos            24 October 2010 в 08:03 
         
         
         поделиться
      

   

  

      
    

    
   
   
      0 ответов
      

      
         
                     
      

            
          Другие вопросы по тегам:          
         python html django beautifulsoup pygments       
        Похожие вопросы:

        
          
                          145 
 Скрытые возможности Python [закрыто] - 23 May 2017 12:34 
                            81 
 Лучшие способы учить новичка к программе? [закрытый] - 24 November 2011 00:03 
                            60 
 Как разбить список на куски одинакового размера? - 23 May 2017 11:55 
                            55 
 Почему бы не использовать таблицы для разметки в HTML? [закрыто] - 6 November 2018 00:07 
                            36 
 Как сделать div не больше его содержимого? - 20 September 2015 12:27 
                            36 
 Скрытые функции HTML - 23 May 2017 12:18 
                            35 
 Почему изучают Perl, Python, Ruby, если компания использует C++, C# или Java как язык приложения? [закрытый] - 20 May 2010 08:15