В оболочке вы можете анализировать HTML , используя:
hxselect
из html-xml-utils
package vim
/ ex
(который может легко перепрыгнуть между html-тегами ), например: удаление метки стиля с помощью внутреннего кода: $ curl -s http://example.com/ | ex -s +'/
grep
, например: извлечение внешнего html файла H1: $ curl -s http://example.com/ | grep -o '.*
'
Example Domain
извлечение тела: $ curl -s http://example.com/ | tr '\n' ' ' | grep -o '.*'
Example Domain
...
-
html2text
для простого синтаксического анализа текста: например, таблицы синтаксического анализа : $ html2text foo.txt | column -ts'|'
- с использованием
xpath
(XML::XPath
perl-модуля), см. здесь пример - perl или Python (см. пример @Gilles )
- для разбора нескольких файлов одновременно, см. Как разбирать сотню html файлы исходного кода в оболочке?
Связанный (почему вы не должны использовать регулярное выражение):
1
задан Lex Debash 27 February 2019 в 11:24
поделиться
Вы делаете эту ссылку self
сильной, попробуйте в этом
guard let self = self else { return }
Попытайтесь просто использовать self?
и проверьте, есть ли еще утечка памяти, эта статья удивительно объясняет многое, я рекомендую вам взглянуть на это