Удалить теги HTML в sed или подобном

Я пытаюсь получить содержимое таблицы с веб-страницы. Мне просто нужно содержимое, но не теги . Мне даже не нужны "tr" или "td", просто содержание. например:

<td> I want only this </td>
<tr> and also this </tr>
<TABLE> only texts/numbers in between tags and not the tags. </TABLE>

также я хотел бы поместить такой вывод первого столбца в новый файл csv column1, info1, info2, info3 coumn2, info1, info2, info3

Я пытался использовать sed для удаления шаблонов , но когда я извлекаю таблицу, есть и другие теги, такие как и т. Д., Поэтому Я хочу удалить все теги; короче все с <и>.

10
задан Brian Tompsett - 汤莱恩 12 August 2015 в 21:28
поделиться