Если у Вас есть только простые страницы HTML, как Вы сказали, это может быть открыто с Word.
Иначе существуют некоторые библиотеки, которые могут сделать это, но у меня нет опыта с ними.
Моя последняя идея состоит в том, что при использовании ASP.NET попытайтесь добавить application/msword
к заголовку, и можно сохранить его как документ Word (это не будет реальный документ в формате Word, только HTML, переименованный к документу, чтобы быть в состоянии открыться).
Другой вариант:
tr -d -C X <infile | wc -c
где X - это символ или строка символов, которые вы хотите подсчитать, а infile - входной файл.
Альтернатива grep:
sed 's/[^x]//g' filename | tr -d '\012' | wc -c
, где x
- символ, который вы хотите посчитать.
Также есть awk:
$ echo -e "hello world\nbye all" | awk -Fl '{c += NF - 1} END {print c}'
5
Измените -Fl
на -F <ваш персонаж>
.
Это работает путем установки разделителя полей к символу, указанному в -F
, затем суммируя количество полей в каждой строке - 1 (потому что, если есть один разделитель, есть два поля - но мы должны считать только 1).
попробуйте с
grep [PATTERN] -o [FILE] | wc -l
и, пожалуйста, не используйте cat, если он не нужен.