Как подсчитать количество предложений, слов и символов в файле?

Question

Как подсчитать количество предложений, слов и символов в файле?

Я написал следующий код для токенизации входного абзаца, который поступает из файла samp.txt. Может ли кто-нибудь помочь мне найти и распечатать количество предложений, слов и символов в файле? Для этого я использовал NLTK в python.

>>>import nltk.data
>>>import nltk.tokenize
>>>f=open('samp.txt')
>>>raw=f.read()
>>>tokenized_sentences=nltk.sent_tokenize(raw)
>>>for each_sentence in tokenized_sentences:
...   words=nltk.tokenize.word_tokenize(each_sentence)
...   print each_sentence   #prints tokenized sentences from samp.txt
>>>tokenized_words=nltk.word_tokenize(raw)
>>>for each_word in tokenized_words:
...   words=nltk.tokenize.word_tokenize(each_word)
...   print each_words      #prints tokenized words from samp.txt

7

python nltk

задан aks 22 February 2011 в 05:54

0 ответов

Другие вопросы по тегам:

python nltk

Как подсчитать количество предложений, слов и символов в файле?

0 ответов

Похожие вопросы: